КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Представление 3D структур
M END 17. 2 7 1 6 0 0 0 16. 1 6 1 0 0 0 0 15. 1 5 1 1 0 0 0 14. 1 4 1 0 0 0 0 13. 2 3 2 0 0 0 0 12. 1 2 1 0 0 0 0 H 0 0 0 0 0 0 0 0 0 0 0 0 H 0 0 0 0 0 0 0 0 0 0 0 0 O 0 0 0 0 0 0 0 0 0 0 0 0 H 0 0 0 0 0 0 0 0 0 0 0 0 H 0 0 0 0 0 0 0 0 0 0 0 0 C 0 0 0 0 0 0 0 0 0 0 0 0 C 0 0 0 0 0 0 0 0 0 0 0 0 V2000 3. ISIS- 10031016312D NSC7594 acetaldehyde
Каждый мол-файл состоит из двух частей: строки параметров – так называемой «шапки», специфичной для мол-файлов (строки 1-3) и продолжающейся таблицы (строки 4-18), которые являются фундаментом для такого вида форматов. Первая строка «шапки» содержит информацию о названии молекулы. Если название по каким-либо причинам отсутствует, то эта строка остается незаполненной. Например, для этаналя указаны два названия: его идентификационный номер из NCI базы данных (NSC 7594) и обычное название соединения. Вторая строка имеет более строгий формат и содержит общую информацию о имени пользователя; программы, которая используется для получения данного файла, и о дате и времени, когда этот файл был создан. Информация о дате и времени формируется из ряда двухзначных значений, представляющих месяц (10 в приведенном примере), дату (03), год (10), час (16) и минуты (31) соответственно. Также указываются атомные координаты (2D или 3D). Третья строка «шапки» обычно остается пустой или содержит комментарии. Строки 4-18 образуют продолжающуюся таблицу, содержащую описание атомов, составляющих данное соединение, которые могут быть полностью или частично соединены связями. Такой набор атомов может представлять молекулу, фрагмент молекулы, субструктуры и т.д. В случае мол-файла блок продолжающейся таблицы описывает одну молекулу. Первая линия продолжающейся таблицы называется линия подсчета (расчета) и определяет из какого количества атомов построена данная молекула (7), какое количество связей имеется в данном соединении (6), является ли молекула хиральной (1- хиральна, 0 – нет) и т.д. Далее может идти перечисление каких-либо других свойств. Последняя позиция в этой строке указывает версию формата продолжающейся таблицы, используемого в данном файле. В приведенном примере это версия V2000. Также существует более новая расширенная версия V3000.
Все семь атомов, которые указаны в строке подсчета, описываются подробно в атомном блоке ( строки5-11). Каждый атом представлен в виде одного ряда, который определяет декартовы координаты, атомный символ, отклонение от атомной массы основного изотопа по сравнению с периодической таблицей, заряд, стереохимические особенности атома, число отдельно изображенных атомов водорода, нестандартная валентность и ряд других свойств. Декартовы координаты определяют модель молекулы (2D или 3D), как указано во второй строке файла. 2D модели могут быть получены, например, при помощи программы ISIS/DRAW. 3D структурные данные получаются в результате экспериментов или теоретических вычислений (например, программа CORINA). 3D координаты можно увидеть в третьей колонке атомного блока (z-координаты). Если эта колонка содержит только значения нуля, значит молфайл содержит только 2D координаты. После атомного блока идет блок связей ( строки12-17). Каждая линия этого блока определяет какие два атома связаны между собой, мультиплетность связи и стерео конфигурацию связи. Первая колонка указывает первый атом, вторая колонка – атом с которым связан первый атом, в третьей колонке указан тип связи (одинарная – 1, двойная – 2, тройная – 3), в четвертой – стереохимические особенности связи. Одинарная связь содержит значение 0, если нет стерео специфичности (обычная связь, в плоскости), 1 – над плоскостью, 2 – за плоскостью, 4 – вверх, 5 – направление неизвестно, 6 – вниз. Цис/транс или E/Z конфигурация двойной связи определяется x,y,z координатами атомного блока, если значение 0. Если указано значение 3, значит двойная связь либо цис, либо транс.
Последняя часть файла, представленного здесь, – это блок свойств, который может содержать разнообразные свойства. Однако, в большинстве случаев этот блок остается пустым, за исключением последней строки (строка 18). В качестве более сложного примера можно привести мол-файл фенилаланина.
phenylalanine -ISIS- 10030708132D Комментарии 12 12 0 0 0 0 0 0 0 0999 V2000 -0.7764 -2.3791 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 -0.7776 -3.2065 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 -0.0628 -3.6194 Табличные представления 3D структура молекулы тесно связана с большим разнообразием физических, химических и биологических свойств. 3D геометрия молекулы называется ее конформацией. Следует отметить, что существует иерархия в представлении химических соединений. Исходя из строения молекулы, можно узнать стереохимическую информацию, что приведет к конфигурации молекулы (более детальному описанию молекулы), которая затем переводится в соответствующую 3D структуру, т.е. единственную конформацию молекулы при рассмотрении или набор конформаций (рис. 2.89).
Рис. 2.89. От строения к конфигурации и затем к конформации (3D структуре) молекулы на примере 2R-бензилсукцината. В основном используются два различных метода для представления химической структуры в 3D пространстве. Оба метода используют различные координатные системы для описания пространственного расположения атомов молекул при их рассмотрении. Наиболее широкоиспользуемый способ – выбор декартовой системы координат, т.е. кодирование x -, y - и z - координат каждого атома. Для каждого атома декартовые координаты можно перечислить в одном ряду. Рис. 2-90 иллюстрирует этот метод на примере молекулы метана.
Рис. 2.90. Система декартовых координат и декартовые координаты метана.
Дата добавления: 2015-06-04; Просмотров: 1189; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |