КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
InChI - International Chemical Identifier
1-2-3-2-1 2-3-4-3-2 2-3-4-3-2 1-2-2-2-1 1) 2) 3) 4) 5) 6) CANGEN алгоритм (CANonically GENerated) Существуют некоторые отличия алгоритма CANGEN от алгоритма Моргана: Алгоритм Моргана рассматривает сумму близлежащих связей, CANGEN кроме этого, учитывает также порядок связей, атомы, заряды и количество присоединенных атомов водорода Н. Рассмотрим пошагово принцип нумерации согласно алгоритму CANGEN. Шаг 1. Введение атомных инвариантов. К атомным инвариантам относятся: 1) число соединений у атома, 2) число связей с тяжелыми атомами, 3) атомный номер, 4) знак заряда, 5) значение заряда по модулю, 6) количество атомов водорода. Группа инварианты номер -СН2- 2 2 6 0 0 2 20306002 -СН3 1 1 6 0 0 3 10106003 3 4 6 0 0 0 30406000 1 2 8 0 0 0 10208000 1 1 8 1 1 0 10108110 3 4 7 2 1 0 30407210 1 2 8 0 0 0 10208000 Шаг 2. Присваивают номера по ранжированию. Рассмотрим на примере н-пентана: СН3СН2СН2СН2СН3 -СН3 10106003 → 1 -СН2- 20306002 → 2 Таким образом молекула пентана сначала преобразуется в вид: 10106003-20206002-20206002-20206002-1016003. Далее присваиваем номера по рангу: Шаг 3. Суммирование всех соседних номеров. Проводим суммирование всех соседних номеров и «молекула» преобразуется в вид: 1-2-2-2-1
Проводим ранжирование. Номер два стал наименьшим – ему присваиваем значение 1, номеру 3 присваиваем значение 2 и номеру 4 - 3:
Если структура симметрична, получаем конечную нумерацию: 1-3-5-4-2 Рассмотрим принцип нумерации согласно алгоритму CANGEN. На примере еще одного соединения: 6-амино-2-этил-5-(аминоэтил)-1-гексанол Присваиваем каждому атому свой номер согласно инвариантам: СН3 10106003 N 10107002 О 10108001 СН2 20206002 СН 30306001 И далее ранжируя, получаем окончательную нумерацию атомов в молекуле. h t93oQAC/oZuhzoF1HIdpS3ooqppVyPXCF8cQiPCa/yLMqATTpJVp6PKch9VZmvdWYFWJKT3sgbK2 0LxXeQaZt068gFQoCgwMjDa0sXPhJyU9jElD4489C5IS/dGC3NfT+TzPFRrzajEDI4w927GHWQ5Q DU2UDNtNGmZx71Gp/Hxyx6zLT7BVKbcp8xtYnQwYBdT8NLZ51sY2Rv3+uax/AQAA//8DAFBLAwQU AAYACAAAACEAZlO4aeIAAAALAQAADwAAAGRycy9kb3ducmV2LnhtbEyPQU+EMBCF7yb+h2ZMvBi3 gLjsImWzMW6yJl4WjedCRyBLp6QtC/5760mPk/flvW+K3aIHdkHrekMC4lUEDKkxqqdWwMf74X4D zHlJSg6GUMA3OtiV11eFzJWZ6YSXyrcslJDLpYDO+zHn3DUdaulWZkQK2ZexWvpw2pYrK+dQrgee RNGaa9lTWOjkiM8dNudq0gKq+eT3n8cknR5fNue346s9bO9qIW5vlv0TMI+L/4PhVz+oQxmcajOR cmwQkCVZGlABSRytgQUiS+MMWC3gIYm3wMuC//+h/AEAAP//AwBQSwECLQAUAAYACAAAACEAtoM4 kv4AAADhAQAAEwAAAAAAAAAAAAAAAAAAAAAAW0NvbnRlbnRfVHlwZXNdLnhtbFBLAQItABQABgAI AAAAIQA4/SH/1gAAAJQBAAALAAAAAAAAAAAAAAAAAC8BAABfcmVscy8ucmVsc1BLAQItABQABgAI AAAAIQC7+9JNTgIAAKQEAAAOAAAAAAAAAAAAAAAAAC4CAABkcnMvZTJvRG9jLnhtbFBLAQItABQA BgAIAAAAIQBmU7hp4gAAAAsBAAAPAAAAAAAAAAAAAAAAAKgEAABkcnMvZG93bnJldi54bWxQSwUG AAAAAAQABADzAAAAtwUAAAAA " fillcolor="#c00000"/>
Благодаря наличию различных форм записи соединений для компьютерного анализа, как в виде линейных нотаций, так и в табличном виде существуют проблемы в иденификакии структур. Речь идет от том, что различные поисковые системы используют разные способы записи молекул.. Так одно соединение, например дизамещенный тринитротолуол запишем в виде Smiles, MDL MOL и в виде таблиц связей.
Получилось, что в зависимости от кодировки необходимо различное количество бит информации. Smiles: 62 bytes O=[N+]([O-])c1c(c(c(c(c1C)[N+](=O)[O-])C(C)(C)C)[N+](=O)[O-])C MDL MOL: 2066 bytes Таблица связей: 998 bytes Также в различных поисковых системах одно и то же соединение имеет свои (разный) персональный номер и соответственно может иметь неодинаковую форму записи в линейном виде. Гуанидин CAS Registry Number: 73-10-5 c1([nH]c(c2c(n1)[nH]cn2)=O)N Beilstein Registry Number: 9680 O=C1C2=C(NC=N2)N=C(N)N1 Gmelin Registry Number: 431879 O=C1NC(N)=NC2=C1N=CN2 MDL number: MFCDO0071533 [nH]1c(nc2c(c1=O)nc[nH]2)N InChI=1/C5H5N5O/c6-5-9-3-2(4(11)10-5)7-1-8-3/h1H,(H4,6,7,8,9,10,11) Из-за существования таких разногласий в линейном написании молекул ИЮПАК решил предложить новую систему записи на основе определенных требований к описанию молекул. Формальные требования к описанию ¨ Разные изомерные структуры должны быть записаны по разному ¨ Разные представления (резонансные структуры, таутомеры) одно и того же соединения должны быть записаны одинаково с1ccccc1 С1=СС=СС=С1 [O-][n+]1ccccc1 O=n1ccccc1 [nH]1cccc1 Cn1cccc1 Oс1ncccc1 O=c1[nH]cccc1 O=CNC=CC=C1
CC1=C([O-])OC(C)=[N+]1C InChI=1/C6H9NO2/c1-4-6(8)9-5(2)7(4)3/h1-3H3
Код InChI принят ИЮПАК в 2006 г в качестве стандарта с открытым кодом. Стандартная общественная лицензия ограниченного применения GNU. Код InChI – идентификатор химических структур для кодирования молекулярной структуры для поиска информации в базах данных и интернете InChI код был разработан для компьютерного поиска, а не для понимания человеком
Дата добавления: 2015-06-04; Просмотров: 926; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |