Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

InChI - International Chemical Identifier




1-2-3-2-1

2-3-4-3-2

2-3-4-3-2

1-2-2-2-1

1) 2) 3) 4) 5) 6)

CANGEN алгоритм (CANonically GENerated)

Существуют некоторые отличия алгоритма CANGEN от алгоритма Моргана:

Алгоритм Моргана рассматривает сумму близлежащих связей, CANGEN кроме этого, учитывает также порядок связей, атомы, заряды и количество присоединенных атомов водорода Н.

Рассмотрим пошагово принцип нумерации согласно алгоритму CANGEN.

Шаг 1. Введение атомных инвариантов.

К атомным инвариантам относятся:

1) число соединений у атома,

2) число связей с тяжелыми атомами,

3) атомный номер,

4) знак заряда,

5) значение заряда по модулю,

6) количество атомов водорода.

Группа инварианты номер

-СН2- 2 2 6 0 0 2 20306002

-СН3 1 1 6 0 0 3 10106003

3 4 6 0 0 0 30406000

1 2 8 0 0 0 10208000

1 1 8 1 1 0 10108110

3 4 7 2 1 0 30407210

1 2 8 0 0 0 10208000

Шаг 2. Присваивают номера по ранжированию.

Рассмотрим на примере н-пентана:

СН3СН2СН2СН2СН3

-СН3 10106003 → 1

-СН2- 20306002 → 2

Таким образом молекула пентана сначала преобразуется в вид:

10106003-20206002-20206002-20206002-1016003.

Далее присваиваем номера по рангу:

Шаг 3. Суммирование всех соседних номеров.

Проводим суммирование всех соседних номеров и «молекула» преобразуется в вид:

1-2-2-2-1

 

Проводим ранжирование. Номер два стал наименьшим – ему присваиваем значение 1, номеру 3 присваиваем значение 2 и номеру 4 - 3:

 

Если структура симметрична, получаем конечную нумерацию:

1-3-5-4-2

Рассмотрим принцип нумерации согласно алгоритму CANGEN.

На примере еще одного соединения:

6-амино-2-этил-5-(аминоэтил)-1-гексанол

Присваиваем каждому атому свой номер согласно инвариантам:

СН3 10106003

N 10107002

О 10108001

СН2 20206002

СН 30306001

И далее ранжируя, получаем окончательную нумерацию атомов в молекуле.

h t93oQAC/oZuhzoF1HIdpS3ooqppVyPXCF8cQiPCa/yLMqATTpJVp6PKch9VZmvdWYFWJKT3sgbK2 0LxXeQaZt068gFQoCgwMjDa0sXPhJyU9jElD4489C5IS/dGC3NfT+TzPFRrzajEDI4w927GHWQ5Q DU2UDNtNGmZx71Gp/Hxyx6zLT7BVKbcp8xtYnQwYBdT8NLZ51sY2Rv3+uax/AQAA//8DAFBLAwQU AAYACAAAACEAZlO4aeIAAAALAQAADwAAAGRycy9kb3ducmV2LnhtbEyPQU+EMBCF7yb+h2ZMvBi3 gLjsImWzMW6yJl4WjedCRyBLp6QtC/5760mPk/flvW+K3aIHdkHrekMC4lUEDKkxqqdWwMf74X4D zHlJSg6GUMA3OtiV11eFzJWZ6YSXyrcslJDLpYDO+zHn3DUdaulWZkQK2ZexWvpw2pYrK+dQrgee RNGaa9lTWOjkiM8dNudq0gKq+eT3n8cknR5fNue346s9bO9qIW5vlv0TMI+L/4PhVz+oQxmcajOR cmwQkCVZGlABSRytgQUiS+MMWC3gIYm3wMuC//+h/AEAAP//AwBQSwECLQAUAAYACAAAACEAtoM4 kv4AAADhAQAAEwAAAAAAAAAAAAAAAAAAAAAAW0NvbnRlbnRfVHlwZXNdLnhtbFBLAQItABQABgAI AAAAIQA4/SH/1gAAAJQBAAALAAAAAAAAAAAAAAAAAC8BAABfcmVscy8ucmVsc1BLAQItABQABgAI AAAAIQC7+9JNTgIAAKQEAAAOAAAAAAAAAAAAAAAAAC4CAABkcnMvZTJvRG9jLnhtbFBLAQItABQA BgAIAAAAIQBmU7hp4gAAAAsBAAAPAAAAAAAAAAAAAAAAAKgEAABkcnMvZG93bnJldi54bWxQSwUG AAAAAAQABADzAAAAtwUAAAAA " fillcolor="#c00000"/>

 

Благодаря наличию различных форм записи соединений для компьютерного анализа, как в виде линейных нотаций, так и в табличном виде существуют проблемы в иденификакии структур. Речь идет от том, что различные поисковые системы используют разные способы записи молекул.. Так одно соединение, например дизамещенный тринитротолуол запишем в виде Smiles, MDL MOL и в виде таблиц связей.

 

Получилось, что в зависимости от кодировки необходимо различное количество бит информации.

Smiles: 62 bytes

O=[N+]([O-])c1c(c(c(c(c1C)[N+](=O)[O-])C(C)(C)C)[N+](=O)[O-])C

MDL MOL: 2066 bytes

Таблица связей: 998 bytes

Также в различных поисковых системах одно и то же соединение имеет свои (разный) персональный номер и соответственно может иметь неодинаковую форму записи в линейном виде.

Гуанидин

CAS Registry Number: 73-10-5 c1([nH]c(c2c(n1)[nH]cn2)=O)N

Beilstein Registry Number: 9680 O=C1C2=C(NC=N2)N=C(N)N1

Gmelin Registry Number: 431879 O=C1NC(N)=NC2=C1N=CN2

MDL number: MFCDO0071533 [nH]1c(nc2c(c1=O)nc[nH]2)N

InChI=1/C5H5N5O/c6-5-9-3-2(4(11)10-5)7-1-8-3/h1H,(H4,6,7,8,9,10,11)

Из-за существования таких разногласий в линейном написании молекул ИЮПАК решил предложить новую систему записи на основе определенных требований к описанию молекул.

Формальные требования к описанию

¨ Разные изомерные структуры должны быть записаны по разному

¨ Разные представления (резонансные структуры, таутомеры) одно и того же соединения должны быть записаны одинаково

с1ccccc1 С1=СС=СС=С1

[O-][n+]1ccccc1 O=n1ccccc1

[nH]1cccc1 Cn1cccc1

Oс1ncccc1 O=c1[nH]cccc1

O=CNC=CC=C1

 

CC1=C([O-])OC(C)=[N+]1C
CC1=C([O-])[O+]=C(C)N1C
CC1=[N+](C)[C-](C)OC1=O
C[C-]([N+](C)=C(C)O1)C1=0

InChI=1/C6H9NO2/c1-4-6(8)9-5(2)7(4)3/h1-3H3

 

Код InChI принят ИЮПАК в 2006 г в качестве стандарта с открытым кодом. Стандартная общественная лицензия ограниченного применения GNU.

Код InChI – идентификатор химических структур для кодирования молекулярной структуры для поиска информации в базах данных и интернете

InChI код был разработан для компьютерного поиска, а не для понимания человеком




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 926; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.