Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Сравнение представлений




1 2 3 4 5

Таким образом, получаем:

Нумерацию атомов заканчиваем, когда каждому атому присвоен индивидуальный номер.

· При записи InChI связи обозначаются , вне зависимости от кратности связи, разветвления обозначаются скобками ()

InChI=1/C4H9Cl/c1-3-4(2)5/h4H,3H2,1-2H3

Пример нумерации для фенилаланина

C9H11NO2 1 2 3
 
 
 
 

 

InChI=1/C9H11NO2/c10-8(9(11)12)6-7-4-2-1-3-5-7/h1-5,8H,6,10H2,(H,11,12)

 
 
 
 

Запись расположения атомов водорода обозначается отдельно, после указания связей и разветвлений.

· Атомы водорода записываются в следующем порядке:

Сначала пишется /h, затем номера (colors) атомов с одним водородом затем буква H, затем номера (colors) атомов с двумя водородами, затем H2, потом номера (colors) атомов с тремя водородами, и H3.

Так, для 2-хлорбутана:

InChI=1/C4H9Cl/c1-3-4(2)5/h4H,3H2,1-2H3

· Обозначение таутомеров

После того как произведена нумерация атомов в молекуле, записаны брутто-формула, связи, положения водородов, записываются положения таутомерных водородов.

InChI=1/C5H5N5O/c6-5-9-3-2(4(11)10-5)7-1-8-3/h1H,(H4,6,7,8,9,10,11)
Таутомерные
Не таутомерные

/h1H,(H4,6,7,8,9,10,11)

· Слой зарядов

Запись зарядов начинаются с буквы q для отрицательных зарядов, с буквы p для положительных зарядов.

Однако записывается не распределение зарядов в молекуле, а только общий заряд молекулы.

InChI=1/C3H9S/c1-4(2)3/h1-3H3/p+1

InChI=1/BF4/c2-1(3,4)5/q-1

InChI=1/CH5NO/c2-1-3/h3H,1-2H2/p+2

· Запись изотопов

Запись изотопов проводят аналогично записи зарядов, начиная с буквы i

1, iso_weight(1),

2, iso_weight(2),

n, iso_weight(n)

Так, для 2-хлорбутана, имеющего изотопный атом углерода:

InChI=1/C4H9Cl/c1-3-4(2)5/h4H,3H2,1-2H3/i2+1,3+2,5+2

· Запись стереохимии

1) сначала рассматривают двойные связи типа >X = Y< и кумулены типа >W = X = Y = Z<

Префикс b, положение cis отмечают -, trans отмечают +

trans InChI=1/C4H6BrCl/c1-3(5)4(2)6/h1-2H3/b4-3+

cis InChI=1/C4H6BrCl/c1-3(5)4(2)6/h1-2H3/b4-3-

InChI=1/C6H6BrCl/c1-5(7)3-4-6(2)8/h1-2H3/b6-5+

InChI=1/C5H3Br2Cl/c1-4(6)2-3-5(7)8/h1H3/b5-4+

2) Далее записывают sp3 гибридизованные атомы и кумуллены типа >X=Y=Z<

Префиксом t со знаком ± обозначают конфигурацию: S отмечают -, R отмечают +.

Префиксом s обозначается абсолютная конфигурация (1), относительная (2), рацемат (3)

InChI=1/C3H7NO2/c1-2(4)3(5)6/h2H,4H2,1H3,(H,5,6)/t2-/m0/s1

 

InChI=1/C3H7NO2/c1-2(4)3(5)6/h2H,4H2,1H3,(H,5,6)/t2+/m0/s1

InChI=1/C5H6BrCl/c1-4(6)3-5(2)7/h1-2H3/t3-/m0/s1

InChI=1/C4H3Br2Cl/c1-3(5)2-4(6)7/h1H3/t2-/m0/s1

InChI=1/C4H3Br2Cl/c1-3(5)2-4(6)7/h1H3/t2-/m1/s1

· Слой фиксированных Н

Слой необходим для того чтобы выделить конкретный таутомер.

В общем виде запись будет выглядеть следующим образом:

InChI=1/C3H5NO/c1-2-5-3-4-1/h3H,1-2H2/p+1

Для разных таутомеров записи кода InChI будут отличаться:

InChI=1/C3H5NO/c1-2-5-3-4-1/h3H,1-2H2/p+1/fC3H6NO/h5H/q+1

 

InChI=1/C3H5NO/c1-2-5-3-4-1/h3H,1-2H2/p+1/fC3H6NO/h4H/q+1

 

· Нековалентносвязанные атомы

Запись кода InChI для нековалентносвязанных атомов будет следующая:

InChI=1/2C5H5.Fe/c2*1-2-4-5-3-1;/h2*1-5H;/q2*-1;+2

А для Такого, соединения, имеющего связи с комплексообразователем:

InChI=1/2C5H5.Fe/c2*1-2-4-5-3-1;/h2*1-5H;/q2*-1;+2

/rC10H10Fe/c1-2-4-5-3(1)11(1,2,4,5)6-7(11)9(11)10(11)8(6)11/h1-10H

InChIKey – ключ для поиска структуры

Код InChI для такого сложного соединения, как

Выглядит довольно громоздко:

InChI=1/C17H19NO3/c1-18-7-6-17-10-3-5-13(20)16(17)21-15-12(19)4-2-9(14(15)17)8-11(10)18/h2-5,10-11,13,16,19-20H,6-8H2,1H3/t10-,11-,13-,

16-,17-/m0/s1

А в формате InChIKey для той же самой структуры:

BQJCRHHNABKAKU-XKUOQXLYSA-N

Преобразование записи InChI в формат InChIKey возможен с помощью Secure Hash Algorithm 2 — алгоритма криптографического хеширования.

Вообще хеш-функции предназначены для создания «отпечатков» или «дайджестов» сообщений произвольной битовой длины. И применяются в различных приложениях или компонентах, связанных с защитой информации.

Хеширование (иногда х э ширование, hashing) — преобразование входного массива данных произвольной длины в выходную битовую строку фиксированной длины.

Исходное сообщение после дополнения разбивается на блоки, каждый блок — на 8 слов.

Алгоритм пропускает каждый блок сообщения через цикл с 64-мя или 80-ю итерациями (раундами).

На каждой итерации 2 слова из восьми преобразуются, функцию преобразования задают остальные слова.

Результаты обработки каждого блока складываются, сумма является значением хеш-функции.

InChIKey содержит 25 знаков.

Первые 14 знаков кодирует молекулярный скелет, следующие 8 знаков – другие слои.


 

Блок молекулярного скелета
Блок стереохимии, изотопов, зарядов
Знак S –стандартный InChIKey
Знак числа протонов (N –нейтральный характер M для -1 водород, O для +1 водород и т.д.)
Знак А – версия 1 B – версия 2
InChIKey= BQJCRHHNABKAKU-XKUOQXLYSA-N


 

Примеры кодирования в формате InChIKey:

Заряд Протоны Заряд Протоны
N      
M -1 O +1
L -2 P +2
K -3 Q +3
J -4 R +4
I -5 S +5
H -6 T +6
G -7 U +7
F -8 V +8
E -9 W +9
D -10 X +10
C -11 Y +11
B -12 Z +12
A < -12 или > +12    

 

IUPAC International Chemical Identifier (InChI) Program
Version 1, Software version 1.01

Website

http://www.iupac.org/inchi/

Программа с открытым

кодом. Стандартная

общественная лицензия

ограниченного применения

GNU

InChI Software Version 1.02 – final, implemented for Standard InChI/ InChIKey, January 2009

Веб-конвертор

http://www.inchi.info/software_en.html

 




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 709; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.035 сек.