КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
ВВЕДЕНИЕ. Хемоинформатика - это научная дисциплина, возникшая за последние 40 лет в пограничной области между химией и вычислительной математикой
Хемоинформатика - это научная дисциплина, возникшая за последние 40 лет в пограничной области между химией и вычислительной математикой. Было осознано, что во многих областях химии огромный объем информации, накопленный в ходе химических исследований, может быть обработан и проанализирован только с помощью компьютеров. Более того, многие из проблем в химии настолько сложны, что для их решения требуются новые подходы, основанные на применении методов информатики. Исходя из этого, были разработаны методы для построения баз данных по химическим соединениям и реакциям, для прогнозирования физических, химических и биологических свойств соединений и материалов, для поиска новых лекарственных препаратов, анализа спектральной информации, для предсказания хода химических реакций и планирования органического синтеза. Современное понятие «химическая структура» весьма разноплановое и многоаспектное, однако графические плоские изображения молекул — их структурные формулы до сих пор остаются основным способом выражения информации о строении химических соединений. Именно эти «картинки» являются естественным языком химиков, именно с них начинается обсуждение тех или иных свойств конкретного вещества. По образному выражению академика Н.С. Зефирова, «структурная формула — это геном свойств химического соединения». Фактически это означает, что, имея в своем распоряжении адекватные способы параметризации двухмерной структурной формулы и методы извлечения содержащейся в ней информации, исследователь может получить до 90% сведений о свойствах изучаемого вещества. Традиционно используемая и по сей день классическая фрагментация структурных формул соединений по функциональным группам, кратным связям, циклам, ароматическим или конденсированным системам лежала в основе большинства ранних работ по исследованию соотношений «структура—биологическая активность». Она позволят выявлять умозрительные эмпирические закономерности типа: «соединения, содержащие короткие ненасыщенные цепи, более активны, чем подобные им насыщенные соединения»; «введение алкильных радикалов в положения 1 или 3 уменьшает длительность действия соединений и наделяет их возбуждающим действием» [4]. Формирование во второй половине XX века научного направления QSAR как самостоятельного раздела науки потребовало разработки унифицированных способов кодирования структурных формул соединений совокупностью подструктурных фрагментов, удобных для использования в задачах вычислительного прогноза биологических и небиологических свойств веществ. В хемоинформатике для внутреннего представления структур химических соединений обычно используются молекулярные графы, которые могут быть при необходимости дополнены информацией о трехмерных координатах атомов, а также о динамике их изменения во времени. Долговременное хранение химической информации и обмен ею между приложениями осуществляется при помощи файлов, организованных в соответствии с типами внешнего представления химической информации. Простейшим типом внешнего представления структур химических соединений являются линейные нотации в виде строки символов. Исторически первым видом линейных нотаций явилась Линейная нотация Висвессера (WLN). В настоящее время наиболее распространённой видом линейных нотаций являются строки SMILES. Кроме того, применяются также линейные нотации SLN (Sybyl Line Notation, Tripos, Inc.; содержит также возможность спецификации структур Маркуша), SMARTS (расширение SMILES для поисковых запросов к химическим базам данных), ROSDAL. Для унификации кодировки химических структур в 2005 году ИЮПАК принял универсальную линейную нотацию InChI и InChIKey. Второй тип внешнего представления структур химических соединений и реакций между ними основан на непосредственном кодировании матрицы смежности молекулярного графа. Такие распространённые форматы как MOL, SDF и RDF, которые в настоящее время являются общепринятыми стандартными для обмена химической информацией, можно считать способами представления в виде текстового файла матрицы смежности молекулярного графа. Этой же целью служат и специфические форматы MOL2, HIN, PCM и др., предназначенные для работы с распространёнными программами по молекулярному моделированию. Наконец, третий тип внешнего представления структур химических соединений основан на технологии XML. Наиболее распространённым языком описания химической информации, опирающимся на эти принципы, является CML.
Дата добавления: 2015-06-04; Просмотров: 1104; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |