КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Особенности обработки и визуализации данных метаболомики
Анализ баланса потоков Флуксомика Fluksomika - одно из направлений метаболомики, изучает изменения в метаболических путях. Метаболическая сеть
Документ «Математическое моделирование метаболических путей» Результаты масс-спектрометрического анализа метаболома представляют собой файлы с набором данных. Один файл с данными ЖХ-МС анализа является коллекцией последовательно записанных гистограмм, каждая из которых, представляет наборы сигналов от ионизированных молекул на детекторе за небольшой промежуток времени. Гистограмма состоит из набора m/z (молекулярная масса/заряд иона) значений и интенсивности соответствующих сигналов. Основная цель обработки данных состоит в преобразовании исходных данных в файлы в таком представлении, которое облегчает доступ к характеристикам каждого наблюдаемого иона. Эти характеристики включают m/z, время удерживания иона и интенсивность сигнала в каждый момент времени. В процессе обработки данных может быть извлечена дополнительная информация об изотопном расщеплении иона. Различные производители приборов используют различные форматы данных, предварительным шагом для обработки данных в программном обеспечении является преобразование таких специфичных форматов в общий формат, например: netCDF или mzXML. Затем непосредственно приступают к процессу обработки данных, как правило, включающему несколько этапов: фильтрацию шума, обнаружение пиков соответствующих ионам метаболитов, выравнивание ионных хроматограмм и нормализацию спектров. Далее проводят статистический сравнительный анализ обработанных данных разных групп образцов. Рисунок 3. Алгоритм обработки масс-спектрометрических метаболомных данных. Преобразованные в удобный для работы формат данные подвергаются процедуре фильтрации шумовых сигналов для снижения вероятности 53 ложноположительного обнаружения. Фильтрация и сглаживание сигнала чаще всего проводятся с помощью определения базовой линии отсечения интенсивности и минимального значения отношения сигнал/шум. Эти параметры используются для выделения из полученных данных сигналов, соответствующих измеренным ионам. Существуют и другие алгоритмы поведения фильтрации сигнала, например, сопоставление формы МС-пиков (а точнее коэффициентов функции, описывающей форму данного пика) с теоретически предсказанной на основе Гауссовых функций формой пика. Для дальнейшего обнаружения сигналов, соответствующих ионам, чаще всего используются автоматизированные алгоритмы, однако в отдельных случаях все еще требуется предварительная настройка параметров выявления идентификаций. Для того, чтобы объединить или соотнести предварительно обработанные результаты анализа в различных образцах на следующем этапе обработки данных проводят выравнивание времени удерживания веществ в хроматограмме и нормализацию сигналов в спектре. Одним из самых важных этапов для анализа наборов метаболомных данных является процедура выравнивания сдвигов по времени удерживания веществ. Такая процедура сопряжена с определенными техническими трудностями. Тем не менее, разработано множество алгоритмов выравнивания спектров по этому параметру. В данных, полученных с помощью хромато-масс- спектрометрического метода анализа, изменение времени удерживания веществ является нелинейным, поэтому для коррекции этого параметра были разработаны сложные многоступенчатые методы. Существует три основных метода проведения выравнивания спектров - корреляционный метод и методы параметрического и динамического смещения времени удерживания. Корреляционный метод выравнивания времени удерживания веществ (COW), это метод, в процессе применения которого, хроматограмма делится на множество частей и проводится отдельная коррекция этого параметра в каждом сегменте. Деление хроматограммы на множество сегментов приводит к повышению точности коррекции времени удерживания, однако возникает риск деления 54 интересующего пика не отдельные сегменты. Другой способ коррекции времени удерживания веществ - метод параметрического сдвига. Метод параметрического сдвига позволяет выровнять все хроматограммы относительно одной, выбранной за опорную. В качестве эталона для коррекции выбираются пики точно известных соединений в опорной хроматограмме и, по возможности, пики внутренних стандартов (предварительно добавленные в анализируемую смесь вещества с точно известной массой и временем выхода). Такой метод позволяет быстро скорректировать время удерживания веществ. Недостатки метода в основном сопряжены с возможным физико-химическим взаимодействием внутреннего стандарта с компонентами анализируемой смеси. Еще один метод коррекции времени удерживания веществ - метод динамического смещения (DTW). В процессе применения метода DTW в спектрах автоматически определяются масс-спектрометрические сигналы в спектре, представленные в каждом наборе данных, и по ним проводится корректировка временных характеристик сигнала. Существуют несколько протоколов проведения динамической коррекции, оптимизированные для различных видов данных, что позволяет снизить возможность появлениях параметрических ошибок. Полученные МС-данные характеризуются не только временем удерживания ионов, но и значениями m/z, однако за счет влияния внешних факторов (таких как изменение температуры) происходит сдвиг точных значений детектируемого отношения m/z. Особенно это характерно для высокоточных приборов, таких как, используемые в нашей работе времяпролетные масс- спектрометры. Поэтому немаловажно кроме коррекции времени удерживания веществ в полученных спектрах провести уточнение получаемых значений отношения m/z детектируемых ионов. Некоторые приборы позволяют снизить влияние внешних факторов на детектируемые значения за счет дополнительной калибровки масс на стандартное вещество непосредственно во время проведения анализа. Также можно провести калибровку значений m/z уже после проведения анализа с использованием точных значений масс ионов, имеющихся в спектрах. Этапом обработки МС-данных, позволяющим исключить систематическую ошибку и позволяющим выявить истинные отличия между образцами, является нормализация полученных данных. Нормализация заключается в приведении значений интенсивностей сигналов анализируемых ионов в разных спектрах относительно постоянной величины. За постоянную величину принимают интегральную интенсивность сигнала одного или нескольких стандартных веществ, добавленных в пробу (внутренних стандартов), или общий ионный ток (суммарное значение интенсивностей детектированных ионов). В качестве внутреннего стандарта выбирают вещество, имеющие схожие с анализируемыми метаболитами физико-химические свойства и не взаимодействующее с компонентами пробы. Наиболее часто в качестве внутреннего стандарта в метаболомных исследованием выбирают изотопно-меченые метаболиты. Изотопно-меченые метаболиты проявляют те же свойства, что и исследуемые метаболиты и имеют равные шансы на деградацию в процессе пробоподготовки и анализа. Нормализация сигналов на интенсивность сигналов внутренних стандартов позволяет нивелировать возможное влияние изменений условий окружающей среды на полученные результаты и провести количественное сравнение содержания метаболита в разных пробах. Следующим этапом анализа масс-спектрометрических данных является поиск достоверных количественных отличий в спектрах двух или нескольких групп образцов. Такой поиск проводится на основании алгоритмов статистического анализа. Для сравнения количественного содержания вещества в пробах используют такой параметр, как интегральная интенсивность сигнала, соответствующего исследуемому иону. Повышение спроса на автоматизированные алгоритмы обработки данных привело к разработке ряда новых программных проектов. В настоящее время разработано множество программ, позволяющих обработать данные, существуют как свободно доступные, так и коммерческие проекты. Одно из различий между 56 коммерческим и бесплатным программным обеспечением можно определить как открытость методов реализации анализа. В свободно доступных программах параметры используемых алгоритмов могут быть откорректированы пользователем. Большинство алгоритмов включает в себя все этапы обработки данных, а также существуют программы, предназначенные для решения конкретных задач. Например, программа, находящаяся в свободном доступе, COMSPARI направлена на визуализацию результатов с целью улучшения поиска различий между парами образцов; другая программа MET-IDEA позволяет получить данные о значении ионной интенсивности для указанного иона/времени удержания; MZmine и XCMS позволяют провести фильтрацию шумовых сигналов, обнаружение пиков, выравнивание, нормализацию спектров и статистический анализ результатов в разных группах сравнения. Перечисленные программы позволяют провести обработку данных полученных как с помощью ГХ-МС, так и с помощью ЖХ-МС методов анализа.
Способы интерпретации полученных результатов
В результате обработки данных, полученных при анализе метаболома, получают список детектированных пиков и/или список достоверных отличий между разными группами данных. Каждому пику соответствует значение m/z иона вещества, причем точность полученного значения соответствует выбранному методу детекции. Все полученные данные необходимо сопоставить со значениями m/z метаболитов и провести идентификацию анализируемых веществ. В большинстве случаев этот этап обработки данных анализа автоматически включен в функции программы, выполняющей обработку данных, необходимо только выбрать метаболомную базу данных или создать свою базу данных, по которой будет проводиться поиск соответствий. Идентификация интересующих ионов проводится с помощью поиска соответствий полученных значений m/z с истинными значениями m/z ионов веществ в заданном интервале отклонений значения этой величины. Однако зачастую точности полученного значения m/z не достаточно для того, чтобы однозначно идентифицировать вещество, так как существует множество метаболитов со схожими значениями этого параметра. В таком случае используют метод получения спектров фрагментации вещества с использованием МС/МС анализа заданного иона. Полученные спектры фрагментации содержат информацию о массах фрагментов исходного иона и об относительной интенсивности сигнала фрагментов в спектре. Такие спектры точно характеризуют структуру вещества, поэтому подтверждение идентификации детектированного иона можно проводить на основании соответствия спектров фрагментации исследуемого вещества со спектром, полученным для стандартного вещества. Для интерпретации результатов, полученных с помощью качественной и количественной метаболомики, могут быть использованы универсальные биохимические базы данных. Такие базы данных могут предоставлять информацию о структуре идентифицированного вещества и его биологической функции.
Дата добавления: 2017-01-14; Просмотров: 745; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |