Методи філогенетичного аналізу

⇐ Предыдущая 1 2 34

Для філогенетичного аналізу застосовувалися різні підходи: кладистичні методи, що ґрунтуються на принципі економії (парсимонії), а також статистичні методи реконструкції філогенезу, що застосовують максимальну правдоподібність як критерій оптимальності та Байєсову методологію.

Аналіз філогенетичних відносин пісциколід (Utevsky, Trontelj, 2004) застосовував наступні методи. Вирівняні послідовності 12S рДНК і СОІ були проаналізовані як один комбінований набір даних. Перед об’єднанням послідовності обох генів були перевірені на гомогенність окремих наборів даних (Farris et al., 1995), щоб з’ясувати чи достовірно вони відрізняються за своїм філогенетичним сигналом. Той самий тест був застосований перед об’єднанням молекулярного і морфологічного наборів даних. Тест був застосований за допомогою PAUP* (Swofford, 2001). Перевіряли насичення (сатурацію) субституцій кожного гена, розмішуючи на графіку відсотки попарних відмінностей між послідовностями проти скоректованих попарних генетичних відстаней. Це було зроблено для всіх субституцій і для транзицій та трансверсій окремо, а також для всіх трьох позицій кодонів послідовності СОІ. Не було виявлено ознак насичення, окрім третьої позиції кодону послідовностей СОІ, де транзиції досягли плато. Третій тест, що був проведений перед філогенетичною реконструкцією був тест χ² на гомогенність у частотах основ. Якщо частоти основ істотно гетерогенні, то потрібна додаткова обробка даних при застосуванні моделей субституції (Lockhart et al., 1994).

Філогенетичний аналіз проводили, використовуючи критерії максимальної правдоподібності, Байєсова підходу та максимальної парсимонії. Перші дві методології використовують еволюційні моделі, тоді як остання не ґрунтується на моделях. Застосовуючи максимальну парсимонію, проводився аналіз одночасно морфологічних і молекулярних даних. Моделі, що варіювали від простої однопараметричної до найскладнішої загальної оборотної моделі, можна порівняти, аби з’ясувати, наскільки вони відповідають даним послідовностям. Використовувався ієрархічний тест (Huelsenbeck & Crandall, 1997) для того, щоб перевірити альтернативні моделі еволюції, використовуючи PAUP* і Modeltest (Posada & Crandall 1998).

Застосовувалася Байєсова методологія (Rannala & Yang, 1996), аби знайти дерева з максимальною апостеріорною імовірністю. Як відомо, апостеріорну імовірність дерев неможливо визначити аналітично. Натомість, вона може бути приблизно оцінена шляхом відбору дерев з розподілу апостеріорних ймовірностей, використовуючи метод Монте-Карло, що застосовує Марківські ланцюги (Larget & Simon, 1999). З цієї вибірки можна побудувати консенсусне дерево, де апостеріорні ймовірності окремих клад вказуватимуть на ступінь їхньої підтримки (стабільності). Цей аналіз проводився за допомогою програми MrBayes, ver. 3.0b4 (Huelsenbeck & Ronquist 2001) з використанням алгоритму Метрополіса. Було одночасно запущено чотири Марківські ланцюги – три з них були «гарячі» (з параметром нагрівання за замовченням) і одна «холодна»; з них відбирали дерева. Після кожного кроку в ланцюгу відбувався обмін між двома випадковими ланцюгами. Метою цих перемикань між ланцюгами було більш ефективне дослідження простору дерев, аби уникнути потрапляння в локальний оптимум, де може опинитися окремий ланцюг (Huelsenbeck & Ronquist 2001). Була вибрана та сама модель субституції, що була отримана шляхом ієрархічного оцінювання, тобто шість параметрів субституції плюс певна доля інваріантних сайтів і γ-розподіл гетерогенності швидкостей субституції. Починаючи з випадкових дерев, ланцюги були запущені на 10⁶ генерацій, вибір робився кожні 100 генерацій. Початкові 6% дерев були відкинуті через те, що на початку пошук ще не вийшов на стаціонарну фазу. З 9400 дерев, що залишилися, були обчислені апостеріорні ймовірності для окремих клад на підставі частот їхньої зустрічальності.

У межах підходу, що використовує правдоподібність як критерій пошуку дерева, оцінювалася статистична підтримка головних клад за допомогою приблизно неупередженого тесту (AU) (Shimodaira, 2002). Оцінювалося отримане дерево і дерева, які утворювалися так, щоб певні клади були немонофілетичними (це можна зробити за допомогою відповідної опції програми PAUP*). Кожна клада перевірялася окремо за допомогою програми CONSEL (Shimodaira & Hasegawa 2001).

Виконуючи аналіз за критерієм максимальної ощадливості (парсимонії), було взято до уваги насичення (сатурацію) третьої позиції кодона послідовностей СОІ, а також нерівноцінність субституцій. Тому було проведено три незалежні пошуки з молекулярним набором даних: 1) всі заміни мали однакові ваги, до аналізу залучалися всі ознаки; 2) чотирикратна вага була надана трансверсіям, до аналізу залучалися всі ознаки; 3) треті позиції кодонів послідовностей СОІ виключалися, всі заміни мали однакові ваги. Проміжки (індели) розглядалися як пропущені ознаки. Аналіз за критерієм максимальної ощадливості (парсимонії) проводився з молекулярним набором даних, а також на комбінованому молекулярно-морфологічному наборі даних. У комбінованому наборі даних морфологічні ознаки зовнішньої групи (аутгрупи) були помічені як пропущені через брак гомології.

Аналізи з використанням критеріїв максимальної правдоподібності і максимальної ощадливості проводилися за допомогою програми PAUP*. Для кожного з аналізів був застосований евристичний алгоритм обміну гілок (TBR) з 10 повторами випадкових додавань таксонів. Непараметрична бутстреп-підтримка клад обчислювалася на підставі 500 псевдонаборів даних. Бутстрепінг дерева за критерієм максимальної правдоподібності проводився без обміну гілок через надзвичайно довгий час такого аналізу.

Для аналізу філогенетичних відносин понтобделін і інших хоботних п’явок (Utevsky et al., 2007) застосовувалися наступні філогенетичні методи. Окремі дослідження були виконані на трьох різних наборах даних: ядерному, мітохондріальному й ядерному плюс мітохондріальному oб’єднаному. Передбачався генетичний зв'язок всіх мітохондріальних генів, тому тільки ядерні й мітохондріальні дані були досліджені на потенційний конфлікт у філогенетичному сигналі. Замість виконання популярного але схильного до проблем тесту на інконгруентність (e.g. Yoder et al. 2001; Hipp et al. 2004; Ramirez, 2006), використалося менш формальне порівняння, засноване на зіставленні клад. У цьому підході (e.g. Ellison et al. 2006; Niehuis et al. 2006) виявлялися несумісні клади, високо підтримані одним, але не іншим набором даних. Щоб полегшити ідентифікацію таких клад, довірчі оцінки, отримані від цих двох наборів даних були нанесені на графік.

Філогенетична реконструкція вироблялася з використанням максимальної правдоподібності, Байесівського підходу й принципу економії (парсимонії). До пошуку дерева відбиралися оптимальні моделі молекулярної еволюції для використання в імовірнісних методах. Для цього застосовувалися Байесівскьий інформаційний критерій і критерій Akaike за допомогою програми Modelgenerator (http://bioinf.nuim.ie/software/modelgenerator/; Keane et al. 2006). Найкращою завжди була модель GTR з γ-розподіленою гетерогенністю й деякою часткою інваріантних сайтів. Параметри обраних моделей були оптимізовані під час досліджень. Аналіз, що використає максимальну правдоподібність (ML), виконувався за допомогою PHYML (Guindon й Gascuel, 2003). Байесівський аналіз – за допомогою MrBayes 3.1.2 (Huelsenbeck & Ronquist, 2001). Дослідження із застосуванням принципу парсимонії були виконані за допомогою Win-PAUP* 4b10 (Swofford, 2003). Використався метод галуження й обмеження (branch and bound) зі 100 циклами випадкового додавання таксонів.

У межах методу правдоподібності перевірялися альтернативні гіпотези у порівнянні з оптимальним деревом за допомогою приблизно неупередженого тесту (AU; Shimodaira, 2002), який здійснюється у програмі CONSEL (Shimodaira and Hasegawa 2001). Крім того, оцінювались апостеріорні імовірності цих гіпотез.

Щоб урахувати неоднакову ймовірність замін нуклеотидів, а також потенційну насиченість деяких позицій нуклеотидів, проводилися додаткові дослідження з доданням чотириразової ваги для трансверсій і подальшим переваженням. Підтримка гілок для «правдоподібних» і найбільш ощадливих дерев оцінювалися за допомогою 1000 непараметричних бутстреп-реплікацій.

Еволюція деяких екологічних і біогеографічних характеристик була оптимізована на Байесівськой топології на основі критерію парсимонії за допомогою пакета MESQUITE 1.05 (Maddison & Maddison 2006).

Для визначення систематичного статусу певних таксонів роду Hirudo і їхніх філогенетичних відносин (Trontelj, Utevsky, 2005) використовувалися наступні методи. Вирівняні послідовності ITS2, 12S рДНК і COI були проаналізовані філогенетичними методами як один комбінований набір даних. Перед тим, як об’єднати всі вирівняні послідовності в один набір даних, був проведений тест на гомогенність окремих наборів даних (тобто різних генів) за Farris et al., 2005, використовуючи програму PAUP* (Swofford, 2003). Цей тест дозволяє з’ясувати, чи відрізняються різні послідовності за своїми філогенетичними сигналами.

Реконструкція філогенезу проводилася з використанням трьох критеріїв оптимальності: максимальної правдоподібності, Байєсівської методології та максимальної ощадливості (парсимонії). Модель еволюції нуклеотидних послідовностей, яка в подальшому використовувалася для аналізу методами Байєсівського аналізу та максимальної правдоподібності, вибиралася за допомогою ієрархічного тестування правдоподібності, щоб перевірити альтернативні моделі еволюції. Вибір моделі здійснювався за допомогою програм PAUP* та Modeltest (Posada & Crandall, 1998).

Пошук дерева з максимальною правдоподібністю проводився за допомогою програми Win-PAUP*4b10 шляхом застосування 100 випадкових циклів додавання таксонів з подальшим застосуванням алгоритму розтину і возз’єднання (TBR).

Для пошуку дерева за Байєсівською методологією використовували програму MrBayes 3.0b4 (Huelsenbeck & Ronquist, 2001). Був застосований пошук за алгоритмом ланцюгів Маркова за методом Монте-Карло з чотирма ланцюгами і 2 х 10⁶ генераціями та відбором результатів кожні 100 генерацій. Перші 500 дерев було відкинуто, оскільки вони мали низькі значення правдоподібності. З решти 19 500 дерев було відібрано 1000 дерев і обчислено апостеріорні імовірності окремих клад на підставі їхніх частот зустрічальності.

Аналіз за критерієм максимальної ощадливості (парсимонії) виконували за допомогою програми Win-PAUP* 4b10, використовуючи алгоритм галуження і обмеження. Зважаючи на більшу імовірність транзицій і можливе насищення (сатурацію) третіх позицій кодонів гена СОІ були проведені додаткові аналізи з приданням подвійної ваги трансверсіям та виключенням третьої позиції кодонів СОІ, а також з двома цими модифікаціями разом.

Використовувався непараметричний бутстрепінг (1000 псевдонаборів даних), щоб отримати відносні міри філогенетичного сигналу, що підтримує окремі клади при аналізах за критеріями ощадливості і правдоподібності.

Застосовуючи методологію пошуку дерева з максимальною правдоподібністю, протестовано статистичну підтримку отриманих клад за допомогою приблизно неупередженого (АU) тесту, запропонованого Shimodaira (2002). Порівняли, використовуючи відповідні опції в PAUP*, дерево з найвищою правдоподібністю і дерево, перетворене таким чином, що певні клади, не є монофілетичними. Кожна клада була протестована окремо, використовуючи програму CONSEL (Shimodaira & Hasegava, 2001).

Філогенетичні відносини між окремими індивідуумами і популяціями медичних п’явок визначалися за допомогою байєсівської методології, використовуючи програму MrBayes 3.1.2. (Ronquist & Huelsenbeck, 2003). Дерева отримані з окремих наборів даних відрізнялися ступенем роздільної здатності, але не суперечили один одному в топології. Отже, наступний філогенетичниий аналіз був виконаний з використанням комбінованих мітохондріальних і ядерних послідовностей зі змішаними моделями і непов'язаними параметрами моделі. Були виконані два паралельні пошуки з чотирма ланцюгами, кожен з двома мільйонами генерацій, причому відбиралася кожна сота генерація. Після відкидання перших 25% з відібраних дерев остаточну топологію було отримано зо консенсусом 50-відсоткової більшості. Крім того, був проведений пошук оптимального дерева за критерієм максимальної правдоподібності; евристичний пошук TBR проводили з використанням PhyML v3.0 (Guindon et. al, 2010) за моделлю субституції HKY85 + I + Gamma.

⇐ Предыдущая 1 2 34

Поделиться с друзьями:

Дата добавления: 2015-05-23; Просмотров: 1710; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.009 сек.