Metody analizy zalenoci filogenetycznych Metoda UPGMA Unweighted Pair

  • Slides: 15
Download presentation
Metody analizy zależności filogenetycznych

Metody analizy zależności filogenetycznych

Metoda UPGMA (Unweighted Pair Group Method with Arthmatic Mean) Macierz odległości miedzy 6 OTU

Metoda UPGMA (Unweighted Pair Group Method with Arthmatic Mean) Macierz odległości miedzy 6 OTU Wybieramy parę o najmniejszej odległości, czyli A i B (różnią się dwiema substytucjami) 1 A B 1 Punkt rozgałęzienia sytuujemy w odległości równej d. AB/2, czyli 1 substytucja dij A B C D B 2 C 4 4 D 6 6 6 E 6 6 6 4 F 8 8 E 8

o o o Kalkulacja nowej macierzy odległości (traktujemy parę AB jako osobny OTU stanowiący

o o o Kalkulacja nowej macierzy odległości (traktujemy parę AB jako osobny OTU stanowiący całość): Drugi cykl : Znajdujemy nową parę o najmniejszej odległości (DE) dij AB C C 4 DE 6 6 F 8 8 DE dij AB C D C 4 D 6 6 E 6 6 4 F 8 8 8 2 E 8 D E 8 2

o Trzecia iteracja 1 A 1 B 1 dij AB, C DE DE 6

o Trzecia iteracja 1 A 1 B 1 dij AB, C DE DE 6 F 8 8 o Czwarta iteracja 1 A 1 2 dij C 1 1 2 ABC, DE 2 F 8 1 2 B C D E

o Ostatni krok-przyłączanie OTU F i ukorzenianie drzewa 1 A 1 1 2 2

o Ostatni krok-przyłączanie OTU F i ukorzenianie drzewa 1 A 1 1 2 2 1 2 ROOT B C D E 4 F Midpoint rooting – teoretyczny wspólny przodek powinien być równoodległy od wszystkich OTU, czyli ; d(ABCDE, F)/2 = 8/2 =4

Założenia i ograniczenia metody UPGMA Jednakowe tempo mutacji wzdłuż wszystkich gałęzi drzewa o Są

Założenia i ograniczenia metody UPGMA Jednakowe tempo mutacji wzdłuż wszystkich gałęzi drzewa o Są spełnione założenia „three point conditions”; Dla każdych trzech taksonów A, B, C prawdziwy jest warunek że: d. AC<=max(d. AB, d. BC) Analiza skupień działa dobrze tylko jeżeli dane są ultrameryczne o

Metoda NJ (Neighbor Joining) o OTU – operational taxonomic unit Pair of neighbors- para

Metoda NJ (Neighbor Joining) o OTU – operational taxonomic unit Pair of neighbors- para sąsiadów – dwie jednostki taksonomiczne połączone jednym wewnętrznym węzłem na nieukorzenionym bifurkacyjnym drzewie filogenetycznym 5 Para sąsiadów 1 4 o Względem węzła A 1, 2, 3 A Para sąsiadów względem węzła B C D 2 4 E B 6 F 3 8 7

Macierz odległości o o o N OTU = 6 A, B, C, D, E,

Macierz odległości o o o N OTU = 6 A, B, C, D, E, F Elementy macierzy (dij ) -odległości między OTU liczone jako liczba różnic między każda parą dopasowanych sekwencji (np. liczba substytucji zaobserwowanych między sekwencja A i B) Net divergence- r i– suma odległości miedzy OTU i-tym a wszystkimi pozostałymi OTU Kalkulacja nowej macierzy odległości wg formuły: dij A B C D E B 5 C 4 7 D 7 10 7 E 6 9 6 5 F 8 11 8 9 R(X) 30 42 32 38 34 8

Nowa macierz odległości Mij A B C D A E B -13 C -11.

Nowa macierz odległości Mij A B C D A E B -13 C -11. 5 D -10 -10. 5 E -10 -10. 5 -13 F E -10. 5 -11 B 1 wspólny węzeł -11. 5 Wybieramy 1 z dwóch par o minimalnej wartości Mij F D C Drzewko wyjściowestar tree

Dodawanie węzła U A E SAU U C D C 3 D 6 7

Dodawanie węzła U A E SAU U C D C 3 D 6 7 E 5 6 5 F 7 8 9 E 8 B Kalkulujemy odległości między węzłem U a pozostałymi OUTu F D C

Iteracja o o o powtórzenie całej procedury dla NOTU=N-1=5 i macierzy odległości ; U

Iteracja o o o powtórzenie całej procedury dla NOTU=N-1=5 i macierzy odległości ; U C D C 3 D 6 7 E 5 Liczymy r(X) i nową macierz Mij F 7 wyznaczamy parę OTU o minimalnej wartości Mij wstawiamy kolejny węzeł W 6 5 8 9 E 8

Metoda FM (Fitch-Margoliash) A A B C A - B 22 - - Algebraiczna

Metoda FM (Fitch-Margoliash) A A B C A - B 22 - - Algebraiczna kalkulacja długości gałęzi a+b=22 a+c=39 b+c=41 a=10 a b-=12 c C B C 39 41 b c=29

A A B - B 22 - C D E - - C 39

A A B - B 22 - C D E - - C 39 41 D 39 41 E 41 43 - 18 - 20 10 A B C DE A - B 22 - C 39 41 - DE 40 42 19 -

średnia odległość między D i ABC= 32. 7 =d+m, gdzie m=g+[(c+2 f+a+b)/2] D E

średnia odległość między D i ABC= 32. 7 =d+m, gdzie m=g+[(c+2 f+a+b)/2] D E ABC sr 10 - 32. 7 34. 7 - E i ABC = 34. 7 = e + m D E ABC sr - 10=d+e układ trzech równań z trzema niewiadomymi – wyliczamy m, d i e A C a f c (39+41+18)/3 g B (41+43+20)/3 d b e E D

SSQ suma kwadratów odchyleń Average percent standard deviation

SSQ suma kwadratów odchyleń Average percent standard deviation