Andrzej Gecow Instytut Paleobiologii PAN gecowtwarda pan pl

Andrzej Gecow Instytut Paleobiologii PAN gecow@twarda. pan. pl Dlaczego 2 równoprawdopodobne warianty sygnału bywają złym wyborem Streszczenie Założenie o dwóch i to równoprawdopodobnych wariantach sygnału (s=2) jest wygodne i bardzo często stosowane np. : w sieciach Boolowskich, modelach Isinga lub szkieł spinowych, do opisu szerokiej gamy rzeczywistych systemów. Jednocześnie w sieciach Boolowskich często używa się dwóch wejść do wierzchołka (K=2), co razem daje wyjątkową stabilność nie spotykaną w pozostałych sytuacjach. W tym aspekcie omówię podstawowe wyniki ‘szkoły Kauffmana’ dotyczące rozprzestrzeniania się zaburzenia (damage spreading) w sieciach Boolowskich. Ponadto przedstawię moje argumenty (także symulacyjne) za stosowaniem s>2 i uproszczony algorytm do takich statystycznych badań. Rozważane będą sieci autonomiczne obliczane synchronicznie, różnych typów, w tym także scale-free. Seminarium DUZ Instytut Fizyki Politechniki Warszawskiej 22. 10. 2007

Dlaczego dwa równoprawdopodobne warianty sygnału bywają złym wyborem Andrzej Gecow Instytut Paleobiologii PAN gecow@twarda. pan. pl Seminarium DUZ Instytut Fizyki Politechniki Warszawskiej 22. 10. 2007

Sieć Boolowska = logiczna = Kauffmana opisana w JTB w 1969 Wierzchołek realizuje funkcję logiczną c: =f(a, b, . . . ) K zmiennych. Jedna logiczna wartość c wyprowadzana jest w k różnych kierunkach. c - stan wierzchołka a, b, c = 0 lub 1 cc a c k=3 (np. ) c: =f(a, b) b K=2 (np. ) k zmienne - jako stopień wierzchołka, Kauffman stosuje sieć ‘Random’ Erdos-Renyi zwykle const. Będziemy rozważać sieć autonomiczną, obliczaną synchronicznie. Dla sieci autonomicznych <k> = K Zakładamy jednakowe prawdopodobieństwo 0 i 1 czyli s=2.

Damage w sieci Boolowskiej Mamy 2 identyczne systemy. Jeden z nich zaburzamy małą zmianą (np. jeden stan). d = damage = Liczba wierzchołków o różnych stanach/N K K dt+1= 1 -((1 -dt) +(1 -(1 -dt) )/s) s=2 quenched model - normalny annealed model - Derrida & Pomeau 1986. Po każdym wyliczeniu nowego stanu pozostawiane są stany ale generowane nowe połączenia i funkcje. S. A. Kauffman, The Origins of Order: Self-Organization and Selection in Evolution. Oxford University Press, New York, 1993.

Sieci dla różnych K Tabela 5. 1 state cycle # state cycle Homeostatic Reachability among cycles length attractors stability after perturbation K=N 0. 5*2 N/2 N/e low high K>5 0. 5*2 BN ~Nf(PK) low high K=1 (π/2*N)1/2 expotential in N low high K=2 N 1/2 high low 1 -median # of states on state cycle 2 -# of state cycle attractors in one net, 3 -refers to tendency to return to same state cycle after change of 1 node state. 4 -# of other state cycles to which net flows from each state cycle after all possible change of 1 node state. K=N Dla N=200 atraktor ma 10 30 stanów. . . ; Każda zniana daje stan losowy. ‘Chaotic behavior in these Boolean networks shows up in 2 major ways: The lengths of state cycles and sensitivity to initial conditions. ’ K>5 P - internal homogenity in Boolean functions = <#1 lub #0 / 2 K > Tabela 5. 2: dla K od 1 do 7 kolejno: 0. 5, 0. 6875, 0. 6367, 0. 5982, 0. 5699, 0. 5497, 0. 5352 K=2 Phase transition from chaos to order. Percolation of frozen clusters. 5 do 15% zm. st. 1. el. system zmienia atraktor, 70% zamrożone. 3000 Dla N=10000 atraktor ma 100 stanów a przestrzeń stanów 10

Modyfikacje Sieci Kauffmana Wierzchołek realizuje funkcję logiczną c: =f(a, b, . . . ) K zmiennych. Jedna logiczna wartość c wyprowadzana jest w k różnych kierunków. a, b, c = 0 lub 1 => sygnały: a, b, c = 0. . (s-1) s=2, 4, 8, 16, . . . proponuję: ‘Kauffmana’ ale już nie Boolowska’ cc a c k=3 (np. ) c: =f(a, b) b K=2 (np. ) zwykle const. k jako stopień wierzchołka - różne typy sieci, nie tylko ‘Random’ Erdos-Renyi ale i scale-free, single-scale i inne. Ja stosuję też: (c, d): =f(a, b) (od 1975 r) ‘agregat automatów’ k = K = 2, 3, . . . (const. ) c d (c, d): =f(a, b) a b Nowość: Iguchi at al. JTB 247, pp 138 -151, (2007) użyli zmiennego K dla sieci scale-free

Ile średnio jest zmienionych sygnałów wyjściowych? współczynnik rozmnażania zmiany w = k (s-1)/s Tylko dla k=2, s=2 (w=1) zmiana nie rośnie. Dlatego typowe sieci Boolowskie są skrajne i dają inne zjawiska (szczególny porządek) niż zwykle (chaos). s - równoprawdopodobnych wariantów sygnału k - wyjść z wierzchołka zwykle inne niż stare sygnały wyjściowe wierzchołek przekształca: nowe sygnały wyj. : = f(nowe sygnały wej. ) jeżeli jeden sygnał wejściowy jest zmieniony

Damage spreading Dla sieci autonomicznych <k> = K współczynnik rozmnażania zmiany w = k (s-1)/s d : = dw - d 2 w/2 2 2 (s-1) d : = dw - d Dla K=2: dla sieci Kauffmana (s+1)s dla agr. aut. d = wt w = 1. 5 cc a c k=3 (np. ) b c: =f(a, b) K=2 (np. ) zwykle const.

s wpływa na dynamikę różnie dla różnych sieci cc a c k=3 (np. ) b c: =f(a, b) K=2 (np. ) zwykle const. < d > dla 600 000 d=w inicjacji t w = 1. 5

s wpływa na dynamikę Dlaczego należy badać s>2 różnie dla różnych sieci Tylko dla k=2, s=2 damage nie rośnie (w=1). 1. Taka typowa sieć Boolowska jest skrajna, leży w obszarze przejścia fazowego chaos/porządek, może dawać nadmierną stabilność, dla wszystkich innych k i s oczekujemy chaosu. cc a c k=3 (np. ) b c: =f(a, b) K=2 (np. ) zwykle const. < d > dla 600 000 inicjacji Do badania obszaru chaotycznego stosuje się K>2 ( lub podwyższone P) (internal homogenity) ale zawsze tylko s=2. Pokazałem, że 2. K>2 nie może zastąpić s>2 nawet gdy wsp. w jest ten sam, ponieważ daje to inne zachowanie różnych typów sieci:

Dlaczego powinno być s > 2 ? Tylko dla k=2, s=2 damage nie rośnie (w=1). 1. Ten przypadek jest wyjątkowy, może dawać porządek zamiast chaosu. 2. K>2 nie może zastąpić s>2 w badaniach zachowania sieci. 3. Teoria informacji Shannona : zip pliku jest zwykle mniejszy. (Komputer jako sieć Boolowska) 4. ‘Dobra’ alternatywa jest zwykle znacznie mniej prawdopodobna. (w systemach podlegających adaptacji) 3, 4 => Alternatywy zwykle nie są równoprawdopodobne. Ale my lubimy wygodne założenie o równym prawdopodobieństwie wariantów sygnału! => np. dla 1/4 i 3/4 możemy użyć s=4, jeden jest ‘dobry’ a reszta ‘zła’ => Bądźcie ostrożni modelując nie fizykę używając s=2 i modeli Isinga lub szkieł spinowych albo sieci Boolowskich. . .

Algorytm Mamy 2 identyczne systemy A i B. Jeden z nich np. B, zaburzamy małą zmianą (np. jeden stan). d = damage = Liczba wierzchołków o różnych stanach/N to wynik porównania A i B w kolejnych t po zaburzeniu Ja liczę tylko jeden system B i to tylko samą damage, ale statystycznie. Intuicja: W sieci bez sprzężeń zwrotnych można znaleźć taki stan sieci, że każdy wierzchołek ma stan (wyjście) odpowiadające jego wejściom. Podczas wzrostu sieć utrzymywana jest w zbliżonym stanie. Liczone są jedynie te wierzchołki, które mają zmieniony stan wejść, zakłada się, że brakujące (niezmienione) sygnały wejściowe są takie jak stare. To staranie jest zbędne, wystarczy, że: Wierzchołek do którego dotarła zmiana ma wynik losowy, który z określonym prawdopodobieństwem propaguje się dalej. Powtórne liczenie tych samych wierzchołków musi dać ten sam wynik statystyczny. Różnice: U mnie proces gaśnie gdy jest zbyt mało jeszcze nie liczonych, normalnie proces trwa w ustalonym statystycznie stanie.

Wygasanie realne i ‘pseudo’ Różnice: c k=3 (np. ) U mnie proces gaśnie gdy jest zbyt mało ‘jeszcze nieliczonych’, c c c: =f(a, b) normalnie proces trwa w ustalonym statystycznie stanie. K=2 (np. ) a b współczynnik rozmnażania zmiany zwykle const. Tu zakłada się 1 zmieniony sygn. wej. w = k (s-1)/s Dla K=2: Średnia nie wygasa d : = dw - d 2 w/2 dla sieci Kauffmana 2 (wygasanie rzeczywiste) 2 (s-1) d : = dw - d dla agr. aut. (s+1)s t d=w w = 1. 5

Wygasanie ‘pseudo’ Różnice: U mnie proces gaśnie gdy jest zbyt mało ‘jeszcze nieliczonych’, normalnie proces trwa w ustalonym statystycznie stanie. Tempo wzrostu damage w początkowym odcinku o małej statystyce w środowisku o silnie zróżnicowanym k (i przez to w) jest silnie zróżnicowane.

Rozkłady < d > dla 600 000 inicjacji wygasania

67 Rozkłady wygasania

Algorytm i przyczyny różnic w zachowaniu się sieci Mamy 2 identyczne systemy A i B. Jeden z nich np. B, zaburzamy małą zmianą (np. jeden stan). d = damage = Liczba wierzchołków o różnych stanach/N to wynik porównania A i B w kolejnych t po zaburzeniu Ja liczę tylko jeden system B i to tylko samą damage, ale statystycznie. < d > dla 600 000 inicjacji