Zastosowanie algorytmw genetycznych do wyboru zestawu zmiennych wejciowych
Zastosowanie algorytmów genetycznych do wyboru zestawu zmiennych wejściowych w predykcji wartości indeksu giełdowego Marcin Jaruszewicz Jacek Mańdziuk
Plan prezentacji l l l l l Predykcja indeksu giełdowego Metody doboru danych Algorytm genetyczny Mutacja Selekcja Krzyżowanie Wyniki działania Wyniki predykcji Problem z procesem nauki
Predykcja indeksu giełdowego l l Dane wejściowe dla trzech giełd i dwóch kursów walut: wartości indeksu, średnie, oscylatory, formacje Przestrzeń ponad 400 zmiennych Prognoza zmiany wartości indeksu z zamknięcia na zamknięcie następnego dnia Problemy: duże sieci neuronowe, zmienność zależności, różnorodność zmiennych
Metody doboru danych l l l Macierz autokorelacji – współczynniki określające liniowe zależności między zmiennymi Nauka sieci neuronowej – wpływ zmiennych na predykcję po procesie nauki ‘maksymalnej’ sieci neuronowej Algorytm genetyczny – populacja zestawów zmiennych wejściowych
Algorytm genetyczny l Definicja chromosomu: l l l Zmienne wejściowe z puli dostępnych zmiennych Liczba warstw ukrytych sieci neuronowej Zmienny rozmiar chromosomu - kodowanie liczby zmiennych wejściowych od 2 do 5 (parametr) Wstępne ograniczenie liczby zmiennych za pomocą metody macierzy autokorelacji (od 10% do 20%) Populacja wyjściowa
Mutacja l l Zmianie podlega kodowanie zmiennych wejściowych Prawdopodobieństwo mutacji: 0. 05 Parametr określający liczbę zmian w jednym chromosomie w czasie jednej mutacji: 1 Nowa zmienna wybierana jest losowo z dostępnej puli
Selekcja l l Funkcja przystosowania na podstawie błędu po nauce sieci neuronowej kodowanej przez chromosom Wybór metodą rankingową l l Losowanie par chromosomów Wybór rodziców ze zwycięzców z dwóch sąsiednich par Dzieci zastępują przegranych Stały rozmiar populacji
Krzyżowanie l l Prawdopodobieństwo krzyżowania: 0. 9 Losowanie punktu podziału Wylosowany podział Rodzic 1 Dziecko 1 X X X Y Y Y X Rodzic 2 Y Y Dziecko 2 Możliwe podziały Y Y
Wyniki działania l Rozmiar populacji: 25 x 8 = 200, liczba iteracji 200 l l Target t > close change (%) Third t > close change (%) Fourth t > SO Rozmiar populacji: 25 x 8 = 200, liczba iteracji 400 l l l Rozmiar populacji: 50 x 8 = 400, liczba iteracji 200 l l Third t > SO Third t > close change (%) Rozmiar populacji: 50 x 8 = 400, liczba iteracji 400 Target t > type of struct shifted l Target t > close change (%) Third t > close change (%) l Target t-4 > 20 days change (%) Second t > WILLIAMS l Target t-5 > impet 20
Wyniki predykcji
Problem z procesem nauki
Problem z procesem nauki
Co dalej ? l l l Zwiększenie rozmiaru chromosomu Weryfikacja parametrów algorytmu genetycznego Weryfikacja parametrów nauki sieci neuronowych Doprowadzenie do klasycznego procesu nauki Zastosowanie metody walidacji
Dyskusja Dziękuję za uwagę!
- Slides: 14