Liniowe wspzalenoci pomidzy zmiennymi Korelacje regresja prosta Korelacje

  • Slides: 25
Download presentation
Liniowe współzależności pomiędzy zmiennymi Korelacje, regresja prosta

Liniowe współzależności pomiędzy zmiennymi Korelacje, regresja prosta

Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie

Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem matematycznym zależności pomiędzy dwoma zmiennymi

Analiza korelacji Metoda graficzna Do wykrycia zależności (korelacji) służą wykresy rozrzutu Wyniki układają się

Analiza korelacji Metoda graficzna Do wykrycia zależności (korelacji) służą wykresy rozrzutu Wyniki układają się wzdłuż linii Jest zależność! Wyniki układają się w rozmytą chmurę punktów Brak zależności!

Analiza korelacji Metoda graficzna Do wykrycia zależności (korelacji) służą wykresy rozrzutu Zależność wprosproporcjonalna Zależność

Analiza korelacji Metoda graficzna Do wykrycia zależności (korelacji) służą wykresy rozrzutu Zależność wprosproporcjonalna Zależność odwrotnie proporcjonalna

Analiza korelacji Współczynnik korelacji liniowej Pearsona • Między zmiennymi X i Y istnieje zależność

Analiza korelacji Współczynnik korelacji liniowej Pearsona • Między zmiennymi X i Y istnieje zależność liniowa, jeżeli najlepszym przybliżeniem obserwowanego związku jest linia prosta • obliczając r Pearsona mierzymy, jak blisko linii prostej najlepiej opisującej ich związek liniowy leżą punkty

Analiza korelacji Współczynnik korelacji liniowej Pearsona Właściwości: • r przyjmuje wartości z przedziału od

Analiza korelacji Współczynnik korelacji liniowej Pearsona Właściwości: • r przyjmuje wartości z przedziału od -1 do +1 • Znak r wskazuje, czy zależność jest wprostproporcjonalna (dodatni r) czy odwrotnie proporcjonalna (ujemny r) • Wielkość r wskazuje, jak blisko linii prostej znajdują się punkty • X i Y można zamieniać miejscami bez wpływu na wartość r • Korelacja między X i Y niekoniecznie oznacza związek przyczynowy

Analiza korelacji Współczynnik korelacji liniowej Pearsona r=1 r = -1 Idealna zależność liniowa wprostproporcjonalna

Analiza korelacji Współczynnik korelacji liniowej Pearsona r=1 r = -1 Idealna zależność liniowa wprostproporcjonalna Idealna zależność liniowa odwrotnie proporcjonalna

Analiza korelacji Współczynnik korelacji liniowej Pearsona r = 0, 90 Silna zależność liniowa wprostproporcjonalna

Analiza korelacji Współczynnik korelacji liniowej Pearsona r = 0, 90 Silna zależność liniowa wprostproporcjonalna r = -0, 90 Silna zależność liniowa odwrotnie proporcjonalna

Analiza korelacji Współczynnik korelacji liniowej Pearsona r=0 Brak zależności r = -0, 5 Umiarkowana

Analiza korelacji Współczynnik korelacji liniowej Pearsona r=0 Brak zależności r = -0, 5 Umiarkowana zależność liniowa odwrotnie proporcjonalna

Analiza korelacji Współczynnik korelacji liniowej Pearsona Na podstawie wartości r oceniamy siłę zależności: Ø

Analiza korelacji Współczynnik korelacji liniowej Pearsona Na podstawie wartości r oceniamy siłę zależności: Ø |r| = 0 zmienne nieskorelowane Ø 0 < |r| 0, 3 korelacja niska Ø 0, 3 < |r| 0, 5 korelacja przeciętna (średnia) Ø 0, 5 < |r| 0, 7 korelacja wysoka Ø 0, 7 < |r| 0, 9 korelacja bardzo wysoka Ø 0, 9 < |r| < 1 korelacja prawie pełna

WYMOGI Ø Normalność rozkładów zmiennych Ø Liniowość zależności

WYMOGI Ø Normalność rozkładów zmiennych Ø Liniowość zależności

KORELACJA LINIOWA PEARSONA R 2 – współczynnik determinacji: Ø wartość r Pearsona podniesiona do

KORELACJA LINIOWA PEARSONA R 2 – współczynnik determinacji: Ø wartość r Pearsona podniesiona do kwadratu Ø Wyraża proporcję wspólnej zmienności dwóch zmiennych (tzn. siłę lub wielkość powiązania).

KORELACJA LINIOWA PEARSONA Aby ocenić korelację pomiędzy zmiennymi należy znać: Ø wartość r (siła

KORELACJA LINIOWA PEARSONA Aby ocenić korelację pomiędzy zmiennymi należy znać: Ø wartość r (siła korelacji) Ø znak +/- przy r (zależność wprost/odwrotnie proporcjonalna) Ø poziom istotności p współczynnika r (określa, czy korelacje jest/nie jest statystycznie istotna)

KORELACJA LINIOWA PEARSONA Macierze korelacji: Ø tabela współczynników korelacji pomiędzy wieloma zmiennymi Ø jedna

KORELACJA LINIOWA PEARSONA Macierze korelacji: Ø tabela współczynników korelacji pomiędzy wieloma zmiennymi Ø jedna lista zmiennych -> kwadratowa macierz korelacji (każdy z każdym) Ø dwie listy zmiennych -> prostokątna macierz korelacji

REGRESJA LINIOWA Regresja liniowa jest rozszerzeniem korelacji liniowej i pozwala na: Ø graficzną prezentację

REGRESJA LINIOWA Regresja liniowa jest rozszerzeniem korelacji liniowej i pozwala na: Ø graficzną prezentację linii prostej dopasowanej do wykresu rozrzutu Ø określenie równania opisujące zależność dwóch zmiennych w postaci y = a * x + b zmienna zależna współczynnik kierunkowy prostej zmienna niezależna wyraz wolny

Wynik testu Analiza regresji liniowej Iloraz inteligencji

Wynik testu Analiza regresji liniowej Iloraz inteligencji

Analiza regresji liniowej Wynik testu y = a + b* x Iloraz inteligencji

Analiza regresji liniowej Wynik testu y = a + b* x Iloraz inteligencji

REGRESJA LINIOWA W jaki sposób wyznaczana jest linia regresji liniowej? Ø przez minimalizację sumy

REGRESJA LINIOWA W jaki sposób wyznaczana jest linia regresji liniowej? Ø przez minimalizację sumy kwadratów odchyleń punktów doświadczalnych od linii regresji

REGRESJA LINIOWA

REGRESJA LINIOWA

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA Zagrożenia wiarygodności wniosków: Ø problem obserwacji odstających Ø

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA Zagrożenia wiarygodności wniosków: Ø problem obserwacji odstających Ø inny kształt zależności

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA Obserwacje odstające: Ø wartości nietypowe, występujące rzadko Ø

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA Obserwacje odstające: Ø wartości nietypowe, występujące rzadko Ø punkty nie pokrywające się z rozkładem pozostałych danych Ø mogą odzwierciedlać rzeczywiste własności badanego zjawiska LUB być tylko anomalią, błędem pomiarowym

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA Obserwacje odstające: Ø mają duży wpływ na współczynnik

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA Obserwacje odstające: Ø mają duży wpływ na współczynnik kierunkowy linii regresji i w konsekwencji na wartość współczynnika korelacji Ø Nawet jedna obserwacja odstająca może poważnie zmienić współczynnik korelacji. sztucznie zwiększyć lub zmniejszyć jego wartość.

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA Obserwacje odstające- jak z nimi postępować? : Ø

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA Obserwacje odstające- jak z nimi postępować? : Ø wyklucza się obserwację, która wychodzi poza przedział obejmujący ± 2 odchylenia standardowe (lub nawet ± 1, 5 odchylenia standardowego) od wartości średniej Ø Zdefiniowanie tego, co uznajemy za obserwację odstającą, jest sprawą subiektywną i decyzję o identyfikacji odstających obserwacji musi badacz podejmować opierając się na swoim doświadczeniu oraz powszechnie akceptowanej praktyce w danej dziedzinie badań.

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA Obserwacje odstające- jak z nimi postępować? : Ø

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA Obserwacje odstające- jak z nimi postępować? : Ø przekształcenie log(x+1) Ø Ogranicza ono rozrzut zmiennych, eliminuje wpływ wartości dominujących, błędów pomiarowych

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA Kształt zależności: Ø Odstępstwa od liniowości spowodują wzrost

KORELACJA LINIOWA PEARSONA / REGRESJA LINIOWA Kształt zależności: Ø Odstępstwa od liniowości spowodują wzrost sumy kwadratów odchyleń od linii regresji, nawet jeśli reprezentują one prawdziwy i ścisły związek dwóch zmiennych Ø Analizowanie wykresów rozrzutu jest niezbędnym elementem analizy przy obliczaniu korelacji i regresji liniowej