Frequency distributions Frequency Frequency distribution Frequency summary display
Frequency distributions • Frequency (도수) – 하나의 범주에 속하는 측정값의 수 – 빈도 • Frequency distribution (도수분포) – Frequency summary의 display – Frequency의 나열 – table이나 graph로 보여줄 수 있다 – Both discrete and continuous variables (연속 변 수, 불연속 변수 모두에 적용)
Frequency distributions of discrete variables • 위의 자료를 table이나 graph로 나타낼 경우 자료를 쉽게 해석할 수 있다
Graphs of frequency distributions • Frequency distribution의 graphs – Bar graph: discrete variable (불연속 변수)일 경우, 각 bar 들이 서로 연결되어 있지 않음 ( 중간 값이 존재할 수 없으므로) – Histogram: continuous variable (연속 변수)일 경우, 각 bar 들이 서로 연결되어 있음
Frequency distributions of continuous variables (연속변수의 도수분포) • Random sample 된 송사리의 길이 (mm), 172 마리
Frequency distributions of continuous variables • Length는 continuous variable measured on a ratio scale • Discrete variables와는 달리 class (계급)의 범위를 정 해야 한다 • 17 – 18 mm into one class, and 19 – 20 mm into another, and so on • Class interval을 결정하는 것은 다소 자의적이다 • Sample size와 값의 range에 의해 주로 결정된다 • 너무 많은 class로 나누면 자료가 혼란스러워지고, class 수 가 너무 적을 경우 정보가 줄어들게 된다 • 여러 가지 class interval을 시도한 후 적절한 interval을 결 정 • Number of class = 1 + 3. 3 log n • 1 + 3. 3 log 172 = 1+ 7. 4 = 8. 4
Frequency distributions of continuous variables • Table로 자료가 잘 organized 되었으나 , visualize 하기는 쉽지 않다
Histograms and their interpretation • Histogram of the table 3. 4 • Discrete variable에서와는 달리 class 사이에 빈 공간이 없다 – Continuous variable 이라는 것 을 의미한다 • Histogram으로부터 distribution이 symmetric (대칭적)인지 skewed ( 비대칭적)인지 쉽게 알 수 있다 – 송사리의 length는 symmetric distribution을 보여준다 • Histogram은 또한 평균값과 값들의 분포를 보여준다
Histograms and their interpretation • Continuous variable의 frequency distribution 은 line graph로 나타내기도 한다 – Frequency polygon (도수다각형)이라고 부름 – Discrete variable은 line graph로 나타낼 수 없다
- Slides: 10