아이리스 데이터 집합 (Iris Data Set) 데이터 탐색(Data Exploration) 데이터 탐색 설명을 위해 아이리스 데이터 집합을 활용 • UCI Machine Learning Repository: http: //archive. ics. uci. edu/ml/ 150개의 아이리스 꽃 • Setosa 50개 • Virginica 50개 • Versicolour 50개 Page 4 Data Mining & Practices by Yang-Sae Moon
요약 통계 (Summary Statistics) 데이터 탐색(Data Exploration) 요약 통계란 데이터의 특성을 요약하는 수치를 의미한다. (Summary statistics are numbers that summarizes properties of the data. ) 쉽게 생각할 수 있는 요약 통계로는 평균, 표준편차, 최대값 등이 있다. 대부분의 요약 통계는 데이터를 한번 읽음으로써 구할 수 있다. (Most summary statistics can be calculated in a single pass through the data. ) Page 6 Data Mining & Practices by Yang-Sae Moon
삼차원 히스토그램 예제 데이터 탐색(Data Exploration) Page 16 Data Mining & Practices by Yang-Sae Moon
시각화 기술: 상자 도표(Box Plots) 데이터 탐색(Data Exploration) 단일 속성 값의 분포를 상자(box)의 크기로 표현함 Page 17 Data Mining & Practices by Yang-Sae Moon
상자 도표 예제 데이터 탐색(Data Exploration) 여러 속성을 비교할 때 유용함 Page 18 Data Mining & Practices by Yang-Sae Moon
등고 도표 예제: 1998년 해수면 온도 Page 22 데이터 탐색(Data Exploration) Data Mining & Practices by Yang-Sae Moon
기타 시각화 기술들 데이터 탐색(Data Exploration) 표면 도표 (surface plots) Page 23 Data Mining & Practices by Yang-Sae Moon
기타 시각화 기술들 데이터 탐색(Data Exploration) 벡터장 도표 (vector field plots) Page 24 Data Mining & Practices by Yang-Sae Moon
기타 시각화 기술들 데이터 탐색(Data Exploration) 연관 행렬(correlation matrix) Page 25 Data Mining & Practices by Yang-Sae Moon
기타 시각화 기술들 데이터 탐색(Data Exploration) 평행 좌표 도표 (parallel coordinate plots) Page 26 Data Mining & Practices by Yang-Sae Moon
예제: 아이리스 데이터 집합 Page 30 데이터 탐색(Data Exploration) Data Mining & Practices by Yang-Sae Moon
Slicing vs. Dicing 데이터 탐색(Data Exploration) Page 32 Data Mining & Practices by Yang-Sae Moon
Roll-Up vs. Drill-Down 데이터 탐색(Data Exploration) Page 33 Data Mining & Practices by Yang-Sae Moon