Iris Data Set Data Exploration UCI Machine Learning

  • Slides: 34
Download presentation

아이리스 데이터 집합 (Iris Data Set) 데이터 탐색(Data Exploration) 데이터 탐색 설명을 위해 아이리스

아이리스 데이터 집합 (Iris Data Set) 데이터 탐색(Data Exploration) 데이터 탐색 설명을 위해 아이리스 데이터 집합을 활용 • UCI Machine Learning Repository: http: //archive. ics. uci. edu/ml/ 150개의 아이리스 꽃 • Setosa 50개 • Virginica 50개 • Versicolour 50개 Page 4 Data Mining & Practices by Yang-Sae Moon

요약 통계 (Summary Statistics) 데이터 탐색(Data Exploration) 요약 통계란 데이터의 특성을 요약하는 수치를 의미한다.

요약 통계 (Summary Statistics) 데이터 탐색(Data Exploration) 요약 통계란 데이터의 특성을 요약하는 수치를 의미한다. (Summary statistics are numbers that summarizes properties of the data. ) 쉽게 생각할 수 있는 요약 통계로는 평균, 표준편차, 최대값 등이 있다. 대부분의 요약 통계는 데이터를 한번 읽음으로써 구할 수 있다. (Most summary statistics can be calculated in a single pass through the data. ) Page 6 Data Mining & Practices by Yang-Sae Moon

삼차원 히스토그램 예제 데이터 탐색(Data Exploration) Page 16 Data Mining & Practices by Yang-Sae

삼차원 히스토그램 예제 데이터 탐색(Data Exploration) Page 16 Data Mining & Practices by Yang-Sae Moon

시각화 기술: 상자 도표(Box Plots) 데이터 탐색(Data Exploration) 단일 속성 값의 분포를 상자(box)의 크기로

시각화 기술: 상자 도표(Box Plots) 데이터 탐색(Data Exploration) 단일 속성 값의 분포를 상자(box)의 크기로 표현함 Page 17 Data Mining & Practices by Yang-Sae Moon

상자 도표 예제 데이터 탐색(Data Exploration) 여러 속성을 비교할 때 유용함 Page 18 Data

상자 도표 예제 데이터 탐색(Data Exploration) 여러 속성을 비교할 때 유용함 Page 18 Data Mining & Practices by Yang-Sae Moon

등고 도표 예제: 1998년 해수면 온도 Page 22 데이터 탐색(Data Exploration) Data Mining &

등고 도표 예제: 1998년 해수면 온도 Page 22 데이터 탐색(Data Exploration) Data Mining & Practices by Yang-Sae Moon

기타 시각화 기술들 데이터 탐색(Data Exploration) 표면 도표 (surface plots) Page 23 Data Mining

기타 시각화 기술들 데이터 탐색(Data Exploration) 표면 도표 (surface plots) Page 23 Data Mining & Practices by Yang-Sae Moon

기타 시각화 기술들 데이터 탐색(Data Exploration) 벡터장 도표 (vector field plots) Page 24 Data

기타 시각화 기술들 데이터 탐색(Data Exploration) 벡터장 도표 (vector field plots) Page 24 Data Mining & Practices by Yang-Sae Moon

기타 시각화 기술들 데이터 탐색(Data Exploration) 연관 행렬(correlation matrix) Page 25 Data Mining &

기타 시각화 기술들 데이터 탐색(Data Exploration) 연관 행렬(correlation matrix) Page 25 Data Mining & Practices by Yang-Sae Moon

기타 시각화 기술들 데이터 탐색(Data Exploration) 평행 좌표 도표 (parallel coordinate plots) Page 26

기타 시각화 기술들 데이터 탐색(Data Exploration) 평행 좌표 도표 (parallel coordinate plots) Page 26 Data Mining & Practices by Yang-Sae Moon

예제: 아이리스 데이터 집합 Page 30 데이터 탐색(Data Exploration) Data Mining & Practices by

예제: 아이리스 데이터 집합 Page 30 데이터 탐색(Data Exploration) Data Mining & Practices by Yang-Sae Moon

Slicing vs. Dicing 데이터 탐색(Data Exploration) Page 32 Data Mining & Practices by Yang-Sae

Slicing vs. Dicing 데이터 탐색(Data Exploration) Page 32 Data Mining & Practices by Yang-Sae Moon

Roll-Up vs. Drill-Down 데이터 탐색(Data Exploration) Page 33 Data Mining & Practices by Yang-Sae

Roll-Up vs. Drill-Down 데이터 탐색(Data Exploration) Page 33 Data Mining & Practices by Yang-Sae Moon