Phn tch m t v PCA Dominique Valentin

  • Slides: 31
Download presentation
Phân tích mô tả và PCA Dominique Valentin ENSBANA/CESG valentin@u-bourgogne. fr Hervé Abdi The

Phân tích mô tả và PCA Dominique Valentin ENSBANA/CESG valentin@u-bourgogne. fr Hervé Abdi The university of Texas at Dallas herve@utdallas. edu

Xét lại ví dụ về sữa chua Cấu trúc Độ đặc: consistency of the

Xét lại ví dụ về sữa chua Cấu trúc Độ đặc: consistency of the mass in the mouth Tỷ lệ tan chảy: lượng sản phẩm bị tan chảy dưới một sức ép cụ thể của lưỡi Độ hạt: lượng mảnh nhỏ có trong khối sản phẩm Độ dính vòm miệng: lượng màng mỏng còn sót lại trên bề mặt vòm miệng Các vị cơ bản: Ngọt: đường mía Chua: acid lactic Đắng: caffeine Mặn: Na. Cl (muối ăn) Hương vị: Nước: vị giống nước lọc Gỗ: mùi gỗ gọt bút chì Sữa: sữa nguyên kem Kem: kem tươi Đất: đất Bột: 1 muỗng hương liệu pha trong nước Phấn: smecta Vỏ bột bánh: vỏ bột bánh thương mại Hazelnut: bột hazelnut Nấm: nấm khô ngâm trong nước

Xét lại ví dụ về sữa chua 9 cảm quan viên 5 loại sữa

Xét lại ví dụ về sữa chua 9 cảm quan viên 5 loại sữa chua: 3 sữa chua đậu nành 2 sữa chua lên men từ sữa bò Đắng Hoàn toàn không Rất mạnh Mặn Chát

Xét lại ví dụ về sữa chua Cấu trúc Đặc 10, 00 8, 00

Xét lại ví dụ về sữa chua Cấu trúc Đặc 10, 00 8, 00 6, 00 4, 00 ab ab a b 2, 00 b 0, 00 sojasun carrefour sojade Intensité moyenne Bột 10, 00 6, 00 4, 00 sojasun carrefour b ab a ab 2, 00 0, 00 sojasun carrefour sojade ab d sojade velouté leaderprice danone Tan chảy velouté leaderprice danone Intensité moyenne 4, 00 ab bc 0, 00 velouté leaderprice danone 10, 00 6, 00 bc 2, 00 Béo 8, 00 a 8, 00 10, 00 8, 00 6, 00 abc 4, 00 c ab 2, 00 0, 00 sojasun carrefour sojade velouté leaderprice danone

Xét lại ví dụ về sữa chua Vị Chua 10, 00 8, 00 6,

Xét lại ví dụ về sữa chua Vị Chua 10, 00 8, 00 6, 00 4, 00 ab ab ab 2, 00 0, 00 sojasun carrefour sojade Intensité moyenne Ngọt 10, 00 a 8, 00 6, 00 4, 00 cd sojasun carrefour 2, 00 a a a 0, 00 sojasun carrefour sojade velouté leaderprice danone Chát velouté leaderprice danone Intensité moyenne 4, 00 bc 0, 00 velouté leaderprice danone 10, 00 6, 00 cd 2, 00 Đắng 8, 00 cd 10, 00 8, 00 6, 00 4, 00 a abc c abc 2, 00 0, 00 sojasun carrefour sojade velouté leaderprice danone

Xét lại ví dụ về sữa chua Mùi Phấn 10, 00 8, 00 6,

Xét lại ví dụ về sữa chua Mùi Phấn 10, 00 8, 00 6, 00 4, 00 c abc d 2, 00 d 0, 00 sojasun carrefour sojade Intensité moyenne Bột 10, 00 8, 00 6, 00 a b 4, 00 sojasun carrefour 2, 00 ab ab ab b 0, 00 sojasun carrefour sojade velouté leaderprice danone Intensité moyenne 8, 00 a b sojade velouté leaderprice danone Kem 10, 00 4, 00 b 0, 00 velouté leaderprice danone Hazelnut 6, 00 b 2, 00 10, 00 a 8, 00 6, 00 4, 00 2, 00 c c 0, 00 sojasun carrefour sojade velouté leaderprice danone

Giải pháp: Phân tích thành phần chính Facteur 2 - 17. 84 % sojade

Giải pháp: Phân tích thành phần chính Facteur 2 - 17. 84 % sojade Soja bifidus 2 danone bifidus Soja sun 1 soja bio velouté danone 0 Soja délice soja champion -1 Leader price -2 Soja carrefour Soja leaderprice carrefour -4. 5 -3. 0 -1. 5 0 1. 5 3. 0 Facteur 1 - 61. 04 %

Phân tích thành phần chính (PCA) là gì? Một kỹ thuật thống kê được

Phân tích thành phần chính (PCA) là gì? Một kỹ thuật thống kê được dùng để chuyển một lượng lớn các biến số tương quan nhau thành một lượng nhỏ hơn các biến số không tương quan gọi là các thành phần chính. Thành phần chính thứ nhất biểu diễn mức độ biến thiên nhiều nhất trong các số liệu, và mỗi thành phần tiếp theo biểu diễn càng nhiều mức độ biến thiên còn lại càng tốt. Kỹ thuật toán học được sử dụng trong PCA được gọi là phân tích giá trị riêng.

Sử dụng PCA khi nào ? Để phân tích các bảng số liệu hai

Sử dụng PCA khi nào ? Để phân tích các bảng số liệu hai chiều gồm có I quan sát và J biến định lượng Biến số 1 … j … J Quan sát i. . . I ……. . . 1. . . …. . . yij

Vì sao sử dụng PCA ? 1. Để đánh giá sự giống nhau giữa

Vì sao sử dụng PCA ? 1. Để đánh giá sự giống nhau giữa các quan sát, ở đây là các sản phẩm 2. Để đánh giá cấu trúc trong mối quan hệ giữa các biến số, ở đây là các thuộc tính mô tả descriptors 3. Để giảm bớt số lượng các biến số, từ đó có thể biểu diễn các số liệu bằng đồ họa Đưa ra một mô tả tổng hợp cho các sản phẩm

Nguyên tắc chung của PCA Biến số 1 … j … J Quan sát

Nguyên tắc chung của PCA Biến số 1 … j … J Quan sát . . . I …. . . y ij ……. . . i ……. . . 1 Các thành phần chính PC 1. . PCk. . PCK 1 Phân tích đường chéo. Hoặc phân tích riêng. . i …. . . Cp . . . I Vòng tròn tương quan PC 2 Hình chiếu của các quan sát PC 2 + Cp 1 ik + + + PC 1

Một ví dụ nhỏ: profile rượu vang Amber Black currant Musc Goose berry Coconut

Một ví dụ nhỏ: profile rượu vang Amber Black currant Musc Goose berry Coconut Leather Woody Vanilla Rasberry v 1 7. 000 3. 000 1. 000 6. 000 9. 000 3. 000 1. 000 0. 000 2. 000 v 2 0. 000 5. 000 1. 000 0. 000 7. 000 0. 000 1. 000 6. 000 v 3 1. 000 9. 000 0. 000 6. 000 1. 000 5. 000 v 4 1. 000 6. 000 7. 000 0. 000 1. 000 6. 000 4. 000 v 5 6. 000 1. 000 8. 000 5. 000 4. 000 2. 000 5. 000 1. 000 v 6 1. 000 6. 000 5. 000 1. 000 0. 000 5. 000 7. 000 6. 000 v 7 7. 000 3. 000 1. 000 6. 000 8. 000 2. 000 1. 000 0. 000 2. 000 v 8 6. 000 3. 000 0. 000 5. 000 3. 000 1. 000 3. 000 v 9 0. 000 4. 000 1. 000 0. 000 7. 000 6. 000 5. 000 v 10 4. 000 2. 000 6. 000 5. 000 6. 000 2. 000 5. 000 7. 000 1. 000 v 11 5. 000 1. 000 4. 000 6. 000 7. 000 1. 000 6. 000 7. 000 2. 000 v 12 1. 000 6. 000 0. 000 1. 000 0. 000 5. 000 0. 000 1. 000 8. 000

Một ví dụ nhỏ: profile rượu vang coconut vanilla woody goose berry leather amber

Một ví dụ nhỏ: profile rượu vang coconut vanilla woody goose berry leather amber rasberry black currant

Một ví dụ nhỏ: profile rượu vang

Một ví dụ nhỏ: profile rượu vang

Làm thế nào để tìm các thành phần chính? Bước 1: lấy vài số

Làm thế nào để tìm các thành phần chính? Bước 1: lấy vài số liệu Bước 2: lấy hiệu các giá trị trung bình các biến số Bước 3: tìm các vectơ riêng và các giá trị riêng của ma trận đồng phương sai Bước 4: tìm các thành phần chính bằng cách chiếu các quan sát lên các vectơ riêng Bước 5: tính toán các tải (loading) chẳng hạn như sự tương quan giữa các biến số gốc và các thành phần chính

Ví dụ 2 D: bước 1 lấy số liệu 20 từ : Biến 1

Ví dụ 2 D: bước 1 lấy số liệu 20 từ : Biến 1 = số chữ cái Biến 2 = số dòng dùng để định nghĩa từ trong từ điển

Số chữ cái của từ Ví dụ 2 D: bước 1 lấy số liệu

Số chữ cái của từ Ví dụ 2 D: bước 1 lấy số liệu Số dòng của định nghĩa

Ví dụ 2 D: bước 2 Lấy hiệu trung bình Y = “Chiều dài

Ví dụ 2 D: bước 2 Lấy hiệu trung bình Y = “Chiều dài của từ ” MY = 6 y = (Y −MY) W = “Số dòng của định nghĩa” MW = 8 w = (W −MW)

Ví dụ 2 D: bước 2 Lấy hiệu trung bình

Ví dụ 2 D: bước 2 Lấy hiệu trung bình

Ví dụ 2 D: bước 3 tìm các vectơ riêng

Ví dụ 2 D: bước 3 tìm các vectơ riêng

Ví dụ 2 D: bước 3 tìm các vectơ riêng

Ví dụ 2 D: bước 3 tìm các vectơ riêng

Ví dụ 2 D: chiếu các quan sát

Ví dụ 2 D: chiếu các quan sát

Ví dụ 2 D: chiếu các quan sát

Ví dụ 2 D: chiếu các quan sát

Ví dụ 2 D: tính toán các tải (loadings) Hệ số tương quan Pearson

Ví dụ 2 D: tính toán các tải (loadings) Hệ số tương quan Pearson r (W, F 1) = 0. 97

Ví dụ 2 D: tính toán các tải (loadings) Hệ số tương quan Pearson

Ví dụ 2 D: tính toán các tải (loadings) Hệ số tương quan Pearson r (W, F 2) = 0. 23

Ví dụ 2 D: tính toán các tải (loadings) Hệ số tương quan Pearson

Ví dụ 2 D: tính toán các tải (loadings) Hệ số tương quan Pearson r (Y, F 1) = -0. 87

Ví dụ 2 D: tính toán các tải (loadings) Hệ số tương quan Pearson

Ví dụ 2 D: tính toán các tải (loadings) Hệ số tương quan Pearson r (Y, F 2) = 0. 50

Ví dụ 2 D : vẽ vòng tròn tương quan r (W, F 1)

Ví dụ 2 D : vẽ vòng tròn tương quan r (W, F 1) = 0. 97 r (W, F 2) = 0. 23 r (Y, F 1) = -0. 87 r (Y, F 2) = 0. 50 Độ dài (số lượng chữ cái) Số lượng dòng của định nghĩa

Làm thế nào để tính phương sai explained variance ? Giá trị riêng 392

Làm thế nào để tính phương sai explained variance ? Giá trị riêng 392 52 444 % phương sai tích luỹ 88 12 392 444 X 100 = 88% 88 100

Giữ lại bao nhiêu thành phần Chuẩn Kaiser. chỉ giữ lại thành phần có

Giữ lại bao nhiêu thành phần Chuẩn Kaiser. chỉ giữ lại thành phần có giá trị riêng lớn hơn 1 4 3, 5 The scree test. 3 2, 5 2 1, 5 1 0, 5 0 1 2 3 4 5 6 7 8 Thông thường. giữ lại những chiều mà có thể phân tích giải thích được Khảo sát một vài giải pháp và chọn giải pháp “hợp lý nhất”

Tôi có nên chuẩn hoá số liệu ? Có, nếu số liệu không được

Tôi có nên chuẩn hoá số liệu ? Có, nếu số liệu không được đo trên cùng một thang Nếu không thì nó phụ thuộc vào: Chuẩn hoá: cùng trọng lượng cho toàn bộ biến số Không chuẩn hoá: trọng lượng tỷ lệ theo độ lệch chuẩn