Khoa Hc K Thut My Tnh Trng i

  • Slides: 8
Download presentation
Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách Khoa Tp. Hồ

Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách Khoa Tp. Hồ Chí Minh Chương 8: Các vấn đề nghiên cứu trong khai phá dữ liệu Khai phá dữ liệu (Data mining) Học kỳ 1 – 2009 -2010 1

Nội dung p 8. 1. Hướng dữ liệu p 8. 2. Hướng kỹ thuật

Nội dung p 8. 1. Hướng dữ liệu p 8. 2. Hướng kỹ thuật p 8. 3. Hướng ứng dụng p 8. 4. Tóm tắt 2

Tài liệu tham khảo p [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and

Tài liệu tham khảo p [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006. p [2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data Mining”, MIT Press, 2001. p [3] David L. Olson, Dursun Delen, “Advanced Data Mining Techniques”, Springer-Verlag, 2008. p [4] Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory, Methodology, Techniques, and Applications”, Springer-Verlag, 2006. p [5] Zhao. Hui Tang, Jamie Mac. Lennan, “Data Mining with SQL Server 2005”, Wiley Publishing, 2005. p [6] Oracle, “Data Mining Concepts”, B 28129 -01, 2008. p [7] Oracle, “Data Mining Application Developer’s Guide”, B 28131 -01, 2008. 3

8. 1. Hướng dữ liệu p Dữ liệu tuần tự (sequence data) p Dữ

8. 1. Hướng dữ liệu p Dữ liệu tuần tự (sequence data) p Dữ liệu chuỗi thời gian (time series data) p Dữ liệu đa chiều (high dimensional data) p Dữ liệu dòng (streaming data) p Các kiểu dữ liệu phức tạp khác (complex data) như là dữ liệu web (web documents), dữ liệu văn bản (text documents), dữ liệu đa phương tiện (multimedia), … 4

8. 2. Hướng kỹ thuật p Hỗ trợ co giãn (scalability) cho dữ liệu

8. 2. Hướng kỹ thuật p Hỗ trợ co giãn (scalability) cho dữ liệu đa chiều (high dimensional data) và các dòng dữ liệu tốc độ cao (high speed data streams) p Khai phá dữ liệu phân tán p Khai phá dữ liệu có xem xét vấn đề bảo mật, riêng tư và toàn vẹn dữ liệu p Khai phá dữ liệu không tĩnh và cân bằng p … 5

8. 3. Hướng ứng dụng p Khai phá dữ liệu trong lĩnh vực mạng

8. 3. Hướng ứng dụng p Khai phá dữ liệu trong lĩnh vực mạng (network) và giao tiếp dữ liệu (data communications) p Khai phá dữ liệu trong lĩnh vực môi trường (environmental area) p Khai phá dữ liệu trong lĩnh vực sinh học (biological area) p … 6

8. 4. Tóm tắt p. Khai phá dữ liệu là lĩnh vực liên ngành.

8. 4. Tóm tắt p. Khai phá dữ liệu là lĩnh vực liên ngành. p. Khai phá dữ liệu hiện diện trong nhiều lĩnh vực ứng dụng. p. Khai phá dữ liệu đã/đang/sẽ được nghiên cứu tiếp. Nguồn: Q. Yang, 10 Challenging Problems in Data Mining Research, International Journal of Information Technology & Decision Making 5(4)(2006) 597 -604. 7