Khai Phá Dữ Liệu

Giáo trình Tiếng Anh

CO3029_Khaiphadulieu_Jiawei-Han-Micheline-Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques-3rd-Edition-Morgan-Kaufmann-2011.pdf
CO3029_Khaiphadulieu_David Hand, Heikki Mannila, Padhraic Smyth, Principles of Data Mining.pdf
CO3029_Khaiphadulieu.pdf

Giáo trình, bài giảng

chapter-3-data regression.pdf
chapter-2-data preprocessing.pdf
chapter-1-overall.pdf
chapter-0-module introduction.pdf

Bài tập, thực hành

Đề thi

Giới thiệu, nội dung môn học

Môn học này nhằm giới thiệu quá trình khám phá tri thức, các khái niệm, công nghệ, và ứng dụng của khai phá dữ liệu. Ngoài ra, môn học này cũng trình bày các vấn đề tiền xử lý dữ liệu, các tác vụ khai phá dữ liệu, các giải thuật và công cụ khai phá dữ liệu mà có thể được dùng hỗ trợ nhà phân tích dữ liệu và nhà phát triển ứng dụng khai phá dữ liệu. Các chủ đề cụ thể của môn học bao gồm: tổng quan về khai phá dữ liệu, các vấn đề về dữ liệu được khai phá, các vấn đề tiền xử lý dữ liệu, hồi qui dữ liệu, phân loại dữ liệu, gom cụm dữ liệu, khai phá luật kết hợp, phát triển ứng dụng khai phá dữ liệu, và các đề tài nghiên cứu nâng cao trong khai phá dữ liệu.

Kết quả cần đạt được

Minh họa được các bước trong quá trình khám phá tri thức L.O.1.1 – So sánh quá trình khám phá tri thức và quá trình khai phá dữ liệu L.O.1.2 - Liệt kê được các bước trong quá trình khám phá tri thức L.O.1.3 – Nêu ví dụ thực tế về quá trình khám phá tri thức Mô tả các khái niệm cơ bản, công nghệ và ứng dụng của khai phá dữ liệu L.O.2.1 – Liệt kê các tác vụ khai phá dữ liệu L.O.2.2 – Mô tả được các thành phần của tác vụ khai phá dữ liệu tổng quát L.O.2.3 – Mô tả được các thành phần của giải thuật khai phá dữ liệu tổng quát L.O.2.4 – Mô tả được quy trình khai phá dữ liệu chuẩn L.O.2.5 – Liệt kê được các ứng dụng của khai phá dữ liệu trong ít nhất 1 lĩnh vực thực tế L.O.2.6 – Phân biệt được hệ thống khai phá dữ liệu với các dạng hệ thống khác như hệ cơ sở dữ liệu diễn dịch, hệ thống truy hồi thông tin, hệ thống học máy, … Giải thích các tác vụ khai phá dữ liệu phổ biến như hồi qui, phân loại, gom cụm, và khai phá tập mẫu thường xuyên và luật kết hợp L.O.3.1 – Giải thích tác vụ hồi qui dữ liệu L.O.3.2 – Giải thích tác vụ phân loại dữ liệu L.O.3.3 – Giải thích tác vụ gom cụm dữ liệu L.O.3.4 – Giải thích tác vụ khai phá tập mẫu thường xuyên và luật kết hợp Nhận dạng được các vấn đề về dữ liệu trong giai đoạn tiền xử lý cho các tác vụ khai phá dữ liệu L.O.4.1 - Xác định được các mô tả thống kê của tập dữ liệu cho trước L.O.4.2 – Mô tả được vấn đề và giải pháp nhận diện nhiễu và phần tử ngoại biên trong tập dữ liệu cho trước L.O.4.3 – Thực hiện được các biến đổi dữ liệu trên tập dữ liệu cho trước L.O.4.4 – Thực hiện được các thu giảm dữ liệu trên tập dữ liệu cho trước Sử dụng các giải thuật và công cụ khai phá dữ liệu để phát triển ứng dụng khai phá dữ liệu L.O.5.1 – Khai phá được mô hình hồi qui dữ liệu/mô hình phân loại dữ liệu/mô hình gom cụm dữ liệu/tập mẫu thường xuyên và luật kết hợp tương ứng trong ứng dụng khai phá dữ liệu L.O.5.3 – Sử dụng được thư viện khai phá dữ liệu trong ứng dụng khai phá dữ liệu L.O.5.3 – Minh họa được việc sử dụng kết quả khai phá dữ liệu trong một chương trình ứng dụng cụ thể

Tài liệu tham khảo

Sách, Giáo trình chính: [1] Jiawei Han, Micheline Kamber, Jian Pei, “Data Mining: Concepts and Techniques”, Third Edition, Morgan Kaufmann Publishers, 2012. [2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data Mining”, MIT Press, 2001. Sách tham khảo: [3] David L. Olson, Dursun Delen, “Advanced Data Mining Techniques”, Springer-Verlag, 2008. [4] Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory, Methodology, Techniques, and Applications”, Springer-Verlag, 2006. [5] ZhaoHui Tang, Jamie MacLennan, “Data Mining with SQL Server 2005”, Wiley Publishing, 2005. [6] Oracle, “Data Mining Concepts”, B28129-01, 2008. [7] Oracle, “Data Mining Application Developer’s Guide”, B28131-01, 2008. [8] Ian H.Witten, Frank Eibe, Mark A. Hall, “Data mining: practical machine learning tools and techniques”, Third Edition, Elsevier Inc, 2011. [9] Florent Messeglia, Pascal Poncelet & Maguelonne Teisseire, “Successes and new directions in data mining”, IGI Global, 2008. [10] Oded Maimon, Lior Rokach, “Data Mining and Knowledge Discovery Handbook”, Second Edition, Springer Science + Business Media, LLC 2005, 2010.