Machine learning hiện nay là một chủ đề công nghệ nổi bật và tạo ra nhiều giá trị ý nghĩa nhất hiện nay. Hầu hết các ứng dụng chúng ta sử dụng hàng ngày đã và đang được trang bị các công nghệ liên quan đến học máy. Vậy Machine learning là gì? Tại sao machine learning lại có nhiều ứng dụng đến vậy? Tất cả sẽ được trả lời trong series Machine learning cơ bản này.
Nội dung của Machine Learning cơ bản
Phần 1. Tổng quan
Machine learning là gì?
Nhiệm vụ T
Kinh nghiệm E
Độ đo P
Machine learning workflow
Phần 2. Xử lý dữ liệu
Thu thập dữ liệu: Kiểu dữ liệu
Thu thập dữ liệu: Kiểu bộ dữ liệu
Tổng hợp một số nguồn dataset cho các lĩnh vực
Khám phá dữ liệu
Hiển thị dữ liệu
Biểu diễn dữ liệu
Tiền xử lý dữ liệu
Data cleaning
Data integration
Data transformation
Data reduction
Rời rạc hóa dữ liệu
Lấy mẫu (Sampling)
Feature Engineering
Feature Extraction
Feature Selection
Feature Creation
Phần 3. Xây dựng và đánh giá mô hình
Loss function
Huấn luyện mô hình machine learning – Hồi quy tuyến tính
Gradient Descent
Train set và test set
Underfitting và Overfitting
Phần 4. Các mô hình phân lớp
Hồi quy logic
kNN
Support Vector Machine
Kernel SVM
Naive Bayes
Cây quyết định
Random Forest
Lựa chọn mô hình phân lớp
Đánh giá mô hình phân lớp
Phần 5. Các mô hình Hồi quy
Hồi quy tuyến tính đơn giản
Hồi quy nhiều chiều
Hồi quy phi tuyến
Support Vector Regression (SVR)
Decission tree regression
Random forest Regression
Đánh giá mô hình hồi quy
Lựa chọn mô hình hồi quy
Phần 6. Các mô hình phân cụm
K-Means
Mean-Shiff
Phân cụm phân cấp
Phần 7. Ensemble learning
Bagging
Stacking
Boosting
Phần 8. Khai phá luật kết hợp
Apriori
FP-Tree
Eclat
Phần 9. Hệ đề nghị
Hàng xóm gần nhất
Matrix Factorization
Phần 10. Giảm chiều dữ liệu
Phân tích thành phần chính PCA
Phân tích thành phần độc lập ICA
Linear Discriminant Analysis
Kernel PCA
Lựa chọn mô hình tự động và Fine-Tune
Một số chủ đề khác
Học tăng cường – Reinforcement Learning
Computer Vision
NLP
Học machine learning qua ví dụ
Python Machine Learning
Các bài viết trong series được giải thích kèm với các ví dụ và bài tập áp dụng dựa trên các bài toán thực tế. Do đó, nó không chỉ giúp bạn nắm vững lý thuyết mà còn cho phép bạn có khả năng tự xây dựng những mô hình machine learning cơ bản đầu tiên cho chính mình.
Bạn sẽ thu được gì từ Machine learning cơ bản?
Sau khi hoàn thành Series này bạn có thể:
- Thành thạo cách xây dựng mô hình học máy cơ bản trên Python.
- Hiểu rõ các khái niệm cơ bản về học máy như: overfitting, underfitting, học có giám sát, học không giám sát,…
- Nắm vững các mô hình học máy cơ bản như: cây quyết định, k-means,….
- Biết cách đánh giá một mô hình machine learning thế nào là hiệu quả.
- Nắm được quy trình để xây dựng và ứng dụng các mô hình học máy vào bài toán thực tế.
- Nắm được cách chọn mô hình học máy phù hợp cho từng nhu cầu bài toán thực tế.
- Biết cách xử lý dữ liệu phù hợp cho bài toán học máy.
- Nắm được cách thức trích chọn đặc trưng và giảm chiều dữ liệu.
- Nắm được một số khái niệm nâng cao như học tăng cường, xử lý ngôn ngữ tự nhiên (NLP), thị giác máy tính (computer vision), deep learning.
- Nắm được khái niệm ensemble learning và cách thức xây dựng các mô hình ensemble learning để giải quyết các bài toán trong thực tế.
Machine learning cơ bản giành cho ai?
- Series này giành cho bất cứ ai yêu thích machine learning và muốn tìm hiểu cơ bản về nó;
- Sinh viên đã có những kiến thức cơ bản về toán và muốn bắt đầu với machine learning;
- Những người đã có hiểu biết cơ bản về machine learning nhưng muốn tìm hiểu sâu hơn về những lĩnh vực ứng dụng của machine learning và cách thức để xây dựng mô hình machine learning trong thực tế;
- Lập trình viên muốn học và ứng dụng machine learning vào các sản phẩm của mình;
- Bất cứ ai muốn bắt đầu muốn tìm kiếm một công việc về data science hoặc machine learning hoặc muốn mở rộng hiểu biết của mình và đào sâu hơn các kiến thức đã có.
Bạn cần gì để bắt đầu Series này?
Để tiếp thu tốt nhất các kiến thức trong Series này, bạn nên có một số nền tảng kiến thức sau:
- Nắm vững một số kiến thức cơ bản trong toán học phổ thông như: đạo hàm, khoảng cách, vector,…Nếu bạn chưa quen thuộc với toán hoặc đã quên gần hết. Hãy xem lại Series: Toán cho machine learning.
- Đôi chút kiến thức về lập trình, đặc biệt là Python. Nếu bạn chưa quen thuộc với Python, có thể tham khảo Series: Lập trình Python cơ bản.
Hi vọng Machine learning cơ bản sẽ là tài liệu bổ ích giúp bạn bước chân vào thế giới của máy học. Nếu có bất cứ thắc mắc nào, hãy để lại comment sau ngay mỗi bài học, hoặc liên hệ inbox trực tiếp đến Fanpage của TEK4.VN. Bạn cũng có thể nhận được sự giúp đỡ từ cộng đồng bằng cách tạo các chủ đề trên Nhóm. Chúc các bạn thành công !