Trong khoảng chục năm trở lại đây, trí thông minh nhân tạo (AI), Học máy (ML) và Deep Learning (DL) đang trở thành một trong những chủ đề “nóng bỏng”. Thuật ngữ “AI” được nhắc đến hằng ngày, trên mọi phương tiện thông tin đại chúng, từ báo đài, loa phường đến cả những câu chuyện trà đá chém gió. Hàng loạt trường mở các chuyên ngành về AI, khoa học dữ liệu,…với độ hot khủng khiếp. Ứng dụng của AI thì ở khắp mọi nơi như: ô tô tự lái, robot phẫu thuật, dịch thuật tự động, chatbot,… Vậy AI là gì, Machine Learning là gì? và Deep Learning là gì? Tại sao nó lại có nhiều ứng dụng đến vậy? Chuỗi bài viết “Deep Learning cơ bản: từ lý thuyết đến thực hành” này sẽ trả lời cho những câu hỏi trên.
Deep Learning cơ bản: Từ lý thuyết đến thực hành sẽ cung cấp những khía cạnh cơ bản của Deep Learning và cách thức ứng dụng Deep Learning vào các bài toán trong thực tế. Mỗi bài viết sẽ giải thích một cách chi tiết và đơn giản, dễ hiểu nhất về các khái niệm của deep learning, những nguyên lý hoạt động của deep learning và mỗi bài đều sẽ đi từ các nội dung lý thuyết đến thực hành với những ứng dụng đơn giản dễ hiểu.
Deep Learning cơ bản: Từ lý thuyết đến thực hành giành cho ai?
Series bài viết này nhằm giới thiệu các kiến thức cơ bản về Deep Learning cũng như các ứng dụng của nó trong thực tế.
Deep Learning cơ bản: Từ lý thuyết đến thực hành phù hợp cho những người mới bắt đầu muốn tìm hiểu về AI, Machine Learning, Deep Learning những bạn học khoa học máy tính cũng như các ngành về công nghệ thông tin hoặc toán muốn tìm hiểu và ứng dụng deep learning.
Chuỗi bài viết cũng phù hợp với những người chưa có chuyên sâu về khoa học máy tính trong những ngành khác như y tế, ngân hàng, nông nghiệp,… Chỉ cần có những kiến thức cơ bản về giải tích phổ thông là có thể tự áp dụng được những kiến thức trong chuỗi bài viết này trong việc xây dựng ứng dụng Deep learning dựa trên kiến thức chuyên môn và dữ liệu có sẵn trong lĩnh vực chuyên ngành của mình.
Cuối cùng, những CEO, lãnh đạo doanh nghiệp hoặc những ai muốn khởi nghiệp trong lĩnh vực trí tuệ nhân tạo cũng có thể sử dụng những kiến thức cơ bản về deep learning trong chuỗi bài viết này để áp dụng các ý tưởng vào start-up, công ty của mình nhằm xây dựng các ứng dụng hay, thiết thực cho xã hội.
Nền tảng trước khi bắt đầu
Series bài viết này hướng đến hầu hết mọi đối tượng, kể cả những bạn không theo ngành Khoa học máy tính hay công nghệ thông tin, do đó, để bắt đầu, bạn chỉ cần có những kiến thức nền tảng sau đây:
- Kiến thức về toán giải thích phổ thông như: đạo hàm, vi phân,…Những kiến thức này sẽ giúp bạn hiểu được nguyên lý hoạt động cơ bản của các thuật toán huấn luyện, các vấn đề về tối ưu đối với hàm kích hoạt,…Trong một số đoạn, để tiện theo dõi, chúng ta cũng sẽ nhắc lại một chút về những kiến thức này. Do đó nếu chưa có nhiều hoặc đã quên, bạn cứ yên tâm
- Kiến thức cơ bản về lập trình. Điều này sẽ giúp bạn dễ theo dõi các ví dụ và hiểu cách tại sao lại làm như vậy. Nếu bạn hoàn toàn chưa biết gì về lập trình, hãy xem qua loạt bài viết Lập trình Python để có kiến thức cơ bản về Python trước khi bắt đầu các bài tiếp theo.
Nội dung của chuỗi bài viết Deep Learning cơ bản: Từ lý thuyết đến thực hành
Bài 1. Mạng nơ ron và bài toán hồi quy
Bài 2. Hàm mục tiêu và hàm mất mát
Bài 3. Hàm kích hoạt
Bài 4. Huấn luyện mạng neural với thuật toán lan truyền ngược
Bài 5. Overfitting và Underfitting
Bài 6. Regularization
Bài 7. Early Stopping
Bài 8. Độ rộng và độ sâu của mạng neural
Bài 9. Ensemble Methods
Bài 10. Vanishing and Exploding Gradient
Bài 11. Nghiệm tối ưu địa phương và vấn đề hội tụ của nghiệm
Bài 12. Các thuật toán huấn luyện mạng neural hiện đại
Bài 13. Radial Basis Function Network
Bài 14. Restricted Boltzmann Machines
Bài 15. Recurrent Neural Networks
Bài 16. Xử lý ngôn ngữ tự nhiên với RNN
Bài 17. Long-short term Memory
Bài 18. GRUs
Bài 19. Convolutional Neural Networks
Bài 20. Giới thiệu về xử lý ảnh
Bài 21. Giới thiệu keras và bài toán phân loại ảnh
Bài 22. Ứng dụng CNN
Bài 23. Hierarchical Feature Engineering and Pretrained Models
Bài 24. Auto Encoder
Bài 25. Reinforcement Learning
Bài 26. Separating Data Storage and Computations
Bài 27. Generative Adversarial Networks
Bài 28. Meta-Learning
Bài 29. Spiking Network