<pre style="text-align: center;">"[___WARNING_Kh&oacute;a học đang trong qu&aacute; tr&igrave;nh cập nhật nội dung mỗi tuần n&ecirc;n kh&ocirc;ng thể tr&aacute;nh khỏi sai s&oacute;t. Rất mong bạn đọc th&ocirc;ng cảm. Nếu c&oacute; bất cứ thắc mắc n&agrave;o h&atilde;y ib cho page <a href="https://www.facebook.com/tek4.vn">TEK4.VN</a> hoặc thảo luận tại group <a href="https://www.facebook.com/groups/tek4.vn">TEK4.VN- Học Lập Tr&igrave;nh Miễn Ph&iacute;</a>_WARNING___]"</pre>
<h3 style="text-align: justify;">Giới thiệu kh&oacute;a học machine learning cơ bản với Python</h3>
Bạn nghe n&oacute;i về tr&iacute; tuệ nh&acirc;n tạo rồi machine learning v&agrave; muốn t&igrave;m hiểu về n&oacute;. Kh&oacute;a học n&agrave;y l&agrave; gi&agrave;nh cho bạn.
Kh&oacute;a học n&agrave;y được thiết kế một c&aacute;ch b&agrave;i bản với những kiến thức từ cơ bản đến n&acirc;ng cao gi&uacute;p bạn c&oacute; khả năng l&agrave;m quen một c&aacute;ch dễ d&agrave;ng nhất với lĩnh vực machine learning.
C&aacute;c chủ đề của kh&oacute;a học được thiết kế liền mạch với những giải th&iacute;ch dễ hiểu v&agrave; v&iacute; dụ minh họa thực tế. Với mỗi b&agrave;i học, bạn sẽ được l&agrave;m quen với c&aacute;c kỹ năng mới v&agrave; n&acirc;ng cao hiểu biết của m&igrave;nh về lĩnh vực học m&aacute;y đầy th&aacute;ch thức nhưng lại v&ocirc; c&ugrave;ng th&uacute; vị với nhiều ứng dụng thực tế n&agrave;y.
Một điều đặc biệt nữa của kh&oacute;a học l&agrave; n&oacute; được thiết kế sao cho mỗi phần l&agrave; tương đối độc lập. V&igrave; vậy, bạn c&oacute; thể học to&agrave;n bộ kh&oacute;a học từ đầu đến cuối hoặc bạn cũng c&oacute; thể nhảy ngay v&agrave;o bất kỳ phần cụ thể n&agrave;o v&agrave; t&igrave;m hiểu những g&igrave; bạn cần ngay lập tức.
Hơn nữa, kh&oacute;a học bao gồm nhiều b&agrave;i tập dựa tr&ecirc;n c&aacute;c nghi&ecirc;n cứu t&igrave;nh huống thực tế trong đời sống. V&igrave; vậy, bạn kh&ocirc;ng chỉ học l&yacute; thuyết m&agrave; c&ograve;n được thực h&agrave;nh rất nhiều v&iacute; dụ để x&acirc;y dựng c&aacute;c m&ocirc; h&igrave;nh của ri&ecirc;ng m&igrave;nh một c&aacute;ch thực thụ. Đặc biệt, bạn sẽ được luyện tập với c&aacute;c kh&aacute;i niệm NGAY LẬP TỨC với hệ thống b&agrave;i tập được hệ thống h&oacute;a v&agrave; đ&aacute;nh gi&aacute; trực tiếp tr&ecirc;n TEK4.VN.
<h3 style="text-align: justify;">Kh&oacute;a học machine learning cơ bản với Python n&agrave;y d&agrave;nh cho ai?</h3>
<ul>
<li style="text-align: justify;">Bất cứ ai quan t&acirc;m đến Machine Learning.</li>
<li style="text-align: justify;">Học vi&ecirc;n đ&atilde; c&oacute; những kiến thức trung học phổ th&ocirc;ng về to&aacute;n v&agrave; muốn bắt đầu học Machine Learning.</li>
<li style="text-align: justify;">Bất kỳ ai đ&atilde; c&oacute; những kiến thức cơ bản về học m&aacute;y, như c&aacute;c thuật to&aacute;n cổ điển như hồi quy tuyến t&iacute;nh hoặc hồi quy logistic, nhưng vẫn muốn t&igrave;m hiểu th&ecirc;m về học m&aacute;y v&agrave; kh&aacute;m ph&aacute; c&aacute;c kh&iacute;a cạnh kh&aacute;c của machine learning.</li>
<li style="text-align: justify;">Bất kỳ ai gặp kh&oacute; khăn trong việc lập tr&igrave;nh để &aacute;p dụng c&aacute;c thuật to&aacute;n học m&aacute;y v&agrave;o b&agrave;i to&aacute;n thực tế.</li>
<li style="text-align: justify;">Bất kỳ sinh vi&ecirc;n đại học n&agrave;o muốn bắt đầu sự nghiệp trong lĩnh vực machine learning.</li>
<li style="text-align: justify;">Bất kỳ ai muốn n&acirc;ng cao kiến thức của bản th&acirc;n trong lĩnh vực Machine Learning.</li>
<li style="text-align: justify;">Bất kỳ người n&agrave;o kh&ocirc;ng h&agrave;i l&ograve;ng với c&ocirc;ng việc của họ v&agrave; muốn trở th&agrave;nh Nh&agrave; khoa học dữ liệu.</li>
<li style="text-align: justify;">Bất kỳ người n&agrave;o muốn tạo gi&aacute; trị gia tăng cho doanh nghiệp của họ bằng c&aacute;ch sử dụng c&aacute;c c&ocirc;ng cụ Machine Learning mạnh mẽ.</li>
</ul>

Machine Learning cơ bản với Python

Để củng cố lại phần kiến thức l&yacute; thuyết của<a href="../../../khoa-hoc/machine-learning-co-ban/tim-nghiem-cua-bai-toan-hoi-quy-tuyen-tinh-bang-toi-uu-tham-so" target="_blank" rel="noopener"> b&agrave;i trước</a>, trong b&agrave;i n&agrave;y ch&uacute;ng ta sẽ xem x&eacute;t một v&iacute; dụ đơn giản cho b&agrave;i to&aacute;n hồi quy tuyến t&iacute;nh một chiều. Ở v&iacute; dụ n&agrave;y, dữ liệu đầu v&agrave;o chỉ c&oacute; 1 thuộc t&iacute;nh (1 chiều) nhằm thuận tiện cho việc minh hoạ trong mặt phẳng.
Để đ&aacute;nh gi&aacute; độ ch&iacute;nh x&aacute;c của c&ocirc;ng thức nghiệm trong b&agrave;i trước, ch&uacute;ng ta sẽ tiến h&agrave;nh so s&aacute;nh n&oacute; với nghiệm t&igrave;m được khi sử dụng thư viện học m&aacute;y <a href="http://scikit-learn.org/stable/">scikit-learn</a>&nbsp;của Python (một trong những thư viện được sử dụng phổ biến nhất hiện nay trong machine learning).
Cho bảng dữ liệu thể hiện tỷ lệ hoạt lực của loại thuốc X sau mỗi năm bảo quản như sau:
<table style="border-collapse: collapse; width: 100%; border-style: solid;">
<tbody>
<tr style="height: 22px;">
<td style="height: 22px; width: 16%;" width="16%">Năm</td>
<td style="height: 22px; width: 16%;" width="16%">1</td>
<td style="height: 22px; width: 16%;" width="16%">2</td>
<td style="height: 22px; width: 16%;" width="16%">3</td>
<td style="height: 22px; width: 16%;" width="16%">4</td>
<td style="height: 22px; width: 16%;" width="16%">5</td>
</tr>
<tr style="height: 22px;">
<td style="height: 22px; width: 16%;" width="16%">Tỷ lệ</td>
<td style="height: 22px; width: 16%;" width="16%">96</td>
<td style="height: 22px; width: 16%;" width="16%">84</td>
<td style="height: 22px; width: 16%;" width="16%">70</td>
<td style="height: 22px; width: 16%;" width="16%">58</td>
<td style="height: 22px; width: 16%;" width="16%">52</td>
</tr>
</tbody>
</table>
<ol style="text-align: justify;">
<li>X&acirc;y dựng đường hồi quy tuyến t&iacute;nh thể hiện tỷ lệ hoạt động của thuốc X qua thời gian</li>
<li>Thể hiện bằng c&aacute;ch vẽ đồ thị bằng matplotlib</li>
<li>Dựa tr&ecirc;n kết quả hồi quy tr&ecirc;n, h&atilde;y x&aacute;c định thời gian hết hạn của thuốc v&agrave; thời điểm m&agrave; thuốc chỉ c&ograve;n lại 80% hoạt lực.</li>
</ol>
Đ&acirc;y l&agrave; một b&agrave;i to&aacute;n hồi quy tuyến t&iacute;nh một chiều đơn giản trong đ&oacute; nhiệm vụ của ch&uacute;ng ta l&agrave; phải dự đo&aacute;n được tỷ lệ hoạt động c&ograve;n lại của một loạt thuốc X theo thời gian. Tất nhi&ecirc;n thuốc để c&agrave;ng l&acirc;u th&igrave; tỷ lệ hoạt động c&agrave;ng giảm. Tức l&agrave; quan hệ ở đ&acirc;y l&agrave; quan hệ tỷ lệ nghịch.
Đầu ti&ecirc;n, để thuận lợi cho việc t&iacute;nh to&aacute;n ch&uacute;ng ta th&ecirc;m v&agrave;o thư viện&nbsp;<a href="https://www.numpy.org/">numpy</a>&nbsp;để phục vụ cho việc xử l&yacute; c&aacute;c ph&eacute;p t&iacute;nh tr&ecirc;n đại số tuyến t&iacute;nh v&agrave; sử dụng th&ecirc;m thư viện&nbsp;<a href="https://matplotlib.org/">matplotlib</a>&nbsp;cho việc vẽ h&igrave;nh minh họa trực quan kết quả.
<pre class="language-python"><code>import numpy as np 
import matplotlib.pyplot as plt</code></pre>
Tiếp theo, để tiện theo d&otilde;i, ch&uacute;ng ta khai b&aacute;o v&agrave; biểu diễn dữ liệu tr&ecirc;n một đồ thị.
<pre class="language-python"><code># Sử dụng np.array để đưa c&aacute;c ph&eacute;p to&aacute;n cho thư viện numpy xử l&yacute; 
X = np.array([[1,2,3,4,5]]).T 
y = np.array([[ 96,84,70,58,52]]).T 
# Vẽ đồ thị để biểu diễn dữ liệu
plt.plot(X, y, 'ro') 
plt.axis([0, 10, 40, 100]) 
plt.xlabel('Số năm') 
plt.ylabel('Tỷ lệ hoạt động') 
plt.show()</code></pre>
<img style="width: 600px; display: block; margin-left: auto; margin-right: auto;" src="https://tek4.vn/public_files/bdbd13f8-d4f6-4710-861e-9b4096805c1d" alt="Huan-luyen-mo-hinh-machine-learning-dau-tien" />
Từ đồ thị n&agrave;y ta thấy rằng dữ liệu được sắp xếp gần như theo 1 đường thẳng nghịch biến, v&agrave; do đ&oacute; m&ocirc; h&igrave;nh Linear Regression nhiều khả năng sẽ cho kết quả tốt: $y=w_{1} x+w_{0}$ Tiếp theo, ch&uacute;ng ta sẽ t&iacute;nh to&aacute;n c&aacute;c hệ số $W=\left[w_{0}, w_{1}\right]$ theo c&ocirc;ng thức ở tr&ecirc;n. Đầu ti&ecirc;n, gh&eacute;p v&agrave;o ma trận để thu được ma trận $\overline{\mathcal{X}}$
<pre class="language-python"><code>one = np.ones((X.shape[0], 1))
Xbar = np.concatenate((one, X), axis = 1)</code></pre>
Khi đ&oacute; Xbar của ch&uacute;ng ta sẽ c&oacute; dạng:
<pre class="language-python"><code>[[1. 1.]
[1. 2.]
[1. 3.]
[1. 4.]
[1. 5.]]</code></pre>
Tiếp theo, ch&uacute;ng ta t&iacute;nh nghiệm theo c&ocirc;ng thức:
<pre class="language-python"><code>A = np.dot(Xbar.T, Xbar)
b = np.dot(Xbar.T, y)
w = np.dot(np.linalg.inv(A), b)
print('w = ', w)</code></pre>
Thu được:
<pre class="language-python"><code>w = [[106.2]
[-11.4]]</code></pre>
Tương ứng với phương tr&igrave;nh hồi quy: $y=106.2-11.4 x$. Vẽ đường thẳng hồi quy tr&ecirc;n đồ thị v&agrave; hiển thị lại c&aacute;c điểm tr&ecirc;n đồ thị để so s&aacute;nh kết quả hồi quy:
<pre class="language-python"><code>w_0 = w[0][0]
w_1 = w[1][0]
x0 = np.linspace(0, 10, 2)
y0 = w_0 + w_1*x0

plt.plot(X.T, y.T, 'ro')
plt.plot(x0, y0)
plt.axis([0, 10, 40, 100])
plt.xlabel('Số năm')
plt.ylabel('Tỷ lệ hoạt động')
plt.show()</code></pre>
<img style="width: 600px; display: block; margin-left: auto; margin-right: auto;" src="https://tek4.vn/public_files/aa178b98-e197-45b2-ad2a-dd1ae9fb9306" alt="Huan-luyen-mo-hinh-machine-learning-dau-tien-2" />
Từ đồ thị b&ecirc;n tr&ecirc;n ta thấy rằng c&aacute;c điểm dữ liệu m&agrave;u đỏ nằm kh&aacute; gần đường thẳng dự đo&aacute;n m&agrave;u xanh. Vậy m&ocirc; h&igrave;nh Linear Regression hoạt động tốt với tập dữ liệu&nbsp;huấn luyện&nbsp;đ&atilde; cho.
Khi hoạt lực c&ograve;n $80 \%$ tức l&agrave;: $80=106.2-11.4 x$ hay $x=2.3$ năm, tức l&agrave; nếu ch&uacute;ng ta quy ước thuốc c&ograve;n tối thiểu $80 \%$ hoạt lực l&agrave; c&ograve;n hạn sử dụng th&igrave; hạn sử dụng của thuốc ở đ&acirc;y sẽ l&agrave; khoảng 2 năm.
Tiếp theo, ch&uacute;ng ta sẽ sử dụng thư viện scikit-learn của Python để t&igrave;m nghiệm v&agrave; so s&aacute;nh với kết quả theo c&ocirc;ng thức.
<pre class="language-python"><code>from sklearn import linear_model

model = linear_model.LinearRegression(fit_intercept=False)
model.fit(Xbar, y)

print( 'M&ocirc; h&igrave;nh t&iacute;nh theo sklearn: ', model.coef_ )
print( 'M&ocirc; h&igrave;nh t&iacute;nh theo c&ocirc;ng thức: ', w.T)</code></pre>
Kết quả thu được:
<pre class="language-python"><code>M&ocirc; h&igrave;nh t&iacute;nh theo sklearn: [[106.2 -11.4]]
M&ocirc; h&igrave;nh t&iacute;nh theo c&ocirc;ng thức: [[106.2 -11.4]]</code></pre>
Ch&uacute;ng ta thấy rằng hai kết quả thu được ở tr&ecirc;n l&agrave; như nhau! Hay n&oacute;i c&aacute;ch kh&aacute;c, c&aacute;c ph&acirc;n t&iacute;ch của ch&uacute;ng ta ở tr&ecirc;n l&agrave; đ&uacute;ng!
Mặc d&ugrave;, c&ograve;n kh&aacute; nhiều điều cần n&oacute;i về c&aacute;c m&ocirc; h&igrave;nh machine learning dạng hồi quy, đặc biệt l&agrave; trường hợp Hồi quy nhiều chiều hay hồi quy phi tuyến. Tuy nhi&ecirc;n, do thời lượng c&oacute; hạn cũng như mục đ&iacute;ch của b&agrave;i n&agrave;y chỉ để ch&uacute;ng ta nắm được cơ bản việc huấn luyện m&ocirc; h&igrave;nh machine learning l&agrave; như thế n&agrave;o. Do đ&oacute;, c&aacute;c vấn đề chi tiết hơn v&agrave; phức tạp hơn về Linear Regression sẽ được để gi&agrave;nh lại cho c&aacute;c b&agrave;i sau. Đến đ&acirc;y, ch&uacute;ng ta tổng kết một số điều đ&atilde; được học trong b&agrave;i n&agrave;y, đ&oacute; l&agrave;:
<ul style="text-align: justify;">
<li>C&aacute;c m&ocirc; h&igrave;nh machine learning sẽ được thu được th&ocirc;ng qua việc tối ưu h&oacute;a một h&agrave;m mục ti&ecirc;u (trong b&agrave;i ch&uacute;ng ta chọn h&agrave;m mục ti&ecirc;u c&oacute; c&ugrave;ng dạng với h&agrave;m mất m&aacute;t v&agrave; t&igrave;m c&aacute;ch cực tiểu h&oacute;a n&oacute;.</li>
<li>Việc tối ưu n&agrave;y c&oacute; thể thực hiện bằng nhiều phương ph&aacute;p kh&aacute;c nhau (đ&acirc;y l&agrave; một trong những sự kh&aacute;c biệt cơ bản của c&aacute;c thuật to&aacute;n machine learning) trong đ&oacute; phương ph&aacute;p đơn giản nhất thường được thử l&agrave; t&igrave;m c&aacute;ch giải phương tr&igrave;nh đạo h&agrave;m bằng 0.</li>
<li>Linear Regression l&agrave; một m&ocirc; h&igrave;nh đơn giản, do đ&oacute; dạng của đạo h&agrave;m (gradient) cũng như việc giải phương tr&igrave;nh đạo h&agrave;m bằng 0 cũng kh&aacute; đơn giản v&agrave; c&oacute; thể thu được c&ocirc;ng thức tường minh. Tuy v&acirc;y, trong hầu hết c&aacute;c trường hợp, ch&uacute;ng ta sẽ kh&ocirc;ng thể c&oacute; được kết quả đẹp thế n&agrave;y.&nbsp;Trong những trường hợp đ&oacute;, c&aacute;c phương ph&aacute;p tối ưu xấp xỉ kh&aacute;c được sử dụng, đại diện l&agrave; Gradient Descent hay một số phương ph&aacute;p dạng tham lam&hellip;</li>
</ul>
Nếu c&oacute; g&igrave; chưa r&otilde;, h&atilde;y để lại b&igrave;nh luận b&ecirc;n dưới hoặc tham gia nh&oacute;m hỏi đ&aacute;p của <a href="https://www.facebook.com/groups/tek4.vn">TEK4.VN</a>.
&nbsp;
<hr />
Fanpage Facebook:&nbsp;<a href="https://www.facebook.com/tek4.vn/">TEK4.VN</a>&nbsp;
Tham gia cộng đồng để chia sẻ, trao đổi v&agrave; thảo luận:&nbsp;<a href="https://www.facebook.com/groups/tek4.vn/">TEK4.VN - Học Lập Tr&igrave;nh Miễn Ph&iacute;</a>

Thuốc càng để lâu càng mất tác dụng? thực nghiệm trên Python