Lương càng cao sẽ càng hạnh phúc? Ví dụ đầu tiên về Machine Learning

<p style="text-align: justify;">Trong c&aacute;c b&agrave;i trước, ch&uacute;ng ta đ&atilde; t&igrave;m hiểu những kh&aacute;i niệm cơ bản về machine learning, tuy nhi&ecirc;n, c&oacute; lẽ đến thời điểm n&agrave;y vẫn kh&aacute; kh&oacute; khăn để bạn h&igrave;nh dung ra machine learning l&agrave; như thế n&agrave;o. Do đ&oacute;, trong b&agrave;i viết n&agrave;y để đơn giản h&oacute;a việc hiểu machine learning l&agrave; như thế n&agrave;o, ch&uacute;ng ta đi v&agrave;o v&iacute; dụ đầu ti&ecirc;n, một b&agrave;i to&aacute;n kh&aacute; đơn giản: Dự đo&aacute;n mức độ h&agrave;i l&ograve;ng với c&ocirc;ng việc.</p> <h2 id="ftoc-heading-1" class="ftwp-heading" style="text-align: justify;">B&agrave;i to&aacute;n</h2> <p style="text-align: justify;">Sau nhiều năm hoạt động, một c&ocirc;ng ty A nhận thấy rằng nh&acirc;n vi&ecirc;n của m&igrave;nh c&oacute; tỷ lệ bỏ việc kh&aacute; nhiều v&agrave; cảm nhận thấy mức độ h&agrave;i l&ograve;ng trong c&ocirc;ng việc của nh&acirc;n vi&ecirc;n l&agrave; kh&ocirc;ng cao. Trưởng ph&ograve;ng nh&acirc;n sự đề ra một giả thiết rằng c&oacute; thể do lương nh&acirc;n vi&ecirc;n trong c&ocirc;ng ty qu&aacute; thấp dẫn tới mức độ h&agrave;i l&ograve;ng với c&ocirc;ng việc thấp v&agrave; đề xuất muốn x&aacute;c định thang lương thưởng mới ph&ugrave; hợp hơn để tăng sự h&agrave;i l&ograve;ng cho nh&acirc;n vi&ecirc;n. Để tiến h&agrave;nh khảo s&aacute;t, ph&ograve;ng nh&acirc;n sự thống k&ecirc; lương của nh&acirc;n vi&ecirc;n v&agrave; đưa cho nh&acirc;n vi&ecirc;n c&aacute;c phiếu điều tra nặc danh để đ&aacute;nh gi&aacute; mức độ h&agrave;i l&ograve;ng của họ với c&ocirc;ng việc. Mức độ h&agrave;i l&ograve;ng n&agrave;y được đ&aacute;nh gi&aacute; tr&ecirc;n thang điểm từ 1 đến 100 tương ứng với mức độ h&agrave;i l&ograve;ng của nh&acirc;n vi&ecirc;n đối với c&ocirc;ng việc. Sau khi thu thập, dữ liệu thu được tương ứng được đưa ra trong h&igrave;nh vẽ sau:</p> <p><img style="width: 100%; display: block; margin-left: auto; margin-right: auto;" src="../../../public_files/5f6a8ff5-f44c-4588-962c-ce0fb1860fce" alt="Du-lieu-dieu-tra-1024x670" /></p> <p style="text-align: justify;">Trong b&agrave;i to&aacute;n n&agrave;y, ch&uacute;ng ta thấy rằng: nhiệm vụ T của ch&uacute;ng ta ở đ&acirc;y l&agrave; dự đo&aacute;n mức độ h&agrave;i l&ograve;ng của nh&acirc;n vi&ecirc;n dựa tr&ecirc;n mức lương, đ&acirc;y l&agrave; một b&agrave;i to&aacute;n hồi quy. Trải nghiệm E l&agrave; khảo s&aacute;t về mức lương v&agrave; mức độ h&agrave;i l&ograve;ng tương ứng được cho trong H&igrave;nh vẽ tr&ecirc;n, v&agrave; độ đo P ở đ&acirc;y l&agrave; dự đo&aacute;n sai lệch nhỏ nhất. Tức l&agrave; từ những dữ liệu E đ&atilde; cho l&agrave;m thế n&agrave;o để x&acirc;y dựng được một m&ocirc; h&igrave;nh hồi quy dự đo&aacute;n mức độ h&agrave;i l&ograve;ng với c&ocirc;ng việc theo mức lương sao cho kết quả dự đo&aacute;n sai lệch &iacute;t nhất với thực tế.</p> <h2 id="ftoc-heading-2" class="ftwp-heading" style="text-align: justify;">Một số lưu &yacute;</h2> <p style="text-align: justify;">Đầu ti&ecirc;n, khi nh&igrave;n v&agrave;o bảng dữ liệu tr&ecirc;n ta thấy rằng dữ liệu được ph&acirc;n bố với một ch&uacute;t nhiễu. Do đ&oacute;, kể cả khi ch&uacute;ng ta c&oacute; t&igrave;m được một quy luật biểu thị quan hệ của dữ liệu n&agrave;y (chẳng hạn mức độ h&agrave;i l&ograve;ng tỷ lệ thuận với mức lương) th&igrave; quy luật n&agrave;y cũng kh&ocirc;ng thể đ&uacute;ng với 100% dữ liệu (với dữ liệu chưa được quan s&aacute;t). Điều n&agrave;y đ&uacute;ng với mọi b&agrave;i to&aacute;n machine learning tr&ecirc;n thực tế, bởi nhiễu l&agrave; thứ lu&ocirc;n lu&ocirc;n tồn tại trong dữ liệu v&agrave; việc dự đo&aacute;n một m&ocirc; h&igrave;nh đ&uacute;ng với 100% dữ liệu thực tế l&agrave; điều kh&ocirc;ng thể. Ch&uacute;ng ta chỉ c&oacute; thể l&agrave;m cho n&oacute; đ&uacute;ng 100% tr&ecirc;n dữ liệu huấn luyện bằng c&aacute;ch t&igrave;m một h&agrave;m đa thức xấp xỉ đi qua to&agrave;n bộ dữ liệu, nhưng đ&acirc;y kh&ocirc;ng phải l&agrave; điều ch&uacute;ng ta cần trong machine learning m&agrave; đ&oacute; l&agrave; c&ocirc;ng việc của giải t&iacute;ch học. Với machine learning ch&uacute;ng ta muốn x&acirc;y dựng một m&ocirc; h&igrave;nh c&oacute; thể dự đo&aacute;n được c&aacute;c gi&aacute; trị chưa được quan s&aacute;t chứ kh&ocirc;ng phải l&agrave; nhớ to&agrave;n bộ dữ liệu (học vẹt) nhưng lại l&agrave;m sai to&eacute;t tr&ecirc;n dữ liệu chưa thấy.</p> <p style="text-align: justify;">Về mặt cơ bản, ch&uacute;ng ta nhắc lại c&acirc;u n&oacute;i của nh&agrave; to&aacute;n học v&agrave; thống k&ecirc; học nổi tiếng&nbsp;<a href="https://en.wikipedia.org/wiki/George_E._P._Box" rel="noopener noreferrer">George E. P. Box</a>&nbsp;&ldquo;t&acirc;t cả c&aacute;c m&ocirc; h&igrave;nh đều sai, nhưng một số th&igrave; hữu dụng&rdquo;.</p> <p style="text-align: justify;">V&agrave; mục ti&ecirc;u của machine learning l&agrave; t&igrave;m ra c&aacute;c m&ocirc; h&igrave;nh &ldquo;hữu dụng&rdquo; đủ tốt n&agrave;y chứ kh&ocirc;ng phải l&agrave; một m&ocirc; h&igrave;nh &ldquo;ho&agrave;n hảo&rdquo; tr&ecirc;n to&agrave;n bộ dữ liệu huấn luyện.</p> <div class="pop_out_box is-full_width is-big" style="text-align: justify;">Học m&aacute;y chủ yếu dựa tr&ecirc;n số liệu thống k&ecirc;. Để m&aacute;y c&oacute; thể học được, ch&uacute;ng ta phải cung cấp cho n&oacute; c&aacute;c mẫu ngẫu nhi&ecirc;n c&oacute; &yacute; nghĩa thống k&ecirc; l&agrave;m dữ liệu chuẩn để huấn luyện. Ở đ&acirc;y ch&uacute;ng ta c&oacute; 2 kh&iacute;a cạnh cần quan t&acirc;m đ&oacute; l&agrave; t&iacute;nh &ldquo;ngẫu nhi&ecirc;n&rdquo; c&oacute; nghĩa l&agrave; n&oacute; kh&ocirc;ng bị điều khiển hoặc can thiệp v&agrave; thứ hai đ&oacute; l&agrave; n&oacute; phải c&oacute; &yacute; nghĩa thống k&ecirc;, tức l&agrave; c&oacute; thể đại diện được cho to&agrave;n bộ ph&acirc;n phối tr&ecirc;n thực tế của dữ liệu trong b&agrave;i to&aacute;n. V&iacute; dụ: việc cố gắng dự đo&aacute;n sự h&agrave;i l&ograve;ng của to&agrave;n c&ocirc;ng ty chỉ dựa tr&ecirc;n dữ liệu từ ban quản l&yacute; cấp tr&ecirc;n c&oacute; thể dễ dẫn đến sai s&oacute;t bởi dữ liệu từ ban quản l&yacute; kh&ocirc;ng thể đại diện cho to&agrave;n bộ c&aacute;c nh&acirc;n vi&ecirc;n trong c&ocirc;ng ty. Ngo&agrave;i ra, nếu tập huấn luyện qu&aacute; nhỏ, th&igrave; theo luật số lớn ch&uacute;ng ta cũng sẽ kh&ocirc;ng học được đầy đủ quan hệ trong dữ liệu v&agrave; thậm ch&iacute; c&oacute; thể đưa ra c&aacute;c kết luận kh&ocirc;ng ch&iacute;nh x&aacute;c. Chẳng hạn chỉ lấy &yacute; kiến từ một số th&agrave;nh vi&ecirc;n ngẫu nhi&ecirc;n (khoảng 10 người) th&igrave; kết quả dự đo&aacute;n cũng c&oacute; thể bị thi&ecirc;n lệch hoặc kh&ocirc;ng ch&iacute;nh x&aacute;c.</div> <div style="text-align: justify;">Từ những lưu &yacute; tr&ecirc;n, ch&uacute;ng ta x&acirc;y dựng m&ocirc; h&igrave;nh dự đo&aacute;n cho dữ liệu tr&ecirc;n như phần dưới đ&acirc;y.</div> <h2 id="ftoc-heading-3" class="ftwp-heading" style="text-align: justify;">X&acirc;y dựng m&ocirc; h&igrave;nh dự đo&aacute;n mức độ h&agrave;i l&ograve;ng với c&ocirc;ng việc dựa tr&ecirc;n mức lương</h2> <p style="text-align: justify;">Đầu ti&ecirc;n, ch&uacute;ng ta thấy rằng, từ dữ liệu, ch&uacute;ng ta c&oacute; thể dự đo&aacute;n rằng mức lương c&oacute; tỷ lệ thuận với mức độ h&agrave;i l&ograve;ng trong c&ocirc;ng việc. Như vậy, ch&uacute;ng ta sẽ cố gắng t&igrave;m ra một quan hệ tuyến t&iacute;nh để dự đo&aacute;n mức độ h&agrave;i l&ograve;ng với c&ocirc;ng việc th&ocirc;ng qua lương. Gọi $x$ l&agrave; mức lương m&agrave; nh&acirc;n vi&ecirc;n được nhận v&agrave; $y$ l&agrave; mức độ h&agrave;i l&ograve;ng với c&ocirc;ng việc của anh ta. Mục ti&ecirc;u của ch&uacute;ng ta l&agrave; t&igrave;m được một h&agrave;m dự đo&aacute;n $y=f(x)$ để t&iacute;nh được mức độ h&agrave;i l&ograve;ng trong c&ocirc;ng việc của nh&acirc;n vi&ecirc;n theo mức lương. Như nhận x&eacute;t ở tr&ecirc;n, giả sử rằng h&agrave;m $f$ c&oacute; dạng tuyến t&iacute;nh, tức l&agrave;:<span id="MathJax-Element-3-Frame" class="MathJax" tabindex="0"><span id="MathJax-Span-7" class="math"></span></span></p> <p style="text-align: center;">$f(x)=m_{1} \times x+m_{0}$</p> <p style="text-align: justify;">Khi đ&oacute;, mục ti&ecirc;u của ch&uacute;ng ta l&agrave; phải t&igrave;m được gi&aacute; trị $m_{1}$ v&agrave; $m_{0}$ đủ tốt để dự đo&aacute;n.</p> <p style="text-align: justify;">Đ&acirc;y l&agrave; mục ti&ecirc;u của machine learning hay cụ thể hơn l&agrave; c&aacute;c m&ocirc; h&igrave;nh hồi quy. Tuy nhi&ecirc;n, tạm thời ch&uacute;ng ta chưa quan t&acirc;m đến c&aacute;c kiến thức cao si&ecirc;u ở đ&acirc;y v&agrave; cũng chưa biết l&agrave;m thế n&agrave;o để x&acirc;y dựng một m&ocirc; h&igrave;nh hồi quy tốt. Thế th&igrave;, ch&uacute;ng ta đầu ti&ecirc;n giả sử khởi tạo một gi&aacute; trị bất kỳ cho $m_{1}$ v&agrave; $m_{0}$, gi&agrave; sử, $m_{1}=0.2$ v&agrave; $m_{0}=12$, ta c&oacute;:</p> <p style="text-align: center;">$f(x)=0.2 \times x+12$</p> <p style="text-align: justify;"><img style="width: 100%;" src="../../../public_files/f0a6f668-bec8-4e03-97ea-6f74b57fea33" alt="Hoi-quy-tuyen-tinh-1-768x502" /></p> <p style="text-align: justify;">Nh&igrave;n c&oacute; vẻ kh&aacute; lệch. V&agrave; nếu ch&uacute;ng ta sử dụng m&ocirc; h&igrave;nh n&agrave;y để dự đo&aacute;n mức độ h&agrave;i l&ograve;ng của một nh&acirc;n vi&ecirc;n c&oacute; mức lương 60 triệu đồng th&igrave; ch&uacute;ng ta sẽ thu được mức độ h&agrave;i l&ograve;ng của anh ta l&agrave; 27 (tương đối thấp), trong khi nh&igrave;n v&agrave;o dữ liệu ch&uacute;ng ta thấy rằng với mức lương n&agrave;y th&igrave; mức độ h&agrave;i l&ograve;ng &iacute;t nhất cũng phải lớn gấp đ&ocirc;i.</p> <p style="text-align: justify;">Kết quả dự đo&aacute;n kh&aacute; tệ v&agrave; m&ocirc; h&igrave;nh kh&ocirc;ng đủ tốt. Nếu ch&uacute;ng ta t&iacute;nh trung b&igrave;nh c&aacute;c gi&aacute; trị sai lệch của dự đo&aacute;n so với thực tế của to&agrave;n bộ dữ liệu th&igrave; n&oacute; sẽ cho một con số rất lớn.</p> <p style="text-align: justify;">Do đ&oacute;, b&acirc;y giờ ch&uacute;ng ta cần đưa ra một m&ocirc; h&igrave;nh dự đo&aacute;n tốt hơn. Bằng một c&aacute;ch n&agrave;o đ&oacute;, ch&uacute;ng ta c&oacute; thể thu được m&ocirc; h&igrave;nh như sau:</p> <p style="text-align: center;">$f(x)=0.6 \times x+13.1$</p> <p style="text-align: justify;"><img style="width: 100%;" src="../../../public_files/10f6573d-b6e4-47fc-b68e-bc3d53d96832" alt="Hoi-quy-tuyen-tinh-3-768x502" /></p> <p style="text-align: justify;">R&otilde; r&agrave;ng nh&igrave;n tr&ecirc;n đồ thị dữ liệu, ch&uacute;ng ta c&oacute; thể thấy m&ocirc; h&igrave;nh n&agrave;y tốt hơn rất nhiều so với m&ocirc; h&igrave;nh trước đ&oacute;. Sự sai lệch giảm đi r&otilde; rệt. V&agrave; nếu thử nhiều trường hợp hơn, ch&uacute;ng ta c&oacute; thể thu được nhiều m&ocirc; h&igrave;nh kh&aacute;c như dưới đ&acirc;y:</p> <p style="text-align: justify;"><img style="width: 100%;" src="../../../public_files/1296a06d-3669-4cc1-9db3-69ca39ce6e9a" alt="Hoi-quy-tuyen-tinh-4-768x502" /></p> <p style="text-align: justify;">V&agrave;, m&ocirc; h&igrave;nh cuối c&ugrave;ng cho sai số &iacute;t nhất l&agrave;:</p> <p style="text-align: center;">$f(x)=0.75 \times x+15.54$</p> <p style="text-align: justify;"><img style="width: 100%;" src="../../../public_files/3abd1188-11de-4e86-a046-738b5a66c1d3" alt="Hoi-quy-tuyen-tinh-2-768x502" /></p> <p style="text-align: justify;">Nh&igrave;n c&oacute; khả kh&aacute; l&agrave; &ldquo;kỳ diệu&rdquo; v&agrave; kh&oacute; hiểu phải kh&ocirc;ng ạ? C&oacute; v&ocirc; số c&aacute;c trường hợp của tham số trong m&ocirc; hinh, kh&ocirc;ng lẽ ch&uacute;ng ta phải thử to&agrave;n bộ c&aacute;c tham số n&agrave;y (tất nhi&ecirc;n l&agrave; kh&ocirc;ng thể). Vậy ch&uacute;ng ta l&agrave;m như thế n&agrave;o? L&agrave;m sao để ch&uacute;ng ta c&oacute; thể t&iacute;nh được c&aacute;c hệ số $m_{1}, m_{0}$ ph&ugrave; hợp cho m&ocirc; h&igrave;nh như ở v&iacute; dụ tr&ecirc;n l&agrave; $0.75$ v&agrave; $15.54 ?$</p> <h2 id="ftoc-heading-4" class="ftwp-heading" style="text-align: justify;">Tổng quan về h&agrave;m mất m&aacute;t (Loss function)</h2> <p style="text-align: justify;">Ở v&iacute; dụ tr&ecirc;n, ch&uacute;ng ta thấy rằng để t&igrave;m được tham số cho m&ocirc; h&igrave;nh $f(x)$, ch&uacute;ng ta đều x&eacute;t đến một điều kiện, đ&oacute; l&agrave; sai số của việc dự đo&aacute;n phải thấp (v&agrave; c&agrave;ng thấp c&agrave;ng tốt). Đ&acirc;y l&agrave; cơ sở cho c&aacute;c thuật to&aacute;n machine learning. Chẳng hạn, nếu mức độ h&agrave;i l&ograve;ng thực sự của nh&acirc;n vi&ecirc;n A l&agrave; 60 nhưng m&ocirc; h&igrave;nh 1 của ch&uacute;ng ta lại dự đo&aacute;n l&agrave; 40 th&igrave; sai số của việc dự đo&aacute;n l&agrave; 20, c&ograve;n m&ocirc; h&igrave;nh 2 dự đo&aacute;n l&agrave; 55 th&igrave; sai số dự đo&aacute;n chỉ l&agrave; 5 (v&agrave; tất nhi&ecirc;n tốt hơn m&ocirc; h&igrave;nh 1). Để kết quả dự đo&aacute;n tốt nhất th&ocirc;ng thường ch&uacute;ng ta cần t&iacute;nh một đại lượng gọi l&agrave; lỗi dự đo&aacute;n trung b&igrave;nh tr&ecirc;n to&agrave;n bộ tập huấn luyện, v&agrave; mục ti&ecirc;u của c&aacute;c thuật to&aacute;n machine learning l&agrave; l&agrave;m thế n&agrave;o để lỗi dự đo&aacute;n trung b&igrave;nh n&agrave;y l&agrave; thấp nhất.</p> <p style="text-align: justify;">Đến đ&acirc;y, ch&uacute;ng ta lại bắt đầu c&oacute; một vấn đề kh&oacute; khăn, uh th&igrave; muốn t&igrave;m gi&aacute; trị thấp nhất của lỗi trung b&igrave;nh nhưng m&agrave; t&igrave;m như thế n&agrave;o? Ch&uacute;ng ta chẳng thể n&agrave;o v&eacute;t cạn v&agrave; thử to&agrave;n bộ c&aacute;c gi&aacute; trị của m&ocirc; h&igrave;nh được phải kh&ocirc;ng?</p> <p style="text-align: justify;">Để giải đ&aacute;p cho vấn đề n&agrave;y, sức mạnh của c&aacute;c c&ocirc;ng cụ to&aacute;n học được thể hiện. Ch&uacute;ng ta quay lại b&agrave;i to&aacute;n m&agrave; ch&uacute;ng ta vẫn hay l&agrave;m ở cấp 3 đ&oacute; l&agrave; khảo s&aacute;t v&agrave; t&igrave;m cực trị của h&agrave;m số. Chẳng hạn ch&uacute;ng ta biết rằng cực trị của h&agrave;m số $x^{2}+2$ l&agrave; 2 đạt tại điểm $x=0$ th&ocirc;ng qua c&aacute;c c&ocirc;ng cụ to&aacute;n học (đạo h&agrave;m bằng 0). Điều n&agrave;y dẫn đến một điều rằng:<span id="MathJax-Element-17-Frame" class="MathJax" tabindex="0"><span id="MathJax-Span-119" class="math"><span id="MathJax-Span-120" class="mrow"><span id="MathJax-Span-121" class="msubsup"></span></span></span></span></p> <p style="text-align: justify;"><span style="color: #f1c40f;"><em>"Nếu ch&uacute;ng ta c&oacute; thể m&ocirc; h&igrave;nh h&oacute;a c&aacute;c lỗi trung b&igrave;nh của việc dự đo&aacute;n th&agrave;nh dạng một h&agrave;m số th&igrave; ch&uacute;ng ta ho&agrave;n to&agrave;n c&oacute; thể t&igrave;m được c&aacute;c gi&aacute; trị tham số để tối ưu h&agrave;m số đ&oacute;, tức l&agrave; t&igrave;m được c&aacute;c gi&aacute; trị để cho h&agrave;m số đạt gi&aacute; trị nhỏ nhất, hay lỗi dự đo&aacute;n l&agrave; nhỏ nhất tr&ecirc;n tập huấn luyện. Kết quả n&agrave;y ch&iacute;nh l&agrave; m&ocirc; h&igrave;nh ch&uacute;ng ta cần x&acirc;y dựng v&agrave; qu&aacute; tr&igrave;nh để t&igrave;m nghiệm n&agrave;y được gọi l&agrave; qu&aacute; tr&igrave;nh huấn luyện m&ocirc; h&igrave;nh."</em></span></p> <p style="text-align: justify;">C&aacute;c h&agrave;m số đại diện cho lỗi dự đo&aacute;n trung b&igrave;nh n&agrave;y được gọi l&agrave; c&aacute;c h&agrave;m mất m&aacute;t (loss function hay c&ograve;n gọi l&agrave; h&agrave;m phạt), thể hiện mức độ dự đo&aacute;n sai của m&ocirc; h&igrave;nh so với dữ liệu huấn luyện. N&oacute; thường được suy ra từ độ đo P v&agrave; bổ sung th&ecirc;m một số suy luận, biến đổi để h&agrave;m số n&agrave;y trở l&ecirc;n dễ tối ưu (tức l&agrave; h&agrave;m trơn, c&oacute; đạo h&agrave;m, lồi v&agrave; c&oacute; nghiệm tối ưu c&agrave;ng dễ t&igrave;m c&agrave;ng tốt).</p> <p style="text-align: justify;">Với nguy&ecirc;n tắc n&agrave;y, quay lại v&iacute; dụ tr&ecirc;n ta c&oacute; thể x&acirc;y dựng một h&agrave;m mất m&aacute;t (loss function) c&oacute; dạng l&agrave; h&agrave;m&nbsp;<a href="https://en.wikipedia.org/wiki/Linear_least_squares_(mathematics)" rel="noopener noreferrer">b&igrave;nh phương (linear least squares function</a>):</p> <p style="text-align: center;">$\mathcal{L}\left(m_{0}, m_{1}\right)=\frac{1}{2 m} \sum_{i=1}^{m}\left(f\left(x_{i}, m_{0}, m_{1}\right)-y\right)^{2}$</p> <p style="text-align: justify;">trong đ&oacute; $f\left(x_{i}, m_{0}, m_{1}\right)$ &nbsp;l&agrave; gi&aacute; trị dự đo&aacute;n của m&ocirc; h&igrave;nh c&oacute; tham số $m_{0}, m_{1}$ đối với gi&aacute; trị đầu v&agrave;o l&agrave; $x_{i}$.&nbsp;Sai số dự đo&aacute;n được t&iacute;nh tr&ecirc;n to&agrave;n bộ tập dữ liệu huấn luyện gồm $m$ điểm dữ liệu đầu v&agrave;o v&agrave; lấy trung b&igrave;nh sai số bằng c&aacute;ch chia n&oacute; cho $m$. Để tr&aacute;nh t&igrave;nh trạng sai số tr&ecirc;n v&agrave; sai số dưới triệt ti&ecirc;u cho nhau, chẳng hạn gi&aacute; trị thật l&agrave; 50, dự đo&aacute;n thứ nhất l&agrave; 45 dự đo&aacute;n thứ 2 l&agrave; 55, th&igrave; nếu kh&ocirc;ng c&oacute; h&agrave;m b&igrave;nh phương cường độ th&igrave; tổng của hai sai số n&agrave;y triệt ti&ecirc;u về 0, mặc d&ugrave; đ&uacute;ng ra n&oacute; phải l&agrave; 10 đơn vị. H&agrave;m b&igrave;nh phương gi&uacute;p giải quyết vấn đề n&agrave;y v&agrave; n&acirc;ng cao cường độ sai nhằm &ldquo;phạt nặng&rdquo; c&aacute;c dự đo&aacute;n c&oacute; sai số lớn. Ngo&agrave;i ra n&oacute; cũng gi&uacute;p cho h&agrave;m trơn v&agrave; c&oacute; thể t&iacute;nh được đạo h&agrave;m v&agrave; điểm cực tiểu dễ d&agrave;ng. Lưu &yacute; số 2 ở dưới mẫu ở phần $2m$ để triệt ti&ecirc;u số 2 ở mũ khi đạo h&agrave;m xuống gi&uacute;p việc t&iacute;nh to&aacute;n dễ d&agrave;ng hơn. Ch&uacute;ng ta c&oacute; thể bỏ n&oacute; đi m&agrave; kh&ocirc;ng c&oacute; ảnh hưởng đến kết quả.</p> <p style="text-align: justify;">N&oacute;i t&oacute;m lại, việc huấn luyện c&aacute;c m&ocirc; h&igrave;nh machine learning đều đưa về việc tối ưu h&oacute;a một h&agrave;m n&agrave;o đ&oacute;, trong trường hợp tr&ecirc;n l&agrave; h&agrave;m loss function. Ch&uacute;ng ta sẽ quay lại c&aacute;c h&agrave;m loss function chi tiết hơn ở b&agrave;i viết sau. C&ograve;n đến đ&acirc;y ch&uacute;ng ta tạm dừng v&iacute; dụ n&agrave;y ở đ&acirc;y. Trong b&agrave;i viết n&agrave;y về cơ bản ch&uacute;ng ta đ&atilde; biết được machine learning h&igrave;nh th&ugrave; n&oacute; ra l&agrave;m sao trong thực tế. C&oacute; vẻ kh&ocirc;ng c&oacute; g&igrave; kh&oacute; khăn phải kh&ocirc;ng ạ.</p> <p style="text-align: justify;">&nbsp;</p> <hr /> <p style="text-align: center;"><em><strong>Fanpage Facebook:</strong>&nbsp;<a href="https://www.facebook.com/tek4.vn/">TEK4.VN</a></em>&nbsp;</p> <p style="text-align: center;"><em><strong>Tham gia cộng đồng để chia sẻ, trao đổi v&agrave; thảo luận:</strong>&nbsp;<a href="https://www.facebook.com/groups/tek4.vn/">TEK4.VN - Học Lập Tr&igrave;nh Miễn Ph&iacute;</a></em></p>