Phân lớp, hồi quy và các bài toán thường gặp trong Machine Learning

<p style="text-align: justify;">Machine learning task &ndash; nhiệm vụ T trong học m&aacute;y l&agrave; khả năng thực hiện một t&aacute;c vụ phức tạp cho trước của m&ocirc; h&igrave;nh học m&aacute;y sau qu&aacute; tr&igrave;nh huấn luyện. Robot c&oacute; nhiệm vụ l&agrave; chạy đ&uacute;ng tuyến đường, tr&aacute;nh chướng ngại vật, th&igrave; việc chạy n&agrave;y l&agrave; một nhiệm vụ. Việc ph&acirc;n loại tin nhắn r&aacute;c v&agrave; tin nhắn th&ocirc;ng thường, ph&aacute;t hiện v&agrave; nhận dạng biển b&aacute;o giao th&ocirc;ng, chuyển đổi văn bản viết tay th&agrave;nh dạng văn bản tr&ecirc;n m&aacute;y t&iacute;nh, dịch văn bản từ&nbsp;<a href="https://translate.google.com/">tiếng Anh sang tiếng Việt</a>&nbsp;v&agrave; ngược lại,&hellip; cũng đều được coi l&agrave; c&aacute;c nhiệm vụ. Về cơ bản, ch&uacute;ng ta c&oacute; thể viết c&aacute;c chương tr&igrave;nh c&oacute; khả năng tự học để thực hiện c&aacute;c nhiệm vụ n&agrave;y, hoặc cũng c&oacute; thể lập tr&igrave;nh trực tiếp một chương tr&igrave;nh thực hiện n&oacute; từng bước một c&aacute;ch thủ c&ocirc;ng. Khi chương tr&igrave;nh c&oacute; khả năng tự học c&aacute;c nhiệm vụ tr&ecirc;n th&igrave; c&aacute;c nhiệm vụ được coi l&agrave; nhiệm vụ T trong machine learning. C&aacute;c nhiệm vụ trong machine learning dựa tr&ecirc;n c&aacute;c mẫu trong dữ liệu hơn l&agrave; việc được lập tr&igrave;nh ch&iacute;nh x&aacute;c trực tiếp.</p> <p style="text-align: justify;">C&oacute; mu&ocirc;n h&igrave;nh vạn trạng c&aacute;c machine learning task m&agrave; người ta c&oacute; thể nghĩ ra được, xuất ph&aacute;t từ c&aacute;c b&agrave;i to&aacute;n cũng như khả năng thực tế của con người. Trong b&agrave;i viết n&agrave;y, ch&uacute;ng ta sẽ c&ugrave;ng t&igrave;m hiểu về một số dạng nhiệm vụ T phổ biến được sử dụng trong thực tế như: ph&acirc;n lớp, ph&acirc;n cụm, hồi quy, dịch m&aacute;y, tổng hợp v&agrave; lấy mẫu dữ liệu&hellip;Khi bạn nắm được b&agrave;i to&aacute;n bạn đang xử l&yacute; l&agrave; g&igrave;, khi đ&oacute; bạn c&oacute; thể lựa chọn c&aacute;c thuật to&aacute;n v&agrave; m&ocirc; h&igrave;nh ph&ugrave; hợp cho n&oacute; nhằm thu được hiệu quả tốt nhất. Dưới d&acirc;y, ch&uacute;ng ta sẽ t&igrave;m hiểu một số dạng nhiệm vụ T cụ thể sau:</p> <h2 id="ftoc-heading-1" class="ftwp-heading" style="text-align: justify;">Ph&acirc;n lớp</h2> <p style="text-align: justify;">B&agrave;i to&aacute;n ph&acirc;n lớp l&agrave; b&agrave;i to&aacute;n phổ biến v&agrave; tự nhi&ecirc;n nhất trong thực tế. Ch&uacute;ng ta thấy rằng, từ khi con người tồn tại tr&ecirc;n thế giới th&igrave; việc ph&acirc;n loại c&aacute;c sự vật, hiện tượng đ&atilde; lu&ocirc;n l&agrave; một trong những nhu cầu phổ biến v&agrave; cấp b&aacute;ch. L&agrave; một người nguy&ecirc;n thủy, ch&uacute;ng ta muốn ph&acirc;n loại loại thực vật n&agrave;o c&oacute; thể ăn, loại n&agrave;o kh&ocirc;ng thể ăn, đ&acirc;u l&agrave; đồng bạn, đ&acirc;u l&agrave; sử tử, đ&acirc;u l&agrave; hươu&hellip; Nhu cầu n&agrave;y vẫn tồn tại v&agrave; ng&agrave;y c&agrave;ng mở rộng cho đến ng&agrave;y nay. Trong dạng nhiệm vụ n&agrave;y, m&ocirc; h&igrave;nh học m&aacute;y cần thực hiện một t&aacute;c vụ ph&acirc;n lớp, đầu v&agrave;o nhận được v&agrave;o một trong $<span id="MathJax-Element-1-Frame" class="MathJax" tabindex="0"><span id="MathJax-Span-1" class="math"><span id="MathJax-Span-2" class="mrow"><span id="MathJax-Span-3" class="mi">k$</span></span></span></span> loại đối tượng c&oacute; sẵn. Chẳng hạn ph&acirc;n lớp thư r&aacute;c v&agrave; thư b&igrave;nh thường, tệp tin l&agrave; m&atilde; độc hay kh&ocirc;ng phải m&atilde; độc, v&agrave; thậm ch&iacute; l&agrave; tệp tin thuộc loại file g&igrave;, virus, trojan, worm, hay file sạch,&hellip; Để giải quyết b&agrave;i to&aacute;n n&agrave;y, thuật to&aacute;n học m&aacute;y thường cần tạo ra một h&agrave;m xấp xỉ $f: \mathbb{R}^{n} \mapsto 1, \ldots, k$. Khi đ&oacute;, m&ocirc; h&igrave;nh c&oacute; thể đưa ra dự đo&aacute;n về ph&acirc;n lớp $y=f(x)$ dựa tr&ecirc;n đầu v&agrave;o $x$.<span id="MathJax-Element-2-Frame" class="MathJax" tabindex="0"><span id="MathJax-Span-4" class="math"></span></span></p> <p style="text-align: justify;"><img style="width: 100%;" src="../../../public_files/1cfe280b-d298-4ea9-b5e7-50364cb96523" alt="Phan-lop-768x384" /></p> <p style="text-align: justify;">Trường hợp đặc biệt, khi ch&uacute;ng ta muốn ph&acirc;n lớp giữa hai lớp chẳng hạn như m&atilde; độc v&agrave; kh&ocirc;ng độc, tấn c&ocirc;ng v&agrave; kh&ocirc;ng tấn c&ocirc;ng, email spam v&agrave; email sạch, ch&oacute; v&agrave; m&egrave;o, bị bệnh hay kh&ocirc;ng bị bệnh, bức ảnh c&oacute; chứa ch&oacute; hay kh&ocirc;ng&hellip; th&igrave; ch&uacute;ng ta gọi đ&acirc;y l&agrave; trường hợp&nbsp;<strong>ph&acirc;n lớp nhị ph&acirc;n</strong>, khi số lớp lớn hơn 2 ta gọi b&agrave;i to&aacute;n l&agrave;&nbsp;<strong>ph&acirc;n lớp đa lớp</strong>&nbsp;chẳng hạn:</p> <ul style="text-align: justify;"> <li>X&aacute;c định loại ch&oacute; ở trong ảnh l&agrave; &ldquo;Siberian Husky&rdquo;, &ldquo;Golden Retriever&rdquo;, &ldquo;Poodle&rdquo;, &hellip;</li> <li>Ph&acirc;n lớp c&aacute;c b&igrave;nh luận về sản phẩm theo mức độ cảm x&uacute;c &ldquo;t&iacute;ch cực&rdquo;, &ldquo;trung t&iacute;nh&rdquo;, hay &ldquo;ti&ecirc;u cực&rdquo;.</li> <li>Ph&acirc;n lớp g&oacute;i tin theo loại tấn c&ocirc;ng: DDoS, SQL Injection, XSS,..</li> </ul> <p style="text-align: justify;">Ngo&agrave;i c&aacute;c dạng b&agrave;i to&aacute;n kinh điển tr&ecirc;n, c&ograve;n một số dạng biến thể kh&aacute;c của b&agrave;i to&aacute;n ph&acirc;n lớp, trong đ&oacute;, thay v&igrave; trả ra gi&aacute; trị nh&atilde;n đầu ra, m&ocirc; h&igrave;nh sẽ trả ra c&aacute;c x&aacute;c suất tương ứng cho việc ph&acirc;n lớp, chẳng hạn c&oacute; 90% l&agrave; ch&oacute;, 10% l&agrave; m&egrave;o&hellip;</p> <h2 id="ftoc-heading-2" class="ftwp-heading" style="text-align: justify;">Hồi quy</h2> <p style="text-align: justify;">Hồi quy l&agrave; một dạng machine learning task, trong đ&oacute; chương tr&igrave;nh m&aacute;y t&iacute;nh được y&ecirc;u cầu thực hiện việc dự đo&aacute;n một gi&aacute; trị số từ đầu v&agrave;o cho trước. Mục ti&ecirc;u của b&agrave;i to&aacute;n hồi quy v&agrave; dự đo&aacute;n một gi&aacute; trị của một biến phụ thuộc v&agrave;o gi&aacute; trị của c&aacute;c thuộc t&iacute;nh độc lập cho trước. Chẳng hạn dự b&aacute;o doanh số kinh doanh th&aacute;ng 11 dựa tr&ecirc;n chi ph&iacute; marketing th&aacute;ng 10, dự đo&aacute;n mức thu nhập của một người dựa tr&ecirc;n học vấn, qu&ecirc; qu&aacute;n, độ tuổi v&agrave; c&ocirc;ng việc của anh ta, dự đo&aacute;n gi&aacute; của một ng&ocirc;i nh&agrave; dựa tr&ecirc;n diện t&iacute;ch v&agrave; vị tr&iacute;,&hellip; Để giải quyết b&agrave;i to&aacute;n n&agrave;y, thuật to&aacute;n học m&aacute;y thường cần t&igrave;m ra một h&agrave;m&nbsp;<span id="MathJax-Element-5-Frame" class="MathJax" tabindex="0"><span id="MathJax-Span-32" class="math"></span></span>$f: \mathbb{R}^{n} \rightarrow \mathbb{R}$. Nhiệm vụ n&agrave;y rất tương tự như nhiệm vụ ph&acirc;n lớp ở tr&ecirc;n, ngoại trừ sự kh&aacute;c biệt của định dạng của đầu ra. M&ocirc; h&igrave;nh ph&acirc;n lớp cho đầu ra l&agrave; c&aacute;c lớp rời rạc, c&ograve;n m&ocirc; h&igrave;nh hồi quy cho đầu ra l&agrave; c&aacute;c gi&aacute; trị dựa đo&aacute;n li&ecirc;n tục.</p> <p><img style="width: 860px; display: block; margin-left: auto; margin-right: auto;" src="../../../public_files/ce865659-93e9-4f9a-a9b8-3e95dac9a1bc" alt="Hoi-quy" height="341" /></p> <h2 id="ftoc-heading-3" class="ftwp-heading" style="text-align: justify;">Ph&acirc;n cụm</h2> <p style="text-align: justify;">Ph&acirc;n cụm l&agrave; một b&agrave;i to&aacute;n l&agrave;m việc tr&ecirc;n dữ liệu kh&ocirc;ng cần g&aacute;n nh&atilde;n (unsupervised learning) được sử dụng để nh&oacute;m c&aacute;c đối tượng dữ liệu th&agrave;nh c&aacute;c cụm c&oacute; c&aacute;c t&iacute;nh chất tương đồng. Việc ph&acirc;n cụm cũng c&oacute; thể được sử dụng để t&igrave;m ra c&aacute;c mối quan hệ ẩn trong bộ dữ liệu m&agrave; kh&ocirc;ng thể thực hiện được bằng c&aacute;c logic th&ocirc;ng thường hoặc dựa tr&ecirc;n c&aacute;c quan s&aacute;t đơn giản. Đầu v&agrave;o v&agrave; đầu ra của c&aacute;c thuật to&aacute;n ph&acirc;n cụm dựa tr&ecirc;n phương ph&aacute;p ph&acirc;n cụm được lựa chọn. C&aacute;c phương ph&aacute;p ph&acirc;n cụm c&oacute; thể dựa tr&ecirc;n ph&acirc;n phối, dựa tr&ecirc;n khoảng c&aacute;ch, dựa tr&ecirc;n tương quan hoặc dựa tr&ecirc;n mật độ. Một số v&iacute; dụ về b&agrave;i to&aacute;n ph&acirc;n cụm c&oacute; thể kể đến như:</p> <ul style="text-align: justify;"> <li>Ph&acirc;n nh&oacute;m c&aacute;c kh&aacute;ch h&agrave;ng dựa tr&ecirc;n sở th&iacute;ch v&agrave; đặc t&iacute;nh của mặt h&agrave;ng lựa chọn.</li> <li>X&aacute;c định c&aacute;c nh&oacute;m v&agrave; đặc điểm nh&acirc;n khẩu học để gi&uacute;p x&acirc;y dựng c&aacute;c chiến dịch quảng c&aacute;o nhắm mục ti&ecirc;u.</li> </ul> <p><img style="width: 862px; display: block; margin-left: auto; margin-right: auto;" src="../../../public_files/a9947b33-19e5-46e3-b9d2-423999a5380b" alt="Phan-cum-768x442" height="496" /></p> <h2 id="ftoc-heading-4" class="ftwp-heading" style="text-align: justify;">Ph&aacute;t hiện bất thường/ngoại lai</h2> <p style="text-align: justify;">B&agrave;i to&aacute;n ph&aacute;t hiện bất thường/ngoại lai l&agrave; dạng b&agrave;i to&aacute;n trong đ&oacute; mục ti&ecirc;u l&agrave; t&igrave;m ra c&aacute;c điểm dữ liệu kh&ocirc;ng c&oacute; c&ugrave;ng t&iacute;nh chất hoặc sai kh&aacute;c qu&aacute; nhiều so với c&aacute;c điểm dữ liệu kh&aacute;c trong bộ dữ liệu. Trong b&agrave;i to&aacute;n n&agrave;y, m&ocirc; h&igrave;nh học m&aacute;y sẽ c&oacute; nhiệm vụ chạy qua to&agrave;n bộ bộ dữ liệu v&agrave; g&aacute;n cho c&aacute;c đối tượng dữ liệu gi&aacute; trị l&agrave; bất thường hoặc b&igrave;nh thường. Một v&iacute; dụ kinh điển cho dạng b&agrave;i to&aacute;n n&agrave;y l&agrave; b&agrave;i to&aacute;n ph&aacute;t hiện gian lận thẻ t&iacute;n dụng. Bằng c&aacute;ch m&ocirc; h&igrave;nh h&oacute;a h&agrave;nh vi v&agrave; sở th&iacute;ch mua sắm của người d&ugrave;ng, c&aacute;c c&ocirc;ng ty thẻ t&iacute;n dụng c&oacute; thể ph&aacute;t hiện ra sự lạm dụng hoặc gian lận thẻ t&iacute;n dụng trong c&aacute;c giao dịch. Nếu thẻ t&iacute;n dụng của bạn bị đ&aacute;nh cắp, th&ocirc;ng thường kẻ cắp thường c&oacute; c&oacute; h&agrave;nh vi mua sắm kh&aacute;c rất nhiều so với của bạn. Chẳng hạn, bạn thường mua rất nhiều s&aacute;ch, linh kiện điện tử, nhưng kẻ trộm thẻ thường mua c&aacute;c sản phẩm đắt tiền như &ocirc; t&ocirc;, hoặc iPhone XS chẳng hạn. Dựa tr&ecirc;n c&aacute;c dữ liệu n&agrave;y, c&aacute;c c&ocirc;ng ty thẻ t&iacute;n dụng c&oacute; thể t&igrave;m ra v&agrave; ngăn chặn c&aacute;c giao dịch bất thường so với h&agrave;nh vi th&ocirc;ng thường của người d&ugrave;ng. Một số v&iacute; dụ kh&aacute;c c&oacute; thể kể đến như:</p> <ul style="text-align: justify;"> <li>T&igrave;m kiếm c&aacute;c mẫu truy cập v&agrave; x&aacute;c định c&aacute;c tấn c&ocirc;ng mạng (c&oacute; h&agrave;nh vi bất thường so với c&aacute;c mẫu truy cập thường ng&agrave;y của người d&ugrave;ng)</li> <li>T&igrave;m kiếm c&aacute;c đặc t&iacute;nh lạ của bệnh nh&acirc;n</li> <li>Kiểm tra c&aacute;c gi&aacute; trị được nhập v&agrave;o hệ thống</li> <li>Lọc dữ liệu nhiễu v&agrave; ngoại lai để n&acirc;ng cao hiệu quả của c&aacute;c m&ocirc; h&igrave;nh machine learning kh&aacute;c.</li> </ul> <p style="text-align: justify;">Do, sự bất thường l&agrave; c&aacute;c sự kiện xảy ra rất hiếm, do đ&oacute; th&ocirc;ng thường sẽ kh&oacute; c&oacute; thể thu thập dữ liệu để biểu diễn v&agrave; m&ocirc; h&igrave;nh h&oacute;a sự bất thường. V&igrave; vậy, c&aacute;c thuật to&aacute;n ph&aacute;t hiện bất thường phải được thiết kế một c&aacute;ch đặc biệt để giải quyết c&aacute;c vấn đề cốt l&otilde;i của việc x&acirc;y dựng v&agrave; huấn luyện m&ocirc; h&igrave;nh tr&ecirc;n c&aacute;c bộ dữ liệu kh&ocirc;ng c&acirc;n bằng n&agrave;y.</p> <p><img style="width: 861px; display: block; margin-left: auto; margin-right: auto;" src="../../../public_files/f35c4e3d-10cd-43aa-af5e-9adec8b4b64e" alt="Phat-hien-bat-thuong-768x341" height="382" /></p> <h2 id="ftoc-heading-5" class="ftwp-heading" style="text-align: justify;">Xếp hạng</h2> <p style="text-align: justify;">Nhiệm vụ xếp hạng y&ecirc;u cầu x&acirc;y dựng một bộ xếp hạng từ tập dữ liệu g&aacute;n nh&atilde;n. Tập c&aacute;c dữ liệu n&agrave;y bao gồm c&aacute;c đối tượng được nh&oacute;m lại th&agrave;nh c&aacute;c nh&oacute;m ri&ecirc;ng biệt được chấm điểm theo một số ti&ecirc;u ch&iacute; cho trước. C&aacute;c nh&atilde;n xếp hạng c&oacute; thể l&agrave; {0, 1, 2, 3, 4&hellip;} cho mỗi đối tượng dữ liệu. Bộ xếp hạng được huấn luyện để xếp hạng c&aacute;c dữ liệu đầu v&agrave;o mới m&agrave; chưa biết điểm xếp hạng cho c&aacute;c dữ liệu n&agrave;y. Về cơ bản ch&uacute;ng ta thấy, b&agrave;i to&aacute;n n&agrave;y kh&aacute; giống b&agrave;i to&aacute;n ph&acirc;n lớp. Tuy nhi&ecirc;n, điểm kh&aacute;c biệt đ&oacute; l&agrave; c&aacute;c lớp ở đ&acirc;y l&agrave; c&oacute; thứ tự tức l&agrave; c&oacute; mức độ quan trọng kh&aacute;c nhau.</p> <h2 id="ftoc-heading-6" class="ftwp-heading" style="text-align: justify;">Hệ đề nghị (Recommendation System)</h2> <p style="text-align: justify;">C&aacute;c hệ đề nghị được x&acirc;y dựng với mục ti&ecirc;u l&agrave; cho ph&eacute;p tạo ra một danh s&aacute;ch c&aacute;c dữ liệu đề xuất (c&oacute; thể l&agrave; c&aacute;c sản phẩm, dịch vụ, hoặc kết quả t&igrave;m kiếm&hellip;) dựa tr&ecirc;n c&aacute;c đặc t&iacute;nh dữ liệu đầu v&agrave;o của người d&ugrave;ng. Chẳng hạn, c&aacute;c website phim trực tuyến của thể đề xuất danh s&aacute;ch c&aacute;c bộ phim ưu ti&ecirc;n cho người d&ugrave;ng mỗi khi họ đăng nhập sao cho khả năng họ xem c&aacute;c phim n&agrave;y l&agrave; cao nhất. Muốn l&agrave;m như vậy, c&aacute;c thuật to&aacute;n đề nghị phải l&agrave;m sao t&igrave;m ra được đặc t&iacute;nh của người d&ugrave;ng v&agrave; đưa ra danh s&aacute;ch đề nghị ph&ugrave; hợp nhất với c&aacute;c đặc t&iacute;nh n&agrave;y. Điều tương tự diễn ra với c&aacute;c trang thương mại điện tử như Amazon, Tiki, Shopee,&hellip;</p> <p><img style="width: 935px; display: block; margin-left: auto; margin-right: auto;" src="../../../public_files/ca3f784f-f1ac-412f-850b-15f59f8e639d" alt="He-de-nghi" height="318" /></p> <h2 id="ftoc-heading-7" class="ftwp-heading" style="text-align: justify;">Dịch m&aacute;y</h2> <p style="text-align: justify;">Trong machine learning task n&agrave;y, đầu v&agrave;o nhận được l&agrave; một chuỗi c&aacute;c k&yacute; tự thuộc một ng&ocirc;n ngữ n&agrave;o đ&oacute; (chẳng hạn l&agrave; tiếng Anh) v&agrave; chương tr&igrave;nh m&aacute;y t&iacute;nh sẽ c&oacute; nhiệm vụ chuyển đổi chuỗi k&yacute; tự n&agrave;y sang dạng ng&ocirc;n ngữ kh&aacute;c (chẳng hạn l&agrave; tiếng Việt). Nhiệm vụ n&agrave;y thường được ứng dụng trong c&aacute;c b&agrave;i to&aacute;n về xử l&yacute; ng&ocirc;n ngữ tự nhi&ecirc;n, chẳng hạn như dịch từ tiếng Anh sang tiếng Việt, dịch đa ng&ocirc;n ngữ, tự động ph&aacute;t hiện ng&ocirc;n ngữ,&hellip;</p> <h2 id="ftoc-heading-8" class="ftwp-heading" style="text-align: justify;">Dự b&aacute;o</h2> <p style="text-align: justify;">B&agrave;i to&aacute;n dự b&aacute;o cũng c&oacute; thể coi l&agrave; một trong những b&agrave;i to&aacute;n kinh điển v&agrave; phổ biến trong machine learning. Nhiệm vụ của b&agrave;i to&aacute;n dự b&aacute;o l&agrave; sử dụng c&aacute;c dữ liệu dạng chuỗi thời gian trong qu&aacute; khứ để đưa ra c&aacute;c dự đo&aacute;n cho c&aacute;c sự kiện hoặc h&agrave;nh vi trong tương lai. Một số ứng dụng phổ biến của n&oacute; c&oacute; thể kể đến như dự b&aacute;o thời tiết, dự b&aacute;o doanh số theo m&ugrave;a, dự b&aacute;o nhu cầu kh&aacute;c h&agrave;ng,&hellip;</p> <h2 id="ftoc-heading-9" class="ftwp-heading" style="text-align: justify;">Tổng hợp v&agrave; lấy mẫu</h2> <p style="text-align: justify;">Trong dạng nhiệm vụ n&agrave;y, c&aacute;c thuật to&aacute;n học m&aacute;y sẽ được y&ecirc;u cầu sinh ra c&aacute;c mẫu dữ liệu mới c&oacute; c&aacute;c đặc t&iacute;nh tương tự như dữ liệu huấn luyện. Điều n&agrave;y l&agrave;m tăng số lượng dữ liệu nhằm sử dụng để n&acirc;ng cao hiệu quả của qu&aacute; tr&igrave;nh huấn luyện. Bởi số lượng dữ liệu tăng c&oacute; thể l&agrave;m tăng độ ch&iacute;nh x&aacute;c của m&ocirc; h&igrave;nh. Tổng hợp v&agrave; lấy mẫu c&ograve;n rất hữu &iacute;ch trong c&aacute;c ứng dụng đa phương tiện khi việc x&acirc;y dựng dữ liệu bằng tay l&agrave; cực kỳ kh&oacute; khăn, đắt đỏ, nh&agrave;m ch&aacute;n hoặc tốn k&eacute;m kh&aacute; nhiều thời gian. Chẳng hạn như ch&uacute;ng ta c&oacute; thể tự động sinh ra c&aacute;c bản vẽ cho c&aacute;c vật thể lớn hoặc bản đồ trong c&aacute;c tr&ograve; chơi điện tử. Điều n&agrave;y sẽ l&agrave;m giảm thời gian v&agrave; chi ph&iacute; vẽ cũng như thiết kế kh&aacute; nhiều nếu sử dụng thủ c&ocirc;ng. Ngo&agrave;i ra, trong một số b&agrave;i to&aacute;n ch&uacute;ng ta c&oacute; thể sinh ra c&aacute;c đầu ra dựa tr&ecirc;n một số đầu v&agrave;o cho một số mục đ&iacute;ch nhất định chẳng hạn như: tổng hợp tiếng n&oacute;i, soạn nhạc,&hellip; hoặc gần đ&acirc;y ch&uacute;ng ta cũng c&oacute; thể nghe n&oacute;i đến ở đ&acirc;u đ&oacute; ứng dụng DeepFake tức l&agrave; tạo ra c&aacute;c bức ảnh như thật nhằm giả mạo một người n&agrave;o đ&oacute;.</p> <p><img style="width: 692px; display: block; margin-left: auto; margin-right: auto;" src="../../../public_files/15ca08b6-ede7-4777-ba2d-3fa1476c7e7c" alt="deepfake-768x624" height="562" /></p> <p style="text-align: justify;">Ngo&agrave;i c&aacute;c t&aacute;c vụ thường gặp ở tr&ecirc;n, tr&ecirc;n thực tế c&ograve;n c&oacute; rất nhiều t&aacute;c vụ machine learning task kh&aacute;c được sử dụng trong một số b&agrave;i to&aacute;n cụ thể, chẳng hạn như:</p> <p style="text-align: justify;"><strong>Điền c&aacute;c gi&aacute; trị thiếu cho dữ liệu:</strong> Trong kiểu t&aacute;c vụ n&agrave;y, thuật to&aacute;n học m&aacute;y nhận đầu v&agrave;o l&agrave; một mẫu dữ liệu $x \in \mathbb{R}^{n}$ gồm $n$ thuộc t&iacute;nh, trong đ&oacute; một số thuộc t&iacute;nh $x_{i}$ của $x$ bị thiếu hoặc kh&ocirc;ng đo đạc, quan s&aacute;t được. Trong trường hợp n&agrave;y, thuật to&aacute;n phải tiến h&agrave;nh cung cấp c&aacute;c dự đo&aacute;n về c&aacute;c thuộc t&iacute;nh bị thiếu đ&oacute;. Đ&acirc;y l&agrave; một t&aacute;c vụ rất cần thiết cho c&aacute;c qu&aacute; tr&igrave;nh tiền xử l&yacute; dữ liệu c&aacute;c bộ dữ liệu kh&ocirc;ng đầy đủ quan s&aacute;t.</p> <p style="text-align: justify;"><strong>Lọc nhiễu (Denoising):</strong>&nbsp;Tương tự như b&agrave;i to&aacute;n điền c&aacute;c dữ liệu thiếu trong dữ liệu, việc lọc nhiễu cho dữ liệu cũng l&agrave; một machine learning task đ&oacute;ng một vai tr&ograve; hết sức quan trọng trong qu&aacute; tr&igrave;nh học m&aacute;y. T&aacute;c vụ n&agrave;y c&oacute; mục ti&ecirc;u v&agrave; loại bỏ c&aacute;c dữ liệu nhiễu nhằm thu được những dữ liệu sạch cho qu&aacute; tr&igrave;nh huấn luyện thu được kết quả ch&iacute;nh x&aacute;c hơn.</p> <div id="wpd-post-rating" class="wpd-not-rated" style="text-align: justify;"> <div class="wpd-rating-wrap">&nbsp;</div> </div> <hr /> <p style="text-align: center;"><em><strong>Fanpage Facebook:</strong>&nbsp;<a href="https://www.facebook.com/tek4.vn/">TEK4.VN</a></em>&nbsp;</p> <p style="text-align: center;"><em><strong>Tham gia cộng đồng để chia sẻ, trao đổi v&agrave; thảo luận:</strong>&nbsp;<a href="https://www.facebook.com/groups/tek4.vn/">TEK4.VN - Học Lập Tr&igrave;nh Miễn Ph&iacute;</a></em></p>