CTYPE html PUBLIC “-//W3C//DTD XHTML 1.0 Transitional//EN” “http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd”>Khái quát về máy học – Xử lý ngôn ngữ tự nhiên (Trường đại học khoa học kỹ thuật Nagaoka)

*

Máy học

Bách khoatoàn thư mở Wikipedia

Học máy, có tài liệu gọi là Máy học,(tiếng Anh: machine learning) là một lĩnh vực của trí tuệ nhântạo liên quan đến việc phát triển các kĩ thuật cho phép các máy tính có thể”học”. Cụ thể hơn, học máy là một phương pháp để tạo ra các chươngtrình máy tính bằng việc phân tích các tập dữ liệu. Học máy có liên quan lớn đến thốngkê, vì cả hai lĩnh vực đều nghiên cứu việc phân tích dữ liệu, nhưng khác với thốngkê, học máy tập trung vào sự phức tạp của các giải thuật trong việc thực thitính toán. Nhiều bài toán suy luận được xếp vào loại bài toán NP-khó, vìthế một phần của học máy là nghiên cứu sự phát triển các giải thuật suy luận xấpxỉ mà có thể xử lí được.

Bạn đang xem: Máy học là gì

Học máy có tính ứng dụngrất cao bao gồm máy truy tìm dữ liệu, chẩn đoán y khoa, phát hiện thẻtín dụng giả, phân tích thị trường chứng khoán, phân loại các chuỗiDNA, nhận dạng tiếng nói và chữ viết, dịch tự động, chơitrò chơi và cử động rô-bốt (robot locomotion).

Tương tác với con người

Một số hệ thống học máy nỗ lực loại bỏ nhu cầu trực giác của con ngườitrong việc phân tích dữ liệu, trong khi các hệ thống khác hướng đến việc tăng sựcộng tác giữa người và máy. Khôngthể loại bỏ hoàn toàn tác động của con người vì các nhà thiết kế hệ thống phảichỉ định cách biểu diễn của dữ liệu và những cơ chế nào sẽ được dùng để tìm kiếmcác đặc tính của dữ liệu. Học máy có thể được xem là một nỗ lực để tự động hóamột số phần của phương phápkhoa học. Một số nhà nghiên cứu học máy tạo ra các phươngpháp bên trong các khuôn khổ của thống kêBayes.

 

Các loại giải thuật

Các thuậttoán học máy được phân loại theo kết quả mong muốn của thuật toán. Các loạithuật toán thường dùng bao gồm:

§ Họccó giám sát — trong đó, thuật toán tạo ra một hàm ánh xạ dữ liệu vào tớikết quả mong muốn. Một phát biểu chuẩn về một việc học có giám sát là bài toán phân loại: chương trình cần học (cách xấpxỉ biểu hiện của) một hàm ánh xạ một vector  tớimột vài lớp bằng cách xem xét một số mẫu dữ_liệu – kết_quả của hàm đó.

§ Họckhông giám sát — mô hình hóa một tập dữ liệu, không có sẵn các ví dụ đãđược gắn nhãn.

§ Họcnửa giám sát — kết hợp các ví dụ có gắn nhãn và không gắn nhãn để sinh mộthàm hoặc một bộ phân loại thích hợp.

Xem thêm: sứ mệnh tiếng anh là gì

§ Họctăng cường — trong đó, thuật toán học một chính sách hành động tùy theocác quan sát về thế giới. Mỗi hành động đều có tác động tới môi trường, và môitrường cung cấp thông tin phản hồi để hướng dẫn cho thuật toán của quá trình học.

§ Chuyển đổi — tương tựhọc có giám sát nhưng không xây dựng hàm một cách rõ ràng. Thay vì thế, cố gắngđoán kết quả mới dựa vào các dữ liệu huấn luyện, kết quả huấn luyện, và dữ liệuthử nghiệm có sẵn trong quá trình huấn luyện.

§ Học cách học — trongđó thuật toán học thiên kiến quy nạp của chính mình, dựa theo cáckinh nghiệm đã gặp.

Phân tích hiệuquả các thuật toán học máy là một nhánh của ngành thống kê,được biết với tên lý thuyết học điện toán.

Xem thêm: Cic Là Gì – Cic Hoạt động Như Thế Nào

Các chủ đề về học máy

Danh sách cácchủ đề của môn học này:

§ Môhình hóa các hàm mật độ xác suất điều kiện: hồi quy và phânloại

§ Mạngnơ-ron

§ Câyquyết định

§ Lậptrình biểu thức gen

§ Lậptrình di truyền

§ Hồiquy quá trình Gauss

§ Phântích biệt thức tuyến tính

§ kláng giềng gần nhất

§ Độdài thông điệp tối thiểu

§ Cảmtri nguyên

§ Hàmcơ sở xuyên tâm

§ Máyhỗ trợ vector

§ Môhình hóa các hàm mật độ xác suất qua các mô hình phát sinh:

§ Thuậttoán cực đại kì vọng

§ Các môhình đồ họa gồm mạng Bayes và mạng Markov

§ Ánhxạ topo phát sinh

§ Cáckỹ thuật suy luận xấp xỉ đúng:

§ ChuỗiMarkov phương pháp Monte Carlo

§ Phươngpháp biến thiên

§ Tốiưu hóa: hầu hết các phương pháp trên đều sử dụng tối ưu hóa hoặc là các thể hiệncủa các thuật toán tối ưu hóa.

Chuyên mục: Hỏi Đáp