Học máy cơ bản - Hồi quy tuyết tính
Thuật toán hồi quy tuyến tính - một trong nhưng thuật toán cơ bản và đơn giản nhất của lĩnh vực Học Máy (Machine learning). Ví dụ trên ngôn ngữ lập trình Python
Để có cách nhìn tổng quan về học máy các bạn có thể tham khảo ở đây ...link
Định nghĩa
Hồi quy tuyến tính là mô hình mô tả sự phụ thuộc của 1 thông số đối với các thông số khác bằng phương trình tuyến tính.
Hồi quy tuyến tính đề cập đến nhiệm vụ xác định "đường thẳng phù hợp nhất" trên một tập hợp các điểm dữ liệu và đã trở thành tiền thân đơn giản của các phương pháp phi tuyến tính được sử dụng để đào tạo mạng nơ-ron. Trong bài viết này, chúng tôi sẽ chỉ cho bạn các ví dụ về hồi quy tuyến tính.
Ứng dụng
- Xử lý bài toán 1
Ví dụ
Cho một tập hợp N điểm.
Bài toán đặt ra là tìm đường thẳng thể hiện rõ nhất mỗi quan hệ giữa các điểm đó. Nhớ rằng phương trình đường thẳng f(x) = ax+b - a là góc nghiên của đường thằng, b là dịch chuyển tịnh tiến của đường thẳng. Như vậy để tìm đường thẳng tối ưu thể hiện mối quan hệ giữ các điểm chính là tìm các thông số a và b của đường thẳng đó.
Hàm mất mát
Hàm số mất mát là hàm số (công thức, phương trình v.v... ) dùng để đánh giá độ chính xác (đúng đắn) của mô hình cần tìm. Như vậy hàm mất mát phải bao gồm các điểm cần đánh giá và mô hình học ( trong bài toán này chính là w0 + w1*x + w2*y = 0). Ta cần đi tìm giá trị của {w0,w1,w2} sao cho hàm mất mát đặt giá trị nhỏ nhất ( nghĩa là sai số nhỏ nhất ).
Hàm mất mát của Hồi quy tuyến là thuật toán MSE - tổng trung bình phương khoảng cách của tất các điểm đánh giá đến đường thẳng cần tìm. Công thức tính khoảng cách từ 1 điểm (x1,y1) đến đường thẳng w0 + w1*x + w2*y = 0 là:
di = w0 + w1*xi + w2*yi
Nguồn tham khảo
- Ngại đọc bạn có thể vừa uống chà và xem video bài giảng tại đây:
- Lười viết code đã có mã nguồn github:
