Huy Bui
469
25-04-2022
Machine learning đang là một chủ đề đang rất HOT đang được nhắc tới. Để tìm hiểu Machine learning là gì, và về công nghệ AI đang là ngành mũi nhọn này, hãy cùng Cole.vn tìm hiểu tất tần tật về công nghệ này.
Machine learning là một lĩnh vực con của Trí tuệ nhân tạo (Artificial Intelligence). Machine Learning sẽ sử dụng các thuật toán cho phép máy tính có thể tự học từ dữ liệu để thực hiện các công việc thay vì được lập trình một cách rõ ràng.
Machine Learning rất quan trọng vì nó mang lại cho các doanh nghiệp một quan điểm về xu hướng trong hành vi của khách hàng và các mẫu hoạt động kinh doanh, cũng như hỗ trợ phát triển các sản phẩm mới. Nhiều công ty hàng đầu ngày nay, chẳng hạn như Facebook, Google và Uber, đã để machine learning đã trở thành một điểm khác biệt cạnh tranh đáng kể cho nhiều công ty.
>> Tìm hiểu thêm về nghề machine learning engineer – công việc có mức lương hàng đầu hiện nay và khám phá ngay mô hình học máy nếu bạn chọn theo đuổi chiếc nghề này nhé
Giả sử ta có một nhân vật trong game cần di chuyển và tránh các chướng ngại vật. Machine learning có thể học cách chơi game, sau đó giải quyết công việc này thay bạn.
Hãy cùng hình dung trong một vài ví dụ khác:
Trong VD1, nhiệm vụ phát hiện khuôn mặt của người mẫu Ngọc Trinh trong một bức ảnh. Kinh nghiệm có thể là một tập hợp các ảnh có khuôn mặc Ngọc Trinh và một tập ảnh khác không có. Hiệu suất sẽ được tính bằng tỉ lệ đoán chính xác trên một tập ảnh mới.
Trong VD2, nhiệm vụ của bài toán là là gán nhãn cho mỗi review. Kinh nghiệm ở đây có thể là tập hợp các review và nhãn tương ứng của nó. Hiệu suất được đo bằng tỉ lệ dự đoán nhãn chính xác trên các review mới.
Trong VD3, bài toán cần giải quyết là đánh giá điểm tin cậy của người dùng để thực hiện cho vay tín dụng. Kinh nghiệm có thể học được từ các tập hình ảnh/ thông tin của những người vay tín dụng trước đi kèm thông tin họ có chi trả khoản vay tín dụng đó không. Hiệu suất của mô hình sẽ được đo bằng tỉ lệ dự đoán đúng trên tập khách hàng mới.
Huấn luyện mô hình machine learning là gì? Đây là một quá trình trong đó các các lập trình viên sẽ để thuật toán học máy Machine Learning được làm đầy với dữ liệu đào tạo để máy đủ để học hỏi.
Có 7 bước chính liên quan đến việc huấn luyện mô hình:
Xác định vấn đề chính là xác định mục tiêu nghiên cứu.
Bước này là nơi các kịch bản và các phương pháp được dùng để giải quyết vấn đề có thể được đem ra so sánh và thảo luận kỹ, cũng như việc các giả định được dự tính trước và dự trù được mức độ cần thiết và can thiệp chuyên môn của con người.
Bước này bao gồm việc xác định loại Machine Learning nào (học được giám sát hay học không giám sát, v.v.) sẽ được áp dụng và các chỉ tiêu đánh giá hiệu suất nào có thể được chấp nhận.
Cần xác định: xác định lượng dữ liệu cần thiết, loại dữ liệu cần thiết, nguồn lấy dữ liệu ở đâu, đánh giá các vấn đề liên quan tới pháp lý xung quanh việc thu thập dữ liệu …
Tiến hành việc lấy dữ liệu. Một khi bạn có dữ liệu, bạn cần đảm bảo dữ liệu được ẩn danh một cách phù hợp với các tiêu chuẩn pháp lý, đảm bảo bạn biết loại dữ liệu bạn thu thập được thực sự có dạng là gì (dạng chuỗi thời gian, dạng quan sát, dạng hình ảnh, v.v.),
Hãy chuyển dữ liệu sang định dạng bạn cần nếu định dạng của nó chưa phù hợp và tạo ra các tập dữ liệu đào tạo, tập dữ liệu xác nhận và tập dữ liệu test.
Trước tiên chúng ta cần phải hiểu và nắm được bài toán cần giải quyết là gì để có thể tìm kiếm chính xác dữ liệu để training cho máy! Bạn có thể tìm ảnh, videos từ các trang mạng xã hội, ảnh vệ tinh trên Google, free collected data từ camera công cộng hay xe hơi (Waymo, Tesla), thậm chí có thể mua dữ liệu từ bên thứ 3 (lưu ý tính chính xác của dữ liệu). Cũng cần phải biết đến những dataset đã được tổng hợp sẵn có thể áp dụng cho bài toán của mình.
Một khi bạn có dữ liệu, bạn cần đảm bảo dữ liệu phù hợp với các tiêu chuẩn pháp lý, đảm bảo bạn biết loại dữ liệu bạn thu thập được thực sự có dạng là gì (dạng chuỗi thời gian, dạng quan sát, dạng hình ảnh, v.v.
Đây là lúc để áp dụng việc chuyển đổi dữ liệu mà bạn đã làm trong bước trước.
Bước này cũng sẽ bao gồm các thao tác làm sạch dữ liệu, cũng như lựa chọn ra đặc tính và phương pháp kỹ thuật có thể áp dụng.
Việc chuẩn hóa dữ liệu cũng được thực hiện ở bước này.
Bước tiếp theo trong luồng công việc của ta là chọn mô hình. Qua nhiều năm, các nhà nghiên cứu và nhà khoa học dữ liệu đã tạo ra nhiều mô hình machine learning. Một số mô hình rất phù hợp với dữ liệu hình ảnh, một số khác dành cho chuỗi (như văn bản hay âm nhạc), một số dành cho dữ liệu số, những mô hình khác lại phù hợp cho dữ liệu dạng văn bản, vì vậy chúng ta cần chọn mô hình phù hợp.
Đây là một bước sử dụng ít kỹ thuật hơn nhiều, tuy nhiên, bạn phải đảm bảo chuẩn bị đủ tài liệu phù hợp về các khía cạnh kỹ thuật của hệ thống để sẵn sàng trình bày với khách hàng/sếp của bạn…
Bạn cần trả lời câu hỏi cho các bên quan tâm về việc: Các bên quan tâm có hiểu tổng thể dự án này không? Liệu giải pháp Machine Learning này có đạt được mục tiêu không? Bạn đã truyền đạt được các giả định và hạn chế của mô hình Machine learning này chưa?
Bạn cần chuẩn bị cho hệ thống Machine Learning sẵn sàng chạy tốt ở môi trường production (là môi trường người dùng cuối họ truy cập);
Là một giải pháp phần mềm, hệ thống Machine learning này sẽ được thử nghiệm trước và cần được theo dõi đầy đủ ngay cả khi đã chạy thực tế
Trong quá trình chạy hệ thống Machine learning, bạn vẫn cần phải bổ sung thêm dữ liệu để huấn luyện máy ngày càng chính xác hơn.
>> Lộ trình học machine learning và giáo trình học máy – Combo kiến thức đáng gờm dành cho dân data
Machine Learning sử dụng hai kỹ thuật chính: Học có giám sát và học không giám sát.
Học có giám sát cho phép bạn thu thập dữ liệu hoặc tạo ra đầu ra dữ liệu từ triển khai Machine Learning trước đó. Học có giám sát (Supervised Learning) rất thú vị nó hoạt động theo cách giống như con người thực sự học.
Học không giám sát là nơi bạn chỉ có phần dữ liệu đầu vào mà không có biến đầu ra tương ứng. Mục tiêu của việc học không giám sát là để có thể mô hình hóa cấu trúc nền tảng hoặc nhận biết sự phân bố trong dữ liệu để con người hiểu rõ hơn về bộ dữ liệu đó.
Các vấn đề học không giám sát có thể được phân ra thành hai loại:
>> Vậy còn deep learning là gì, sự khác biệt giữa machine learning và deep learning như thế nào? Tìm hiểu thêm nhé
Neural Network trong tiếng Việt là Mạng nơ-ron nhân tạo, đây là một chuỗi những thuật toán Machine Learning được đưa ra để tìm ra các mối quan hệ cơ bản trong tập hợp dữ liệu. Mạng nơ-ron nhân tạo hoạt động giống như việc bắt bước cách thức hoạt động từ não bộ con người.
Chắc chắn bạn đã biết Machine learning là gì. Machine Learning là tương lai, và tương lai chính là hiện tại. Bạn đã sẵn sàng nắm bắt những công nghệ mới? Hãy bắt đầu hành trình của bạn với khóa học Machine Learning/Deep Learning 40 giờ chinh phục mọi bài toán từ Đại học Bách khoa Hà Nội và Cole.vn.
Cảm nhận học viên
Câu chuyện doanh nghiệp