Lộ trình khóa học data analyst bài bản, định hướng nghề khóa học data analysis. Khóa học phân tích dữ liệu Fresher – Junior – Senior cho mọi xuất phát điểm. Trong đó, khóa Fresher là khóa học cơ bản, Junior là khóa học dành cho các bạn đã có nền tảng về DA và Senior giúp các bạn chuyên sâu và phát triển trong một hoặc hai ngôn ngữ lập trình được sử dụng rộng rãi trong mảng phân tích dữ liệu.
Học Data Analyst có khó? Vì sao khóa học Data Analysis tại Cole là khóa học DA duy nhất không cần background IT?
Học data analyst có khó không?
Đối với các bạn không có background IT hoặc ít làm việc với các con số thì chuyển sang mảng dữ liệu khá khó. Đơn giản là vì sẽ không biết bắt đầu từ đâu, tự học không có sự kèm cặp, hướng dẫn và giải đáp nhanh chóng từ giảng viên càng khiến các bạn mau chóng dễ nản. Bên cạnh đó, 90% các khóa học online miễn phí đều nặng về code, sử dụng ngôn ngữ tiếng Anh với nhiều thuật ngữ chuyên ngành dữ liệu khó hiểu.
Không giỏi toán và IT code có học được data analyst Cole?
Các bạn có thể hoàn toàn yên tâm chọn Cole nếu muốn chuyển ngành sang học dữ liệu khi bạn đang lo ngại bản thân không giỏi toán học – lập trình, vì:
Cole có lộ trình học và phương pháp học tối ưu nhất, giúp các khóa học không nặng về code mà vẫn đảm bảo chất lượng
Tư vấn lộ trình đào tạo data analyst, định hướng nghề nghiệp để bạn xác định được ngôn ngữ lập trình và vị trí, lĩnh vực làm dữ liệu phù hợp
Học thử miễn phí
Học tư duy để giải quyết các bài toán trong doanh nghiệp bằng dữ liệu với công cụ SQL, Excel, Power BI, R & Python, Machine Learning.
Giảng viên đứng lớp là Senior Data Analyst và GV ưu tú tại Đại Học Bách Khoa HN, những GV có phương pháp dạy sinh động, trực quan.
Học viên được cầm tay chỉ việc cùng GV trong mỗi buổi học, không để học viên bị mông lung.
Bởi vậy, đến 80% học viên trong khóa đào tạo DA tại Cole đến từ dân kinh tế, luật, tài chính, truyền thông,…
Những lợi ích khi lựa chọn khóa học về data analysis online tại Cole:
Đào tạo data analyst ngắn hạn: Trọn gói những kỹ năng cần thiết và tư duy nghiệp vụ để làm nghề data analyst; xây dựng căn bản từ đầu đến khi thành thạo nhờ các case thực tế.
Hình thức học: zoom buổi tối, thuận tiện cho học viên sắp xếp việc học
Hỗ trợ học tập: Được trợ giảng hỗ trợ hướng dẫn, nhắc nhở tham gia các buổi học, thông báo bài tập và giải đáp các thắc mắc.
Chương trình học thực tiễn: Các buổi học được sắp xếp theo lộ trình bài bản, ứng dụng ngay các case thực tế trong bài học.
Vừa học vừa thực hành với các case study thực tế: 100% thực hành mọi buổi học, cân bằng lý thuyết thực hành 5-5
Cơ hội nghề nghiệp hấp dẫn: Giới thiệu và tư vấn công việc phù hợp từ cộng đồng tuyển dụng của các công ty, tập đoàn hàng đầu
Chứng chỉ: có đủ tư duy và trình độ pass các chứng chỉ quốc tế như Data của Microsoft hoặc IBM
Học lại miễn phí đến khi hiểu rõ và thành thạo.
Trả góp học phí 0% chỉ từ 500.000đ mỗi tháng.
Và có rất nhiều lợi ích khác đến từ đề cương khóa học và các chia sẻ thực tế từ giảng viên khóa học data analysis online
Các khóa Fresher và Junior – Liên hệ nhận video học thử + lớp học thử
Những bạn mới bắt đầu học phân tích dữ liệu hoặc những bạn không có nền tảng CNTT muốn tìm hiểu về công việc phân tích dữ liệu
Dân Dev/IT muốn đổi hướng sang làm dữ liệu nhưng chưa cótư duy nghiệp vụ
Những bạn đang gặp vấn đề trong công việc khi dữ liệu quá lớn, không thể sử dụng Excel
Những bạn đang muốn tìm hiểu về cơ sở dữ liệu và cách ứng dụng SQL trong công việc phân tích dữ liệu
Người đã đi làm Data Analyst muốn nâng cao kỹ năng phân tích và xử lý dữ liệu
Các khóa Senior
Những bạn muốn theo đuổi vị trí Data Analyst chuyên nghiệp hoặc Data Scientist.
Sinh viên nhóm ngành kinh tế, chính trị, xã hội, khoa học,… muốn đào sâu học về data analysis với ngôn ngữ lập trình R + Python hoặc đã tham gia học xong khóa học DA Executive.
Nghiên cứu sinh cao học thạc sĩ, tiến sĩ học để hiểu cách làm phân tích báo cáo quản lý dữ liệu.
Thông tin các khóa học data analyst từ A-Z
Lộ trình học bài bản, với top 5 khóa học data analyst online có thể linh động lựa chọn cho mình chương trình học phù hợp với level, định hướng phát triển nghề nghiệp của mình.
Fresher: khóa DA với Excel & Power Query; khóa DA với SQL
Junior:khóa học DA với Power BI; khóa học DA với Python (làm báo cáo tự động và ML)
Senior: khóa học DA phân tích định lượng thống kê với R & Python
Lưu ý là các khóa học cung cấp kiến thức và kỹ năng nền tảng để từ đó mới có thể phát triển thêm khi đi làm cọ sát với vô vàn bài toán của Doanh Nghiệp.
Fresher A: Khóa học phân tích dữ liệu với Excel và Power Query – Đào tạo Data Analyst
Mục tiêu khóa học:
Xây dựng nền tảng mở đầu cho người mới bắt đầu
Nắm được cái khái niệm cơ bản về Phân tích dữ liệu, Business Intelligence, Data Mining theo ngôn ngữ thực tế và mô phỏng quy trình một cách trực quan, sinh động.
Nắm được các khái niệm OLAP và OLTP và minh họa được trên dữ liệu thực tế.
Làm chủ được các công cụ Excel, Power BI cho việc Phân tích dữ liệu
Phân biệt được ưu nhược điểm của các loại công cụ Excel, PowerBI, Hệ quản trị CSDL để lựa chọn được giải pháp phù hợp nhất trong thực tế.
Thời lượng khóa học: gồm 58h học – đây là lộ trình học quan trọng nhất giúp củng cố nền tảng cho các bạn muốn theo đuổi nghề data analyst.
Giảng viên: ThS. Nguyễn Danh Tú – Viện Toán Ứng Dụng – ĐHBK HN, thông tin giảng viên cụ thể ở mục giảng viên
Cung cấp cho học viên những kiến thức cơ bản nhất về phân tích dữ liệu với Python
Trang bị cho học viên các kiến thức cần thiết về cách truy vấn dữ liệu. Cách sử dụng công cụ Google Colab, Jupyter notebook và các thư viện thường dùng để làm phân tích dữ liệu trong python như: K-means, KNN, Pandas, Seaborn,…
Giúp học viên có thể phân tích bất cứ dữ liệu gì để trả lời các bài toán ứng dụng trong thực tiễn tại doanh nghiệp
Giúp học viên có đủ kiến thức nền tảng để học các khóa học nâng cao sau này về trí tuệ nhân tạo (AI), học máy (Machine Learning), Học sâu (Deep Learning)
Khóa học bao gồm: 20 buổi học – tương đương 40 giờ, giúp các bạn thành thạo sử dụng Python trong phân tích dữ liệu.
Giảng viên: Tiến sĩ. Trịnh Tuấn Đạt (Giảng viên môn công nghệ phần mềm), Tiến sỹ khoa học máy tính ở Trường ĐH công nghệ Viên, Áo, thông tin giảng viên cụ thể ở mục giảng viên
Mọi thông tin tóm tắt về 5 khóa học data analyst cole hàng đầu Việt Nam đã được chia sẻ, bạn có thể liên hệ để được tư vấn miễn phí về định hướng học tập và làm việc lâu dài trong nghề data. Với niềm đam mê dành cho công nghệ số và mong muốn mang đến tri thức số để áp dụng thực tế, Cole tự hào là đơn vị cung cấp khóa đào tạo phân tích dữ liệu hàng đầu VN dành cho tất cả mọi người. Chỉ với 20h-24h học bạn đã có thể áp dụng phân tích dữ liệu trong công việc.
Hệ thống kiến trúc phân tích dữ liệu trong Doanh Nghiệp
Data Tab cơ bản
2. Quy trình ETL tổng hợp, trích xuất và chuẩn hóa dữ liệu
ETL (Extract, Transform, Load)
Kiến thức về OLAP, các thao tác với dữ liệu trong OLAP
Xử lý dữ liệu với với Pivot Table, Pivot Chart
3. Quản trị dữ liệu số
Nguyên lý về quản trị dữ liệu dạng số 1. (DAKHASAPHATO). (Tư duy xây dựng dashboard dữ liệu)
Tổng hợp dữ liệu và xây dự báo cáo dashboard
4. Thực hành ETL trên Power Query
Nguyên lý về quản trị dữ liệu dạng số 2. (6 tầng dữ liệu và Tư duy phân tích)
Data Tab nâng cao với Power Query
5. Project thực tế
Project thực tế
Chia sẻ định hướng sau khóa học
Tư vấn, hỗ trợ các giải pháp doanh nghiệp
Module 1: Thành thạo SQL trên hệ quản trị cơ sở dữ liệu MySQL
Thiết lập môi trường làm việc thực hành
Tạo CSDL mẫu để làm việc
Truy vấn dữ 2 liệu theo yêu cầu
Xây dựng và phân tích lược đồ
Truy vấn các bảng hệ thống CSDL
Thao tác dữ liệu
Tạo các thành phần của CSDL
Kết nối cơ sở dữ liệu
Module 2: Nắm được tư duy về cơ sở dữ liệu
Tổng quan về CSDL
Truy vấn dữ liệu cơ bản
Tìm hiểu cấu trúc của CSDL
Truy vấn dữ liệu nâng cao
Cập nhật dữ liệu
Các khái niệm CSDL theo ngôn ngữ nghiệp vụ
Kết nối CSDL với Excel, Power BI
1. Giới thiệu về Power BI & Ứng dụng trong phân tích trực quan hóa dữ liệu
• Tổng quan về Power BI
• Kết nối nguồn dữ liệu vào Power BI
• Xây dựng Dashboard đơn giản trên Power BI
• Giới thiệu Power BI Service
2. Thực hành các thao tác với dữ liệu trên Power Query• Tổng quan về Power Query
• Giới thiệu các chức năng cơ bản trong Power Query
• Giới thiệu cơ bản về M trong Power Query
• Bài tập thực hành
3. Giới thiệu về Data Model trong Power BI
• Khái niệm về Data Model và lược đồ dữ liệu
• Data Model trong Power BI
• Thực hành liên kết dữ liệu trong Power BI Desktop
• Case Study AW2017 Database
4. Thiết kế Dashboard theo quy chuẩn
• Hiển thị và trực quan hóa dữ liệu
• Bài tập thực hành 1
• 15 quy tắc để xây dựng dashboard chuẩn
• Bài tập thực hành 2
5. Lập trình DAX cơ bản
• Tổng quan về DAX
• Giới thiệu về Calculated Measure, Calculated Column, Calculate Table
• Ví dụ về các hàm cơ bản
• Bài tập thực hành
6. Lập trình DAX trong Power BI (tiếp)
• Các Iterator Functions
• Các hàm Time Intelligence
• Hàm Userelationship
• Hàm Summarize
7. Thực hiện các phân tích trong Power BI• Thống kê tổng hợp• Xác định outlier với visual trong Power BI
• Time series analysis
• Sử dụng Advanced visual trong Power BI
8. Thiết kế Interactive Reports trong Power BI – Chỉnh sửa Report interactions
• Thêm Drillthrough cho visual
• Tạo, liên kết với các Bookmark trong Report
• Sử dụng “What-If” parameter
• Thực hành tạo 1 báo cáo Interactive Dashboard
9. Capstone Project – Bài trắc nghiệm cá nhân cuối khóa
• Ứng dụng và thực hành vào bài Capstone Project
• Gợi ý/ Chữa bài Capstone Project
• Hướng dẫn phần Xây dựng Interactive Dashboard
10. Tổng kết – Chữa bài tâp
• Nhận xét, chữa Project cuối khóa
• Tổng kết nội dung chương trình học
1. Tổng quan về Python
Máy tính và ngôn ngữ lập trình
Giới thiệu về Python
Môi trường lập trình Python
Jupyter Notebook và Google Colab
Giới thiệu các chương trình Python
2. Cú pháp Python cơ bản (gán giá trị biến và tìm kiểu dữ liệu)
Cú pháp Python cơ bản
Khái niệm biến
Lệnh gán giá trị cho biến
Các kiểu dữ liệu cơ bản
Thực hành 1: Thực hành gán gí trị biến và tìm kiểu dữ liệu
3. Toán tử, lệnh rẽ nhánh, và vòng lặp
Khái niệm
Các toán tử trong Python
Thứ tự ưu tiên toán tử
Lệnh rẽ nhánh
Vòng lặp
Thực hành toán tử, lệnh rẽ nhánh, và vòng lặp
4. Sử dụng hàm để xử lý dữ liệu
Giới thiệu về hàm
Các loại đối số hàm trong Python
Biến cục bộ và biến toàn cục
Thay đổi giá trị tham số hàm
Hàm trả về nhiều giá trị
Hàm lambda
Thực hành 4: Sử dụng hàm để xử lý dữ liệu
5. Đọc dữ liệu từ file Excel
Đọc file cục bộ
Đọc file trên Google Drive
Ghi nhiều bảng ra 1 sheet
Đọc dữ liệu từ nhiều sheet
Đọc dữ liệu từ nhiều bảng trong 1 sheet
Đọc dữ liệu từ các bảng có cấu trúc phức tạp
Thực hành 5: Thực hành đọc dữ liệu
6. Ghi dữ liệu ra file Excel
Ghi file lên Google Drive
Ghi dữ liệu ra nhiều sheet
Ghi nhiều bảng ra 1 sheet
Ghi bảng dữ liệu có cấu trúc phức tạp
Ẩn cột trong file Excel
Tạo format khi ghi dữ liệu
Thêm chart vào file Excel
Thực hành 6: Thực hành ghi dữ liệu ra file Excel
7. Thao tác Python và Excel để làm báo cáo tự động
Sử dụng Python thao tác cơ bản dữ liệu
Dùng hàm Python
Thao tác Python và Excel: làm báo cáo tự động
Xử lý bài toán thực tế của giảng viên
8. Module, package, đối tượng, và lớp
Module: khái niệm, cách tạo
Package: khái niệm, cách tạo
Lệnh import
Khái niệm lớp và đối tượng
Tạo lớp và đối tượng
Sử dụng lớp và đối tượng
Các thao tác nâng cao với các kiểu dữ liệu chuẩn trong Python
Thực hành 8
9 – 10 – 11. Tự động truy vấn dữ liệu với SQL và Python
Giới thiệu về SQL
Các khái niệm cơ bản trong cơ sở dữ liệu quan hệ-RDBMS
Một số CSDL quan hệ
Các lệnh SQL cơ bản
Các mệnh đề SQL: (SQL DISTINCT, SQL WHERE, SQL AND/OR, SQL IN, SQL BETWEEN, SQL LIKE, SQL ORDER BY, SQL GROUP BY, SQL COUNT, SQL HAVING)
Thư viện MySQL
Kết nối Python với MySQL
Câu lệnh SELECT (Phương thức fetchall, Phương thức fetchone, Phương thức fetchmany)
Tham số hóa dữ liệu truyền vào câu truy vấn với prepared statement
Thực hành 9
12 – 13. Xử lý dữ liệu với Pandas
Khái niệm
Cơ bản về Dataframe
Các cấu trúc dữ liệu trong Pandas
Các thao tác xử lý dữ liệu với Pandas (hợp-merge, kết nối-join, nhóm-group, sắp xếp-sort, thêm cột, bớt cột, xử lý dữ liệu thiếu, làm sạch dữ liệu, …)
Thực hành 10: Xử lý dữ liệu
14. Thao tác Python và SQL, ứng dụng thư viện Pandas để xử lý dữ liệu nâng cao
Làm sạch dữ liệu
Truy vấn và kết nối dữ liệu
Thao tác Python và SQL, ứng dụng thư viện Pandas
Xử lý bài toán thực tế của giảng viên
15-16. Trực quan hóa dữ liệu với Matplotlib
Giới thiệu về trực quan hóa dữ liệu
Trực quan hóa dữ liệu với Matplotlib (biểu đồ đường, cột, tròn, kết hợp, histogram, box plot, …)
Thực hành 12: Thực hành trực quan hóa dữ liệu với Seaborn
17. Phân cụm dữ liệu với K-means
Học giám sát và không giám sát
Khái niệm phân cụm dữ liệu
Ý nghĩa của bài toán phân cụm dữ liệu
Phương pháp phân cụm dữ liệu
Phương pháp chọn K
Thực hành 13: Thực hành qua ví dụ áp dụng thực tế
18. Thực hành tổng hợp Phân tích dữ liệu với Python
Ghi file lên Google Drive
Ghi dữ liệu ra nhiều sheet
Ghi nhiều bảng ra 1 sheet
Ghi bảng dữ liệu có cấu trúc phức tạp
Ẩn cột trong file Excel
Tạo format khi ghi dữ liệu
Thêm chart vào file Excel
Thực hành 6: Thực hành ghi dữ liệu ra file Excel
19. Khám phá và phân tích dữ liệu
Sử dụng Python thao tác cơ bản dữ liệu
Dùng hàm Python
Thao tác Python và Excel
Xử lý bài toán thực tế của giảng viên
20. Thực hành tổng hợp Phân tích dữ liệu với Python
Dựa trên bộ dữ liệu thực tế học viên tiến hành:
Trực quan hóa dữ liệu
Phân tích dữ liệu
Phân cụm dữ liệu
Phát hiện ngoại lai
Module 1: Giới thiệu về khóa học phương pháp phân tích định lượng, ngôn ngữ thống kê, ngôn ngữ lập trình
Phương pháp phân tích định lượng;
Ngôn ngữ lập trình python và ngôn ngữ thống kê R, Python
Module 2: Thống kê mô tả
Mẫu, chọn và phân phối mẫu;
Ước lượng và kiểm định;
Thực hành trên R và Python
Module 3: Biểu diễn trực quan dữ liệu
Biểu diễn dữ liệu
Các loại biểu đồ và ý nghĩa;
Mất mát dữ liệu và xử lý;
Thực hành trên R và Python
Module 4: Dự báo bằng mô hình hồi quy tuyến tính
Giới thiệu và diễn giải mô hình hồi quy tuyến tính;
Đánh giá mô hình;
Thực hành trên R và Python
Module 5: Dự báo bằng mô hình hồi quy đa biến
Hồi quy đa biến
Giới thiệu và diễn giải mô hình;
Cộng tuyến trong hồi quy đa biến;
Tìm mô hình tối ưu;
Thực hành trên R và Python
Module 6: Hồi quy phi tuyến
Giới thiệu mô hình hồi quy phi tuyến;
Diễn giải mô hình;
Thực hành trên R. và Python
Module 7: Hồi quy dữ liệu bảng
Giới thiệu và diễn giải mô hình hồi quy dạng bảng;
Thực hành trên R và Python
Module 8: Ứng dụng mô hình hồi quy trong bài toán thực tế
Giới thiệu các bài toán;
Mô hình thống kê cho bài toán;
Kiểm định mô hình;
Thực hành trên R và Python
1. Tổng quan về phân tích dữ liệu
Tổng quan về phân tích dữ liệu
Các level của phân tích dữ liệu
Hệ thống kiến trúc phân tích dữ liệu trong Doanh Nghiệp
Data Tab cơ bản
2. Quy trình ETL tổng hợp, trích xuất và chuẩn hóa dữ liệu
ETL (Extract, Transform, Load)
Kiến thức về OLAP, các thao tác với dữ liệu trong OLAP
Xử lý dữ liệu với với Pivot Table, Pivot Chart
3. Quản trị dữ liệu số
Nguyên lý về quản trị dữ liệu dạng số 1. (DAKHASAPHATO). (Tư duy xây dựng dashboard dữ liệu)
Tổng hợp dữ liệu và xây dự báo cáo dashboard
4. Thực hành ETL trên Power Query
Nguyên lý về quản trị dữ liệu dạng số 2. (6 tầng dữ liệu và Tư duy phân tích)
Data Tab nâng cao với Power Query
5. Project thực tế
Project thực tế
Chia sẻ định hướng sau khóa học
Tư vấn, hỗ trợ các giải pháp doanh nghiệp
Module 1: Thành thạo SQL trên hệ quản trị cơ sở dữ liệu MySQL
Thiết lập môi trường làm việc thực hành
Tạo CSDL mẫu để làm việc
Truy vấn dữ 2 liệu theo yêu cầu
Xây dựng và phân tích lược đồ
Truy vấn các bảng hệ thống CSDL
Thao tác dữ liệu
Tạo các thành phần của CSDL
Kết nối cơ sở dữ liệu
Module 2: Nắm được tư duy về cơ sở dữ liệu
Tổng quan về CSDL
Truy vấn dữ liệu cơ bản
Tìm hiểu cấu trúc của CSDL
Truy vấn dữ liệu nâng cao
Cập nhật dữ liệu
Các khái niệm CSDL theo ngôn ngữ nghiệp vụ
Kết nối CSDL với Excel, Power BI
1. Giới thiệu về Power BI & Ứng dụng trong phân tích trực quan hóa dữ liệu
• Tổng quan về Power BI
• Kết nối nguồn dữ liệu vào Power BI
• Xây dựng Dashboard đơn giản trên Power BI
• Giới thiệu Power BI Service
2. Thực hành các thao tác với dữ liệu trên Power Query• Tổng quan về Power Query
• Giới thiệu các chức năng cơ bản trong Power Query
• Giới thiệu cơ bản về M trong Power Query
• Bài tập thực hành
3. Giới thiệu về Data Model trong Power BI
• Khái niệm về Data Model và lược đồ dữ liệu
• Data Model trong Power BI
• Thực hành liên kết dữ liệu trong Power BI Desktop
• Case Study AW2017 Database
4. Thiết kế Dashboard theo quy chuẩn
• Hiển thị và trực quan hóa dữ liệu
• Bài tập thực hành 1
• 15 quy tắc để xây dựng dashboard chuẩn
• Bài tập thực hành 2
5. Lập trình DAX cơ bản
• Tổng quan về DAX
• Giới thiệu về Calculated Measure, Calculated Column, Calculate Table
• Ví dụ về các hàm cơ bản
• Bài tập thực hành
6. Lập trình DAX trong Power BI (tiếp)
• Các Iterator Functions
• Các hàm Time Intelligence
• Hàm Userelationship
• Hàm Summarize
7. Thực hiện các phân tích trong Power BI• Thống kê tổng hợp• Xác định outlier với visual trong Power BI
• Time series analysis
• Sử dụng Advanced visual trong Power BI
8. Thiết kế Interactive Reports trong Power BI – Chỉnh sửa Report interactions
• Thêm Drillthrough cho visual
• Tạo, liên kết với các Bookmark trong Report
• Sử dụng “What-If” parameter
• Thực hành tạo 1 báo cáo Interactive Dashboard
9. Capstone Project – Bài trắc nghiệm cá nhân cuối khóa
• Ứng dụng và thực hành vào bài Capstone Project
• Gợi ý/ Chữa bài Capstone Project
• Hướng dẫn phần Xây dựng Interactive Dashboard
10. Tổng kết – Chữa bài tâp
• Nhận xét, chữa Project cuối khóa
• Tổng kết nội dung chương trình học
1. Tổng quan về Python
Máy tính và ngôn ngữ lập trình
Giới thiệu về Python
Môi trường lập trình Python
Jupyter Notebook và Google Colab
Giới thiệu các chương trình Python
2. Cú pháp Python cơ bản (gán giá trị biến và tìm kiểu dữ liệu)
Cú pháp Python cơ bản
Khái niệm biến
Lệnh gán giá trị cho biến
Các kiểu dữ liệu cơ bản
Thực hành 1: Thực hành gán gí trị biến và tìm kiểu dữ liệu
3. Toán tử, lệnh rẽ nhánh, và vòng lặp
Khái niệm
Các toán tử trong Python
Thứ tự ưu tiên toán tử
Lệnh rẽ nhánh
Vòng lặp
Thực hành toán tử, lệnh rẽ nhánh, và vòng lặp
4. Sử dụng hàm để xử lý dữ liệu
Giới thiệu về hàm
Các loại đối số hàm trong Python
Biến cục bộ và biến toàn cục
Thay đổi giá trị tham số hàm
Hàm trả về nhiều giá trị
Hàm lambda
Thực hành 4: Sử dụng hàm để xử lý dữ liệu
5. Đọc dữ liệu từ file Excel
Đọc file cục bộ
Đọc file trên Google Drive
Ghi nhiều bảng ra 1 sheet
Đọc dữ liệu từ nhiều sheet
Đọc dữ liệu từ nhiều bảng trong 1 sheet
Đọc dữ liệu từ các bảng có cấu trúc phức tạp
Thực hành 5: Thực hành đọc dữ liệu
6. Ghi dữ liệu ra file Excel
Ghi file lên Google Drive
Ghi dữ liệu ra nhiều sheet
Ghi nhiều bảng ra 1 sheet
Ghi bảng dữ liệu có cấu trúc phức tạp
Ẩn cột trong file Excel
Tạo format khi ghi dữ liệu
Thêm chart vào file Excel
Thực hành 6: Thực hành ghi dữ liệu ra file Excel
7. Thao tác Python và Excel để làm báo cáo tự động
Sử dụng Python thao tác cơ bản dữ liệu
Dùng hàm Python
Thao tác Python và Excel: làm báo cáo tự động
Xử lý bài toán thực tế của giảng viên
8. Module, package, đối tượng, và lớp
Module: khái niệm, cách tạo
Package: khái niệm, cách tạo
Lệnh import
Khái niệm lớp và đối tượng
Tạo lớp và đối tượng
Sử dụng lớp và đối tượng
Các thao tác nâng cao với các kiểu dữ liệu chuẩn trong Python
Thực hành 8
9 – 10 – 11. Tự động truy vấn dữ liệu với SQL và Python
Giới thiệu về SQL
Các khái niệm cơ bản trong cơ sở dữ liệu quan hệ-RDBMS
Một số CSDL quan hệ
Các lệnh SQL cơ bản
Các mệnh đề SQL: (SQL DISTINCT, SQL WHERE, SQL AND/OR, SQL IN, SQL BETWEEN, SQL LIKE, SQL ORDER BY, SQL GROUP BY, SQL COUNT, SQL HAVING)
Thư viện MySQL
Kết nối Python với MySQL
Câu lệnh SELECT (Phương thức fetchall, Phương thức fetchone, Phương thức fetchmany)
Tham số hóa dữ liệu truyền vào câu truy vấn với prepared statement
Thực hành 9
12 – 13. Xử lý dữ liệu với Pandas
Khái niệm
Cơ bản về Dataframe
Các cấu trúc dữ liệu trong Pandas
Các thao tác xử lý dữ liệu với Pandas (hợp-merge, kết nối-join, nhóm-group, sắp xếp-sort, thêm cột, bớt cột, xử lý dữ liệu thiếu, làm sạch dữ liệu, …)
Thực hành 10: Xử lý dữ liệu
14. Thao tác Python và SQL, ứng dụng thư viện Pandas để xử lý dữ liệu nâng cao
Làm sạch dữ liệu
Truy vấn và kết nối dữ liệu
Thao tác Python và SQL, ứng dụng thư viện Pandas
Xử lý bài toán thực tế của giảng viên
15-16. Trực quan hóa dữ liệu với Matplotlib
Giới thiệu về trực quan hóa dữ liệu
Trực quan hóa dữ liệu với Matplotlib (biểu đồ đường, cột, tròn, kết hợp, histogram, box plot, …)
Thực hành 12: Thực hành trực quan hóa dữ liệu với Seaborn
17. Phân cụm dữ liệu với K-means
Học giám sát và không giám sát
Khái niệm phân cụm dữ liệu
Ý nghĩa của bài toán phân cụm dữ liệu
Phương pháp phân cụm dữ liệu
Phương pháp chọn K
Thực hành 13: Thực hành qua ví dụ áp dụng thực tế
18. Thực hành tổng hợp Phân tích dữ liệu với Python
Ghi file lên Google Drive
Ghi dữ liệu ra nhiều sheet
Ghi nhiều bảng ra 1 sheet
Ghi bảng dữ liệu có cấu trúc phức tạp
Ẩn cột trong file Excel
Tạo format khi ghi dữ liệu
Thêm chart vào file Excel
Thực hành 6: Thực hành ghi dữ liệu ra file Excel
19. Khám phá và phân tích dữ liệu
Sử dụng Python thao tác cơ bản dữ liệu
Dùng hàm Python
Thao tác Python và Excel
Xử lý bài toán thực tế của giảng viên
20. Thực hành tổng hợp Phân tích dữ liệu với Python
Dựa trên bộ dữ liệu thực tế học viên tiến hành:
Trực quan hóa dữ liệu
Phân tích dữ liệu
Phân cụm dữ liệu
Phát hiện ngoại lai
Module 1: Giới thiệu về khóa học phương pháp phân tích định lượng, ngôn ngữ thống kê, ngôn ngữ lập trình
Phương pháp phân tích định lượng;
Ngôn ngữ lập trình python và ngôn ngữ thống kê R, Python
Module 2: Thống kê mô tả
Mẫu, chọn và phân phối mẫu;
Ước lượng và kiểm định;
Thực hành trên R và Python
Module 3: Biểu diễn trực quan dữ liệu
Biểu diễn dữ liệu
Các loại biểu đồ và ý nghĩa;
Mất mát dữ liệu và xử lý;
Thực hành trên R và Python
Module 4: Dự báo bằng mô hình hồi quy tuyến tính
Giới thiệu và diễn giải mô hình hồi quy tuyến tính;
Đánh giá mô hình;
Thực hành trên R và Python
Module 5: Dự báo bằng mô hình hồi quy đa biến
Hồi quy đa biến
Giới thiệu và diễn giải mô hình;
Cộng tuyến trong hồi quy đa biến;
Tìm mô hình tối ưu;
Thực hành trên R và Python
Module 6: Hồi quy phi tuyến
Giới thiệu mô hình hồi quy phi tuyến;
Diễn giải mô hình;
Thực hành trên R. và Python
Module 7: Hồi quy dữ liệu bảng
Giới thiệu và diễn giải mô hình hồi quy dạng bảng;
Thực hành trên R và Python
Module 8: Ứng dụng mô hình hồi quy trong bài toán thực tế
Giới thiệu các bài toán;
Mô hình thống kê cho bài toán;
Kiểm định mô hình;
Thực hành trên R và Python
Lộ trình học
1. Tổng quan về phân tích dữ liệu
Tổng quan về phân tích dữ liệu
Các level của phân tích dữ liệu
Hệ thống kiến trúc phân tích dữ liệu trong Doanh Nghiệp
Data Tab cơ bản
2. Quy trình ETL tổng hợp, trích xuất và chuẩn hóa dữ liệu
ETL (Extract, Transform, Load)
Kiến thức về OLAP, các thao tác với dữ liệu trong OLAP
Xử lý dữ liệu với với Pivot Table, Pivot Chart
3. Quản trị dữ liệu số
Nguyên lý về quản trị dữ liệu dạng số 1. (DAKHASAPHATO). (Tư duy xây dựng dashboard dữ liệu)
Tổng hợp dữ liệu và xây dự báo cáo dashboard
4. Thực hành ETL trên Power Query
Nguyên lý về quản trị dữ liệu dạng số 2. (6 tầng dữ liệu và Tư duy phân tích)
Data Tab nâng cao với Power Query
5. Project thực tế
Project thực tế
Chia sẻ định hướng sau khóa học
Tư vấn, hỗ trợ các giải pháp doanh nghiệp
Module 1: Thành thạo SQL trên hệ quản trị cơ sở dữ liệu MySQL
Thiết lập môi trường làm việc thực hành
Tạo CSDL mẫu để làm việc
Truy vấn dữ 2 liệu theo yêu cầu
Xây dựng và phân tích lược đồ
Truy vấn các bảng hệ thống CSDL
Thao tác dữ liệu
Tạo các thành phần của CSDL
Kết nối cơ sở dữ liệu
Module 2: Nắm được tư duy về cơ sở dữ liệu
Tổng quan về CSDL
Truy vấn dữ liệu cơ bản
Tìm hiểu cấu trúc của CSDL
Truy vấn dữ liệu nâng cao
Cập nhật dữ liệu
Các khái niệm CSDL theo ngôn ngữ nghiệp vụ
Kết nối CSDL với Excel, Power BI
1. Giới thiệu về Power BI & Ứng dụng trong phân tích trực quan hóa dữ liệu
• Tổng quan về Power BI
• Kết nối nguồn dữ liệu vào Power BI
• Xây dựng Dashboard đơn giản trên Power BI
• Giới thiệu Power BI Service
2. Thực hành các thao tác với dữ liệu trên Power Query• Tổng quan về Power Query
• Giới thiệu các chức năng cơ bản trong Power Query
• Giới thiệu cơ bản về M trong Power Query
• Bài tập thực hành
3. Giới thiệu về Data Model trong Power BI
• Khái niệm về Data Model và lược đồ dữ liệu
• Data Model trong Power BI
• Thực hành liên kết dữ liệu trong Power BI Desktop
• Case Study AW2017 Database
4. Thiết kế Dashboard theo quy chuẩn
• Hiển thị và trực quan hóa dữ liệu
• Bài tập thực hành 1
• 15 quy tắc để xây dựng dashboard chuẩn
• Bài tập thực hành 2
5. Lập trình DAX cơ bản
• Tổng quan về DAX
• Giới thiệu về Calculated Measure, Calculated Column, Calculate Table
• Ví dụ về các hàm cơ bản
• Bài tập thực hành
6. Lập trình DAX trong Power BI (tiếp)
• Các Iterator Functions
• Các hàm Time Intelligence
• Hàm Userelationship
• Hàm Summarize
7. Thực hiện các phân tích trong Power BI• Thống kê tổng hợp• Xác định outlier với visual trong Power BI
• Time series analysis
• Sử dụng Advanced visual trong Power BI
8. Thiết kế Interactive Reports trong Power BI – Chỉnh sửa Report interactions
• Thêm Drillthrough cho visual
• Tạo, liên kết với các Bookmark trong Report
• Sử dụng “What-If” parameter
• Thực hành tạo 1 báo cáo Interactive Dashboard
9. Capstone Project – Bài trắc nghiệm cá nhân cuối khóa
• Ứng dụng và thực hành vào bài Capstone Project
• Gợi ý/ Chữa bài Capstone Project
• Hướng dẫn phần Xây dựng Interactive Dashboard
10. Tổng kết – Chữa bài tâp
• Nhận xét, chữa Project cuối khóa
• Tổng kết nội dung chương trình học
1. Tổng quan về Python
Máy tính và ngôn ngữ lập trình
Giới thiệu về Python
Môi trường lập trình Python
Jupyter Notebook và Google Colab
Giới thiệu các chương trình Python
2. Cú pháp Python cơ bản (gán giá trị biến và tìm kiểu dữ liệu)
Cú pháp Python cơ bản
Khái niệm biến
Lệnh gán giá trị cho biến
Các kiểu dữ liệu cơ bản
Thực hành 1: Thực hành gán gí trị biến và tìm kiểu dữ liệu
3. Toán tử, lệnh rẽ nhánh, và vòng lặp
Khái niệm
Các toán tử trong Python
Thứ tự ưu tiên toán tử
Lệnh rẽ nhánh
Vòng lặp
Thực hành toán tử, lệnh rẽ nhánh, và vòng lặp
4. Sử dụng hàm để xử lý dữ liệu
Giới thiệu về hàm
Các loại đối số hàm trong Python
Biến cục bộ và biến toàn cục
Thay đổi giá trị tham số hàm
Hàm trả về nhiều giá trị
Hàm lambda
Thực hành 4: Sử dụng hàm để xử lý dữ liệu
5. Đọc dữ liệu từ file Excel
Đọc file cục bộ
Đọc file trên Google Drive
Ghi nhiều bảng ra 1 sheet
Đọc dữ liệu từ nhiều sheet
Đọc dữ liệu từ nhiều bảng trong 1 sheet
Đọc dữ liệu từ các bảng có cấu trúc phức tạp
Thực hành 5: Thực hành đọc dữ liệu
6. Ghi dữ liệu ra file Excel
Ghi file lên Google Drive
Ghi dữ liệu ra nhiều sheet
Ghi nhiều bảng ra 1 sheet
Ghi bảng dữ liệu có cấu trúc phức tạp
Ẩn cột trong file Excel
Tạo format khi ghi dữ liệu
Thêm chart vào file Excel
Thực hành 6: Thực hành ghi dữ liệu ra file Excel
7. Thao tác Python và Excel để làm báo cáo tự động
Sử dụng Python thao tác cơ bản dữ liệu
Dùng hàm Python
Thao tác Python và Excel: làm báo cáo tự động
Xử lý bài toán thực tế của giảng viên
8. Module, package, đối tượng, và lớp
Module: khái niệm, cách tạo
Package: khái niệm, cách tạo
Lệnh import
Khái niệm lớp và đối tượng
Tạo lớp và đối tượng
Sử dụng lớp và đối tượng
Các thao tác nâng cao với các kiểu dữ liệu chuẩn trong Python
Thực hành 8
9 – 10 – 11. Tự động truy vấn dữ liệu với SQL và Python
Giới thiệu về SQL
Các khái niệm cơ bản trong cơ sở dữ liệu quan hệ-RDBMS
Một số CSDL quan hệ
Các lệnh SQL cơ bản
Các mệnh đề SQL: (SQL DISTINCT, SQL WHERE, SQL AND/OR, SQL IN, SQL BETWEEN, SQL LIKE, SQL ORDER BY, SQL GROUP BY, SQL COUNT, SQL HAVING)
Thư viện MySQL
Kết nối Python với MySQL
Câu lệnh SELECT (Phương thức fetchall, Phương thức fetchone, Phương thức fetchmany)
Tham số hóa dữ liệu truyền vào câu truy vấn với prepared statement
Thực hành 9
12 – 13. Xử lý dữ liệu với Pandas
Khái niệm
Cơ bản về Dataframe
Các cấu trúc dữ liệu trong Pandas
Các thao tác xử lý dữ liệu với Pandas (hợp-merge, kết nối-join, nhóm-group, sắp xếp-sort, thêm cột, bớt cột, xử lý dữ liệu thiếu, làm sạch dữ liệu, …)
Thực hành 10: Xử lý dữ liệu
14. Thao tác Python và SQL, ứng dụng thư viện Pandas để xử lý dữ liệu nâng cao
Làm sạch dữ liệu
Truy vấn và kết nối dữ liệu
Thao tác Python và SQL, ứng dụng thư viện Pandas
Xử lý bài toán thực tế của giảng viên
15-16. Trực quan hóa dữ liệu với Matplotlib
Giới thiệu về trực quan hóa dữ liệu
Trực quan hóa dữ liệu với Matplotlib (biểu đồ đường, cột, tròn, kết hợp, histogram, box plot, …)
Thực hành 12: Thực hành trực quan hóa dữ liệu với Seaborn
17. Phân cụm dữ liệu với K-means
Học giám sát và không giám sát
Khái niệm phân cụm dữ liệu
Ý nghĩa của bài toán phân cụm dữ liệu
Phương pháp phân cụm dữ liệu
Phương pháp chọn K
Thực hành 13: Thực hành qua ví dụ áp dụng thực tế
18. Thực hành tổng hợp Phân tích dữ liệu với Python
Ghi file lên Google Drive
Ghi dữ liệu ra nhiều sheet
Ghi nhiều bảng ra 1 sheet
Ghi bảng dữ liệu có cấu trúc phức tạp
Ẩn cột trong file Excel
Tạo format khi ghi dữ liệu
Thêm chart vào file Excel
Thực hành 6: Thực hành ghi dữ liệu ra file Excel
19. Khám phá và phân tích dữ liệu
Sử dụng Python thao tác cơ bản dữ liệu
Dùng hàm Python
Thao tác Python và Excel
Xử lý bài toán thực tế của giảng viên
20. Thực hành tổng hợp Phân tích dữ liệu với Python
Dựa trên bộ dữ liệu thực tế học viên tiến hành:
Trực quan hóa dữ liệu
Phân tích dữ liệu
Phân cụm dữ liệu
Phát hiện ngoại lai
Module 1: Giới thiệu về khóa học phương pháp phân tích định lượng, ngôn ngữ thống kê, ngôn ngữ lập trình
Phương pháp phân tích định lượng;
Ngôn ngữ lập trình python và ngôn ngữ thống kê R, Python
Module 2: Thống kê mô tả
Mẫu, chọn và phân phối mẫu;
Ước lượng và kiểm định;
Thực hành trên R và Python
Module 3: Biểu diễn trực quan dữ liệu
Biểu diễn dữ liệu
Các loại biểu đồ và ý nghĩa;
Mất mát dữ liệu và xử lý;
Thực hành trên R và Python
Module 4: Dự báo bằng mô hình hồi quy tuyến tính
Giới thiệu và diễn giải mô hình hồi quy tuyến tính;
Đánh giá mô hình;
Thực hành trên R và Python
Module 5: Dự báo bằng mô hình hồi quy đa biến
Hồi quy đa biến
Giới thiệu và diễn giải mô hình;
Cộng tuyến trong hồi quy đa biến;
Tìm mô hình tối ưu;
Thực hành trên R và Python
Module 6: Hồi quy phi tuyến
Giới thiệu mô hình hồi quy phi tuyến;
Diễn giải mô hình;
Thực hành trên R. và Python
Module 7: Hồi quy dữ liệu bảng
Giới thiệu và diễn giải mô hình hồi quy dạng bảng;
Thực hành trên R và Python
Module 8: Ứng dụng mô hình hồi quy trong bài toán thực tế
Giới thiệu các bài toán;
Mô hình thống kê cho bài toán;
Kiểm định mô hình;
Thực hành trên R và Python
1. Tổng quan về phân tích dữ liệu
Tổng quan về phân tích dữ liệu
Các level của phân tích dữ liệu
Hệ thống kiến trúc phân tích dữ liệu trong Doanh Nghiệp
Data Tab cơ bản
2. Quy trình ETL tổng hợp, trích xuất và chuẩn hóa dữ liệu
ETL (Extract, Transform, Load)
Kiến thức về OLAP, các thao tác với dữ liệu trong OLAP
Xử lý dữ liệu với với Pivot Table, Pivot Chart
3. Quản trị dữ liệu số
Nguyên lý về quản trị dữ liệu dạng số 1. (DAKHASAPHATO). (Tư duy xây dựng dashboard dữ liệu)
Tổng hợp dữ liệu và xây dự báo cáo dashboard
4. Thực hành ETL trên Power Query
Nguyên lý về quản trị dữ liệu dạng số 2. (6 tầng dữ liệu và Tư duy phân tích)
Data Tab nâng cao với Power Query
5. Project thực tế
Project thực tế
Chia sẻ định hướng sau khóa học
Tư vấn, hỗ trợ các giải pháp doanh nghiệp
Module 1: Thành thạo SQL trên hệ quản trị cơ sở dữ liệu MySQL
Thiết lập môi trường làm việc thực hành
Tạo CSDL mẫu để làm việc
Truy vấn dữ 2 liệu theo yêu cầu
Xây dựng và phân tích lược đồ
Truy vấn các bảng hệ thống CSDL
Thao tác dữ liệu
Tạo các thành phần của CSDL
Kết nối cơ sở dữ liệu
Module 2: Nắm được tư duy về cơ sở dữ liệu
Tổng quan về CSDL
Truy vấn dữ liệu cơ bản
Tìm hiểu cấu trúc của CSDL
Truy vấn dữ liệu nâng cao
Cập nhật dữ liệu
Các khái niệm CSDL theo ngôn ngữ nghiệp vụ
Kết nối CSDL với Excel, Power BI
1. Giới thiệu về Power BI & Ứng dụng trong phân tích trực quan hóa dữ liệu
• Tổng quan về Power BI
• Kết nối nguồn dữ liệu vào Power BI
• Xây dựng Dashboard đơn giản trên Power BI
• Giới thiệu Power BI Service
2. Thực hành các thao tác với dữ liệu trên Power Query• Tổng quan về Power Query
• Giới thiệu các chức năng cơ bản trong Power Query
• Giới thiệu cơ bản về M trong Power Query
• Bài tập thực hành
3. Giới thiệu về Data Model trong Power BI
• Khái niệm về Data Model và lược đồ dữ liệu
• Data Model trong Power BI
• Thực hành liên kết dữ liệu trong Power BI Desktop
• Case Study AW2017 Database
4. Thiết kế Dashboard theo quy chuẩn
• Hiển thị và trực quan hóa dữ liệu
• Bài tập thực hành 1
• 15 quy tắc để xây dựng dashboard chuẩn
• Bài tập thực hành 2
5. Lập trình DAX cơ bản
• Tổng quan về DAX
• Giới thiệu về Calculated Measure, Calculated Column, Calculate Table
• Ví dụ về các hàm cơ bản
• Bài tập thực hành
6. Lập trình DAX trong Power BI (tiếp)
• Các Iterator Functions
• Các hàm Time Intelligence
• Hàm Userelationship
• Hàm Summarize
7. Thực hiện các phân tích trong Power BI• Thống kê tổng hợp• Xác định outlier với visual trong Power BI
• Time series analysis
• Sử dụng Advanced visual trong Power BI
8. Thiết kế Interactive Reports trong Power BI – Chỉnh sửa Report interactions
• Thêm Drillthrough cho visual
• Tạo, liên kết với các Bookmark trong Report
• Sử dụng “What-If” parameter
• Thực hành tạo 1 báo cáo Interactive Dashboard
9. Capstone Project – Bài trắc nghiệm cá nhân cuối khóa
• Ứng dụng và thực hành vào bài Capstone Project
• Gợi ý/ Chữa bài Capstone Project
• Hướng dẫn phần Xây dựng Interactive Dashboard
10. Tổng kết – Chữa bài tâp
• Nhận xét, chữa Project cuối khóa
• Tổng kết nội dung chương trình học
1. Tổng quan về Python
Máy tính và ngôn ngữ lập trình
Giới thiệu về Python
Môi trường lập trình Python
Jupyter Notebook và Google Colab
Giới thiệu các chương trình Python
2. Cú pháp Python cơ bản (gán giá trị biến và tìm kiểu dữ liệu)
Cú pháp Python cơ bản
Khái niệm biến
Lệnh gán giá trị cho biến
Các kiểu dữ liệu cơ bản
Thực hành 1: Thực hành gán gí trị biến và tìm kiểu dữ liệu
3. Toán tử, lệnh rẽ nhánh, và vòng lặp
Khái niệm
Các toán tử trong Python
Thứ tự ưu tiên toán tử
Lệnh rẽ nhánh
Vòng lặp
Thực hành toán tử, lệnh rẽ nhánh, và vòng lặp
4. Sử dụng hàm để xử lý dữ liệu
Giới thiệu về hàm
Các loại đối số hàm trong Python
Biến cục bộ và biến toàn cục
Thay đổi giá trị tham số hàm
Hàm trả về nhiều giá trị
Hàm lambda
Thực hành 4: Sử dụng hàm để xử lý dữ liệu
5. Đọc dữ liệu từ file Excel
Đọc file cục bộ
Đọc file trên Google Drive
Ghi nhiều bảng ra 1 sheet
Đọc dữ liệu từ nhiều sheet
Đọc dữ liệu từ nhiều bảng trong 1 sheet
Đọc dữ liệu từ các bảng có cấu trúc phức tạp
Thực hành 5: Thực hành đọc dữ liệu
6. Ghi dữ liệu ra file Excel
Ghi file lên Google Drive
Ghi dữ liệu ra nhiều sheet
Ghi nhiều bảng ra 1 sheet
Ghi bảng dữ liệu có cấu trúc phức tạp
Ẩn cột trong file Excel
Tạo format khi ghi dữ liệu
Thêm chart vào file Excel
Thực hành 6: Thực hành ghi dữ liệu ra file Excel
7. Thao tác Python và Excel để làm báo cáo tự động
Sử dụng Python thao tác cơ bản dữ liệu
Dùng hàm Python
Thao tác Python và Excel: làm báo cáo tự động
Xử lý bài toán thực tế của giảng viên
8. Module, package, đối tượng, và lớp
Module: khái niệm, cách tạo
Package: khái niệm, cách tạo
Lệnh import
Khái niệm lớp và đối tượng
Tạo lớp và đối tượng
Sử dụng lớp và đối tượng
Các thao tác nâng cao với các kiểu dữ liệu chuẩn trong Python
Thực hành 8
9 – 10 – 11. Tự động truy vấn dữ liệu với SQL và Python
Giới thiệu về SQL
Các khái niệm cơ bản trong cơ sở dữ liệu quan hệ-RDBMS
Một số CSDL quan hệ
Các lệnh SQL cơ bản
Các mệnh đề SQL: (SQL DISTINCT, SQL WHERE, SQL AND/OR, SQL IN, SQL BETWEEN, SQL LIKE, SQL ORDER BY, SQL GROUP BY, SQL COUNT, SQL HAVING)
Thư viện MySQL
Kết nối Python với MySQL
Câu lệnh SELECT (Phương thức fetchall, Phương thức fetchone, Phương thức fetchmany)
Tham số hóa dữ liệu truyền vào câu truy vấn với prepared statement
Thực hành 9
12 – 13. Xử lý dữ liệu với Pandas
Khái niệm
Cơ bản về Dataframe
Các cấu trúc dữ liệu trong Pandas
Các thao tác xử lý dữ liệu với Pandas (hợp-merge, kết nối-join, nhóm-group, sắp xếp-sort, thêm cột, bớt cột, xử lý dữ liệu thiếu, làm sạch dữ liệu, …)
Thực hành 10: Xử lý dữ liệu
14. Thao tác Python và SQL, ứng dụng thư viện Pandas để xử lý dữ liệu nâng cao
Làm sạch dữ liệu
Truy vấn và kết nối dữ liệu
Thao tác Python và SQL, ứng dụng thư viện Pandas
Xử lý bài toán thực tế của giảng viên
15-16. Trực quan hóa dữ liệu với Matplotlib
Giới thiệu về trực quan hóa dữ liệu
Trực quan hóa dữ liệu với Matplotlib (biểu đồ đường, cột, tròn, kết hợp, histogram, box plot, …)
Thực hành 12: Thực hành trực quan hóa dữ liệu với Seaborn
17. Phân cụm dữ liệu với K-means
Học giám sát và không giám sát
Khái niệm phân cụm dữ liệu
Ý nghĩa của bài toán phân cụm dữ liệu
Phương pháp phân cụm dữ liệu
Phương pháp chọn K
Thực hành 13: Thực hành qua ví dụ áp dụng thực tế
18. Thực hành tổng hợp Phân tích dữ liệu với Python
Ghi file lên Google Drive
Ghi dữ liệu ra nhiều sheet
Ghi nhiều bảng ra 1 sheet
Ghi bảng dữ liệu có cấu trúc phức tạp
Ẩn cột trong file Excel
Tạo format khi ghi dữ liệu
Thêm chart vào file Excel
Thực hành 6: Thực hành ghi dữ liệu ra file Excel
19. Khám phá và phân tích dữ liệu
Sử dụng Python thao tác cơ bản dữ liệu
Dùng hàm Python
Thao tác Python và Excel
Xử lý bài toán thực tế của giảng viên
20. Thực hành tổng hợp Phân tích dữ liệu với Python
Dựa trên bộ dữ liệu thực tế học viên tiến hành:
Trực quan hóa dữ liệu
Phân tích dữ liệu
Phân cụm dữ liệu
Phát hiện ngoại lai
Module 1: Giới thiệu về khóa học phương pháp phân tích định lượng, ngôn ngữ thống kê, ngôn ngữ lập trình
Phương pháp phân tích định lượng;
Ngôn ngữ lập trình python và ngôn ngữ thống kê R, Python
Module 2: Thống kê mô tả
Mẫu, chọn và phân phối mẫu;
Ước lượng và kiểm định;
Thực hành trên R và Python
Module 3: Biểu diễn trực quan dữ liệu
Biểu diễn dữ liệu
Các loại biểu đồ và ý nghĩa;
Mất mát dữ liệu và xử lý;
Thực hành trên R và Python
Module 4: Dự báo bằng mô hình hồi quy tuyến tính
Giới thiệu và diễn giải mô hình hồi quy tuyến tính;
Đánh giá mô hình;
Thực hành trên R và Python
Module 5: Dự báo bằng mô hình hồi quy đa biến
Hồi quy đa biến
Giới thiệu và diễn giải mô hình;
Cộng tuyến trong hồi quy đa biến;
Tìm mô hình tối ưu;
Thực hành trên R và Python
Module 6: Hồi quy phi tuyến
Giới thiệu mô hình hồi quy phi tuyến;
Diễn giải mô hình;
Thực hành trên R. và Python
Module 7: Hồi quy dữ liệu bảng
Giới thiệu và diễn giải mô hình hồi quy dạng bảng;
Thực hành trên R và Python
Module 8: Ứng dụng mô hình hồi quy trong bài toán thực tế
Giảng viên Viện Toán Ứng Dụng - Đại Học Bách Khoa HN
Xây dựng Data Warehouse cho sản phẩm Topica Native.
14+ năm Giảng viên Viện Toán ứng dụng, Đại học Bách Khoa Hà Nội.
Xây dựng chương trình “Phân tích dữ liệu” và đào tạo trực tiếp cho 1000+ nhân sự.
5+ năm kinh nghiệm làm việc thực tế về Quản lý doanh nghiệp, xây dựng hệ thống phần mềm CNTT trên các công cụ lập trình cũng như “Tin học văn phòng” Excel, Google Sheet, Power BI.
Đã đào tạo trực tiếp các phần mềm phân tích và xử lý dữ liệu trên Excel, Google Sheet, Power BI +1000 học viên và đã đào tạo online Excel cho +100K học viên.
Đào tạo/coaching/tư vấn cho nhiều bạn quản lý, chủ doanh nghiệp về một số mảng (xây dựng hệ thống, chiến lược marketing, xây dựng sản phẩm, tài chính, problem solving,.).
Giảng viên bộ môn Khoa học Máy tính; Viện Công nghệ thông tin và truyền thông, trường Đại học Bách khoa Hà Nội.
Tiến sĩ Ban Hà Bằng hiện đang là giảng viên bộ môn Khoa học Máy tính; Viện Công nghệ thông tin và truyền thông, trường Đại học Bách khoa Hà Nội.
Các hướng nghiên cứu quan tâm: phân tích thiết kế thuật toán; các bài toán tối ưu hóa tổ hợp; kiểm thử phần mềm, và trí tuệ nhân tạo.
Sở hữu 15+ công trình nghiên cứu khoa học được công nhận; phát triển các kỹ thuật metaheuristic giải các bài toán tối ưu trong các hệ thống phân tán và hệ thống phần mềm
Kinh nghiệm dày dặn trong tư vấn và triển khai công nghệ số hóa cho nhiều tập đoàn và doanh nghiệp lớn.
Năm 2010, thầy và cộng sự đạt giải nhất Nhân tài đất Việt; với sản phẩm hệ thống số hóa tư duy con người.
Nguyễn Danh Tú
Giảng viên Viện Toán Ứng Dụng - Đại Học Bách Khoa HN
Xây dựng Data Warehouse cho sản phẩm Topica Native.
14+ năm Giảng viên Viện Toán ứng dụng, Đại học Bách Khoa Hà Nội.
Xây dựng chương trình “Phân tích dữ liệu” và đào tạo trực tiếp cho 1000+ nhân sự.
5+ năm kinh nghiệm làm việc thực tế về Quản lý doanh nghiệp, xây dựng hệ thống phần mềm CNTT trên các công cụ lập trình cũng như “Tin học văn phòng” Excel, Google Sheet, Power BI.
Đã đào tạo trực tiếp các phần mềm phân tích và xử lý dữ liệu trên Excel, Google Sheet, Power BI +1000 học viên và đã đào tạo online Excel cho +100K học viên.
Đào tạo/coaching/tư vấn cho nhiều bạn quản lý, chủ doanh nghiệp về một số mảng (xây dựng hệ thống, chiến lược marketing, xây dựng sản phẩm, tài chính, problem solving,.).
Nguyễn Phương Nam
Senior Data Analyst tại Techcombank
Đã đào tạo thành công +250 học viên đã và đang theo nghề Data Analyst nhờ giảng dạy theo khóa học data analysis cole bài bản
Nhà coaching/giảng dạy và đào tạo phòng ban của nhiều doanh nghiệp ứng dụng công cụ Power BI
5+ năm kinh nghiệm trong lĩnh vực Data Analysis.
Từng làm Data Analyst tại Topica, và các ngân hàng lớn, công cụ thanh toán như VCCORP và MBBank.
Trịnh Tuấn Đạt
Giảng viên môn công nghệ phần mềm, trường CNTT&TT Đại Học Bách Khoa HN
Tiến sỹkhoa học máy tính ở Trường ĐH công nghệ Viên, Áo.
Có 10+ công trình nghiên cứu và nhiều bài báo xuất sắc được về công nghệ.
Thủ khoa đầu vào Đại học Bách khoa Hà Nội.
Ban Hà Bằng
Giảng viên bộ môn Khoa học Máy tính; Viện Công nghệ thông tin và truyền thông, trường Đại học Bách khoa Hà Nội.
Tiến sĩ Ban Hà Bằng hiện đang là giảng viên bộ môn Khoa học Máy tính; Viện Công nghệ thông tin và truyền thông, trường Đại học Bách khoa Hà Nội.
Các hướng nghiên cứu quan tâm: phân tích thiết kế thuật toán; các bài toán tối ưu hóa tổ hợp; kiểm thử phần mềm, và trí tuệ nhân tạo.
Sở hữu 15+ công trình nghiên cứu khoa học được công nhận; phát triển các kỹ thuật metaheuristic giải các bài toán tối ưu trong các hệ thống phân tán và hệ thống phần mềm
Kinh nghiệm dày dặn trong tư vấn và triển khai công nghệ số hóa cho nhiều tập đoàn và doanh nghiệp lớn.
Năm 2010, thầy và cộng sự đạt giải nhất Nhân tài đất Việt; với sản phẩm hệ thống số hóa tư duy con người.
Từ con số 0 về lập trình vẫn có thể học được.
Các kỹ thuật và câu lệnh SQL để làm phân tích dữ liệu thì chủ yếu là truy vấn, câu lệnh mô phỏng ngôn ngữ tự nhiên nên sẽ dễ thực hành được luôn. Quan trọng người học phải luyện tập nhiều để thuộc và quen tay.
Lập trình R trong phân tích định lượng không quá khó, những câu lệnh này nó định hình thành 1 quy trình mẫu sẵn rồi, tùy từng bài toán khác nhau sẽ có những biến khác nhau, mình chỉ việc lắp biến vào mà chạy thôi. Ngoài ra ngôn ngữ R còn có thư viện, trong đó có các gói (package) có sẵn để chạy nhiều nhiệm vụ phân tích khác nhau.
Về ngôn ngữ R, thầy dạy từ khái niệm cơ bản, chỉ dẫn từ việc cài đặt cho đến những thao tác đơn giản nhất nên không lo.
Về khóa Python, hoàn toàn theo được, khóa kết hợp dạy python cơ bản trước, rồi sẽ tới vận dụng vào thực tế giải quyết các bài toán.
Trong khóa học, phần lớn học viên xuất phát từ dân kinh tế, nghiên cứu khoa học,… hầu như đều non-IT, cuối khóa vẫn làm bài project tốt.
Quên hết toán rồi vẫn học được vì bây giờ ngta sử dụng R hoặc Python lập trình để chạy, cho ra kết quả luôn chứ ko cần phải làm tính toán nữa.
Tuy nhiên cũng cần hiểu thêm kiến thức tổng quan về thống kê, xác suất, logic là để hiểu được bản chất của việc chạy các mô hình đấy là gì và diễn giải được ý nghĩa từ kết quả.
Yêu cầu đầu vào của các khóa học là chỉ cần biết làm việc với Excel (mặc khóa học ko liên quan gì đến Excel nhưng cũng nên biết tránh bỡ ngỡ quá)
Lý do là bởi hiện nay phần lớn các công ty sử dụng MySQL (chiếm đến 80%) và MySQL không mất phí. Khóa học dạy cái mà nhu cầu thực tế các doanh nghiệp cần, để học viên học xong đi làm áp dụng được luôn vào công việc tại đơn vị doanh nghiệp.
Sau khi kết thúc khóa học, bạn sẽ được cấp chứng nhận hoàn thành khóa học với điều kiện tham gia đủ 80% số buổi học và hoàn thành bài tập cũng như vượt qua bài đánh giá cuối khóa)
Từ con số 0 về lập trình vẫn có thể học được.
Các kỹ thuật và câu lệnh SQL để làm phân tích dữ liệu thì chủ yếu là truy vấn, câu lệnh mô phỏng ngôn ngữ tự nhiên nên sẽ dễ thực hành được luôn. Quan trọng người học phải luyện tập nhiều để thuộc và quen tay.
Lập trình R trong phân tích định lượng không quá khó, những câu lệnh này nó định hình thành 1 quy trình mẫu sẵn rồi, tùy từng bài toán khác nhau sẽ có những biến khác nhau, mình chỉ việc lắp biến vào mà chạy thôi. Ngoài ra ngôn ngữ R còn có thư viện, trong đó có các gói (package) có sẵn để chạy nhiều nhiệm vụ phân tích khác nhau.
Về ngôn ngữ R, thầy dạy từ khái niệm cơ bản, chỉ dẫn từ việc cài đặt cho đến những thao tác đơn giản nhất nên không lo.
Về khóa Python, hoàn toàn theo được, khóa kết hợp dạy python cơ bản trước, rồi sẽ tới vận dụng vào thực tế giải quyết các bài toán.
Trong khóa học, phần lớn học viên xuất phát từ dân kinh tế, nghiên cứu khoa học,… hầu như đều non-IT, cuối khóa vẫn làm bài project tốt.
Quên hết toán rồi vẫn học được vì bây giờ ngta sử dụng R hoặc Python lập trình để chạy, cho ra kết quả luôn chứ ko cần phải làm tính toán nữa.
Tuy nhiên cũng cần hiểu thêm kiến thức tổng quan về thống kê, xác suất, logic là để hiểu được bản chất của việc chạy các mô hình đấy là gì và diễn giải được ý nghĩa từ kết quả.
Yêu cầu đầu vào của các khóa học là chỉ cần biết làm việc với Excel (mặc khóa học ko liên quan gì đến Excel nhưng cũng nên biết tránh bỡ ngỡ quá)
Lý do là bởi hiện nay phần lớn các công ty sử dụng MySQL (chiếm đến 80%) và MySQL không mất phí. Khóa học dạy cái mà nhu cầu thực tế các doanh nghiệp cần, để học viên học xong đi làm áp dụng được luôn vào công việc tại đơn vị doanh nghiệp.
Sau khi kết thúc khóa học, bạn sẽ được cấp chứng nhận hoàn thành khóa học với điều kiện tham gia đủ 80% số buổi học và hoàn thành bài tập cũng như vượt qua bài đánh giá cuối khóa)
Hãy để lại thông tin bên dưới, bộ phận Tư vấn sẽ chủ động liên hệ và trao đổi cùng bạn trong 24 giờ
Cảm nhận học viên
Anh Hoàng Mai Chung
Chủ tịch Meeyland Group – Học viên khóa học chuyển đổi số doanh nghiệp, khóa học phân tích dữ liệu
Chuyển đổi số là xu thế và xu hướng của bất cứ doanh nghiệp nào hiện nay. Là doanh nghiệp về công nghệ, tuy nhiên về phần số hóa quy trình bên mình còn yếu, mình tham gia để hiểu cách làm Data Warehouse trong doanh nghiệp
Sinh viên ngành Logistics – Học viên khóa phân tích dữ liệu với R, khóa chuyển đổi số doanh nghiệp, khóa Data Engineer
Em hiện tại đang là sinh viên ngành logictics, tuy nhiên câu chuyện số hóa được ứng dụng ở bất cứ đâu không chỉ ở tại trường, Em đăng ký học để học thêm kỹ năng cho công việc sau này của mình.
Chairman Sunflower Tekondo – Học viên khóa chuyển đổi số doanh nghiệp, khóa Data Engineer, khóa power BI & SQL
Hiện tại trung tâm đào tạo của mình đang có hợp tác với khoảng hơn 1000 đơn vị trên cả nước, việc quản lý học viên vô cùng khó khăn. Là một người ngoại đạo về lĩnh vực công nghệ, nên mình chưa biết làm thế nào để bắt đầu làm chuyển đổi số cho doanh nghiệp của mình, thấy quảng cáo về khóa học chuyển đổi số doanh nghiệp tại Cole mình đã tham gia, khóa học đã giúp mình có phương pháp để làm các chương trình số hóa cho doanh nghiệp theo từng lộ trình và từng bước để ứng dụng được.
Nhân viên Phòng Tài chính Ngân hàng – Học viên khóa Phân tích dữ liệu từ cơ bản – nâng cao (Excel & Power Query, SQL & Power BI, R&Python)
Hiện tại mình hơn 40 tuổi, làm trong phòng tài chính của 1 Ngân hàng, nhưng mình muốn cải thiện khả năng để theo kịp các bạn trẻ với những xu hướng chuyển đổi số diễn ra mạnh mẽ mình không muốn lỡ cơ hội trong thời kỳ dịch chuyển số hóa như hiện nay
Giám đốc tập đoàn tài chính Fiin – Học viên khóa chuyển đổi số doanh nghiệp, phân tích nghiệp vụ kinh doanh
Mình gặp khó khăn trong việc tiếp cận về việc áp dụng các công nghệ và phương pháp làm chuyển đổi số, khóa học đã giúp chúng tôi vẽ được bộ quy trình nghiệp vụ trong việc số hóa doanh nghiệp của mình.
Giám đốc công ty TNHH HMGROUP – Học viên khóa chuyển đổi số doanh nghiệp, Phân tích nghiệp vụ kinh doanh
Câu chuyện chuyển đổi số đã lan chuyển khắp nơi, điều này cũng gặp phải chính trong doanh nghiệp mà mình đang làm. Có rất nhiều vấn đề nào là cách số hóa tài liệu, số hóa quy trình, số hóa các phân hệ bán hàng, làm sao để dữ liệu có thể tập trung tại một nơi giúp làm báo cáo nhanh chóng, ngoài ra còn vấn đề bảo mật và an toàn thông tin nữa. Qua khóa học chuyển đổi số và phân tích nghiệp vụ (Business Analysis) tại Cole.vn đã giúp mình nắm được phương pháp và cách làm.
Cán bộ cao cấp tập đoàn VNPT: Tham gia học khóa chuyển đổi số, khóa Phân tích nghiệp vụ kinh doanh, khoá Power BI & SQL
Loay hoay trong chính câu chuyện 1 tổ chức nhà nước, đơn vị đang thực hiện hàng chục các dự án số hóa khác nhau tuy nhiên phòng làm việc của mình lại chưa biết bắt đầu từ đâu, qua các khóa học ứng dụng chuyển đổi số tại Cole, giúp mình hiểu ra các bước và phương pháp để làm việc còn lại là tác động con người trong tổ chức cần thay đổi.
CIO Bamboo Capital Group (Sở hữu 40 công ty thành viên) – Học viên khóa chuyển đổi số doanh nghiệp, khóa data engineer, khóa phân tích dữ liệu.
Tham gia khóa học tại Cole.vn tôi được các chuyên gia và các thầy chuyển giao hết các kiến thức và không “giấu bài”, có rất nhiều tài liệu và kiến thức tôi đã được chia sẻ giúp tôi có thể ứng dụng để triển khai các chương trình số hóa cho tập đoàn 1 cách nhanh chóng.
Chuyên gia cao cấp phụ trách chuyển đổi số Tập đoàn SUNGROUP – Học viên khóa chuyển đổi số doanh nghiệp, khóa học Data Engineer, khóa phân tích nghiệp vụ doanh nghiệp.
Khi thực hiện các dự án chuyển đổi số cho tập đoàn, do nhiều nguyên nhân nóng vội mà hiện tại vẫn chưa thực hiện thành công như áp dụng nhiều phần mềm, nhưng phần mềm mua về không đáp ứng được nghiệp vụ gây ra nhiều thất thoát lãng phí. Qua khóa học tại Cole mình mới biết nguyên nhân là thiếu phần làm URD (yêu cầu người dùng). Xin cảm ơn Cole, các khóa học này thực sự đã giúp mình có phương pháp để làm chuyển đổi số doanh nghiệp.
Bộ phận đào tạo và phát triển con người của ngân hàng mong muốn tìm hiểu thêm công nghệ Blockchain ứng dụng trong ngân hàng, nhằm nắm bắt xu hướng phát triển của công nghệ trong thị trường tài chính. Chúng tôi đã lựa chọn Cole để là đối tác đào tạo khóa BlockChain này, dựa trên thông tin website chúng tôi tin tưởng vào năng lực với các dự án đào tạo chuyển đổi số mà Cole đã từng tổ chức như phân tích dữ liệu, Machine Learning, Phân tích nghiệp vụ doanh nghiệp, cũng như các khóa khóa học về Blockchain đã triển khai.
Hiện tại các công nghệ xử lý dữ liệu đã thay đổi nhanh chóng, Ban giám đốc công ty xác định bồi dưỡng đào tạo cho nhân viên về kỹ năng xử lý dữ liệu bằng các công nghệ phân tích mời nổi để việc xử lý dữ liệu được nhanh hơn. Chúng tôi nhận thấy các khóa học của Cole đáp ứng các yêu cầu mà BGĐ muốn đào tạo cho nhân viên của công ty nên chúng tôi đã lựa chọn các khóa học tại đây.
MB Ageas (MB Ageas Life) là công ty bảo hiểm liên doanh giữa ngân hàng MB, tập đoàn Ageas và công ty bảo hiểm Muaung Thai của Thái Lan. Các lãnh đạo và nhà quản lý tập đoàn đã tham gia khóa học chuyển đổi số doanh nghiệp của Cole nhằm nâng cấp kỹ năng, kiến thức và các phương pháp làm chuyển đổi số cho doanh nghiệp của mình.
Saigonbank là Ngân hàng đầu tiên được thành lập trong hệ thống Ngân hàng cổ phần tại Việt Nam hiện nay. Lãnh đạo của Saigonbank xác định rõ nhiệm vụ để làm chuyển đổi số là trọng tâm trong chiến lược phát triển, ngân hàng đã cử các cán bộ là lãnh đạo tham gia bồi dưỡng kiến thức chuyển đổi số với khóa học tại Cole nhằm nâng cấp kiến thức và cách ứng dụng và các phương pháp làm theo từng lộ trình mà các chuyên gia của Cole chia sẻ.
Công ty TNHH MTV Nhiên liệu hàng không Việt Nam (Skypec) là nhà cung ứng nhiên liệu hàng đầu cho các Hãng Hàng không tại các sân bay dân dụng Việt Nam. Với hơn 1300 cán bộ nhân viên trong doanh nghiệp, việc nâng cấp kỹ năng phân tích dữ liệu cho và các kỹ năng công nghệ mới là ưu tiên mà ban lãnh đạo dự định để đào tạo cho nhân viên trong thời kỳ xu hướng chuyển đổi số mạnh mẽ hiện nay, sau khi tham khảo các khóa học khác trên thị trường, phòng đào tạo & phát triển của công ty Skypec đã lựa chọn Cole để làm đơn vị đào tạo và bồi dưỡng với các kỹ năng cho CBNV, vì các khóa học ứng dụng chuyển đổi số tại Cole khá phù hợp và ứng dụng thực tiễn hiện nay.
WWF là Quỹ Quốc tế Bảo vệ Thiên nhiên, là một trong những tổ chức phi chính phủ lớn nhất thế giới về bảo vệ thiên nhiên. Các chuyên viên về là người phải đi thu thập và điều tra các số liệu liên quan đến hoạt động môi trường, ô nhiễm để thống kê báo cáo gửi ban lãnh đạo, nhưng vấn đề của các chuyên viên bị hiện tại là kỹ năng phân tích và tổng hợp số liệu chưa tốt, chưa biết cách xử lý và báo cáo dữ liệu sao cho đúng. Nhận thấy khóa học tại Cole.vn có nhiều các công nghệ xử lý dữ liệu mới nên công ty đã tổ chức cho các chuyên viên nghiên cứu tham gia.