admin
5,910
25-09-2021
Power Query là công cụ được phát triển bởi hãng Microsoft có tích hợp từ Excel 2013 và tích hợp sẵn trên Power BI. Các tính năng của Power Query trên Excel và trên Power BI là tương tự nhau đến 95%:
Quá trình xử lý để chuẩn hóa dữ liệu (giai đoạn ETL) là công đoạn nhọc nhằn khoai và rắc rối khi làm phân tích dữ liệu. Power Query ra đời có thể 1 bước tiến lớn của nhân loại – 1 công cụ thần kỳ – là phao cứu sinh cho rất nhiều nhà quản lý, các bạn làm báo cáo không chuyên IT, đặc biệt dành cho nhiều bạn xuất thân là dân kinh tế không không biết lập trình để có thể xử lý và làm sạch dữ liệu cho quá trình lên Dashboard.
Quay trở về thời kỳ trước khi có Power Query: Khi muốn xử lý các dữ liệu thô, những ai biết về VBA sẽ sử dụng để xử lý các dữ liệu, hoặc thông thường phần đa mọi người sẽ dùng các hàm Excel thông thường như – Left, Right,… để trích xuất hay chia tách dữ liệu,… VBA thì cần kiến thức lập trình, nhiều người không đủ kiên nhẫn để học được mặc dù rất hiệu dụng. Excel thì khi có Data mới cập nhật sẽ không lưu tự động được, và thao tác thủ công khá nhiều dẫn đến các file xử lý lớn khiến người dùng đau đầu mất kiên nhẫn => Power Query là công cụ toàn năng tuyệt vời nhất giúp bạn có thể xử lý đống dữ liệu thô rác một cách nhanh, mạnh mẽ và dễ sử dụng.
Như đã viết ở trên Power query ra đời chính với mục đích là xử lý dữ liệu – Đây là công đoạn chuẩn hóa trước khi đưa dữ liệu vào kho nhằm phục vụ mục đích làm Dashboard các chức năng chính của nó gồm:
Lấy dữ liệu từ nhiều nơi, nhiều nguồn khác nhau từ file, database hoặc các Other source: web page, file Exce, file CSV, text file, SQL server database, Microsoft Azure SQL Database, MySQL database, Sharepoint list,…
– Là tính năng thường sử dụng nhiều nhất của quá trình phân tích dữ liệu, phần này nếu bạn dùng Excel chắc hẳn bạn sẽ biết rất mệt mỏi nhường nào với các công việc thường làm: xóa dòng/cột trống hoặc không cần thiết, filter dữ liệu, chỉnh sửa dữ liệu để có thể sử dụng Pivot Table, gộp hoặc tách nhiểu cột, find & replace dữ liệu,…
– Nay với Power Query bạn đã có những tool thay thế: Chọn, Giữ, Thêm, Xoay, Phóng to – Thu nhỏ, Join (gia nhập), Bổ sung và chuyển đổi định dạng:
Một số bài toán sẽ xử lý trong Power Query
Bài toán 1: Thống kê doanh thu từng chi nhánh theo từng tháng 1
Bài toán 2: Thống kê doanh thu từng chi nhánh theo từng quý và từng tháng
Công đoạn sau khi dữ liệu đã được chuẩn hóa sẽ đưa vào kho dữ liệu (Data Model) nhằm phục vụ trình bày báo cáo.
Trên đây mình đã giới thiệu đến mọi người về Power Query, tính năng và sự ưu việt của nó cho việc xử lý và chuẩn hóa dữ liệu. Để có thể hiểu rõ hơn và có thể sử dụng Power Query một cách hoàn chỉnh cho cả quá trình làm phân tích dữ liệu, mời bạn tham khảo 2 khóa học của Cole dưới đây để thành thục kỹ năng Power Query nhé:
https://phantichdulieu.cole.vn/ – Ứng dụng Power Query phân tích dữ liệu trên Excel
http://powerbi.cole.vn/ – Ứng dụng Power Query phân tích dữ liệu với Power BI
Regards!