admin
1,374
11-09-2021
Bản thân việc thu thập dữ liệu không phải là điều gì đó mới mẻ. Các công ty đã có rất nhiều dữ liệu trong suốt một thời gian dài. Tuy nhiên, cho đến thời gian gần đây, dữ liệu duy nhất chúng ta có thể thực sự làm việc hay nói cách khác là dữ liệu có cấu trúc.
Nghĩa là dữ liệu này thường được đặt trong bảng tính hoặc cơ sở dữ liệu, giúp dễ dàng truy vấn. Nhưng những tiến bộ như Internet, công nghệ cảm biến, điện toán đám mây, khả năng lưu trữ. Và phân tích dữ liệu của chúng ta đã thay đổi về chủng loại, số lượng dữ liệu mà chúng ta có thể thu thập.
Giờ đây, các hoạt động hàng ngày như đi bộ xuống phố, bước vào xe. Hoặc mua một cái gì đó trong một cửa hàng ngày càng tạo ra một đường dẫn dữ liệu khổng lồ, ở dạng có cấu trúc và phi cấu trúc. Và tất cả các loại dữ liệu khác nhau này đều có thể được sử dụng bởi các công ty để cải thiện cách thức kinh doanh của họ.
Bất kỳ dữ liệu hoặc thông tin nào được đặt trong một trường cố định trong một bản ghi hoặc tập tin được xác định, thường là trong cơ sở dữ liệu hoặc bảng tính. Về cơ bản, đó là dữ liệu được tổ chức theo một cách thức đã được xác định trước, thường là trong các hàng và cột.
Dữ liệu thường được quản lý bằng Ngôn ngữ Truy vấn có Cấu trúc (SQL) – một ngôn ngữ lập trình có từ những năm 1970 được sử dụng để truy vấn dữ liệu trong các hệ thống quản lý cơ sở dữ liệu quan hệ.
Dữ liệu có cấu trúc
Các doanh nghiệp cỡ vừa có khả năng khai thác một lượng lớn dữ liệu.
Ví dụ phổ biến nhất bao gồm dữ liệu khách hàng, dữ liệu bán hàng, hồ sơ giao dịch, dữ liệu tài chính, số lượt truy cập trang web. Và dữ liệu theo dõi bất kỳ máy móc thiết bị nào (ví dụ, nhật ký nhiệt độ trong các thiết bị bảo quản lạnh).
Trên thực tế, hiện nay, công nghệ này đã cung cấp hầu hết hiểu biết sâu sắc về hoạt động kinh doanh của chúng ta, mặc dù điều đó đang dần thay đổi.
So với thế giới thú vị của dữ liệu phi cấu trúc, dữ liệu có cấu trúc thường nhận nhiều chỉ trích.Tôi có thể hiểu tại sao.
Mặc dù hiện tại đây là loại dữ liệu được sử dụng phổ biến nhất, nhưng dữ liệu có cấu trúc chỉ chiếm 20% trong số tất cả các dữ liệu có sẵn trên thế giới. 80% dữ liệu còn lại không được cấu trúc theo định dạng.
Nhược điểm là không chứa nhiều thông tin bằng dữ liệu phi cấu trúc, có nghĩa là loại dữ liệu này chỉ có thể trình bày một bức tranh rất hạn chế về những gì đang diễn ra. Do đó, thông thường bạn cần phải sử dụng các nguồn dữ liệu khác để có được thông tin chi tiết tốt hơn.
Ví dụ, bạn biết rằng lượt truy cập trên trang web của bạn đã giảm 25% trong tháng trước nhưng bạn sẽ cần các hình thức dữ liệu khác để khám phá lý do vì sao.
Về mặt tích cực, đây là câu trúc có một số lợi thế lớn: nó thường ít tốn chi phí để sử dụng, dễ dàng lưu trữ và dễ phân tích. Mặc dù bản chất của nó là cố định, nhưng có thể được truy vấn và sử dụng theo nhiều cách khác nhau, thường là bởi các nhà phi phân tích (non-analyst). Nó vẫn có thể cực kỳ mạnh mẽ và ấn tượng.
Ví dụ, cơ sở dữ liệu khách hàng và giao dịch của Walmart chứa hơn 2,5 petabyte dữ liệu (Để có thể hình dung dễ dàng hơn, chúng ta ước tính rằng tổng tất cả nội dung từ các thư viện nghiên cứu học thuật của nước Mỹ chỉ hơn 2 petabyte).
Công ty có thể kết hợp dữ liệu khách hàng có cấu trúc này (đặc biệt là về việc mọi người mua gì, vào lúc nào) với nhiều nguồn khác nhau (như hồ sơ kiểm soát hàng tồn kho nội bộ) để tạo các chương trình khuyến mãi được thiết kế riêng cho từng khách hàng cá nhân.
Ngay cả khi bạn không có 2,5 petabyte dữ liệu như Walmart (hầu hết các công ty đều không có), dữ liệu của riêng bạn vẫn có thể phục vụ như một điểm xuất phát tuyệt vời để thu thập hiểu biết sâu sắc.
Chúng vẫn cung cấp được rất nhiều thứ cho các doanh nghiệp – đặc biệt khi được kết hợp với dữ liệu phi cấu trúc.
>>Tìm hiểu khóa chuyển đổi số doanh nghiệp để xây dựng chiến lược dữ liệu hoàn chỉnh
———————————————–
Cole.vn – Connect Learning
Địa chỉ: 289B Khuất Duy Tiến, Trung Hòa, Cầu Giấy
Hotline: 0869 810 635
Email: contact@cole.vn
Facebook: https://www.facebook.com/www.cole.vn
#thanh_thao_tin_hoc #tin_hoc_van_phong
#cong_nghe_thong_tin #lap_trinh #thiet_ke
#he_dieu_hanh #may_tinh #power_bi
#data_analyst #chuyendoiso
#digital_transformation
#Business_analyst #ketoan #hcns #excel
Theo sách chiến lược dữ liệu – Chương 6
Cảm nhận học viên
Câu chuyện doanh nghiệp