LƯỢC SỬ VỀ PHÂN TÍCH DỮ LIỆU (DATA ANALYTICS): PHÂN TÍCH DỮ LIỆU ĐÃ VÀ ĐANG PHÁT TRIỂN NHƯ THẾ NÀO?

Con người đã phân tích dữ liệu ngay từ khi văn minh ra đời. Những bản ghi sớm nhất của việc viết là ví dụ về phân tích dữ liệu. Ở Iraq cổ đại, các thư ký đã lập danh sách công nhân, tạo ra một trong những cơ sở dữ liệu đầu tiên trong quá trình này. Họ cũng tính toán tiền lương của họ trực tiếp từ dữ liệu thô này, một hình thức phân tích dữ liệu nguyên thủy. Phân tích dữ liệu có nguồn gốc từ thống kê, có thể được truy nguồn về Ai Cập, nơi mà họ thực hiện điều tra thường kỳ để xây dựng các kim tự tháp. Con người đã tham gia vào những cuộc hành trình và cuộc phiêu lưu đáng kinh ngạc, ghi lại trải nghiệm của họ trên hành trình, giúp chúng ta xây dựng một nguồn dữ liệu dồi dào. Trong bài viết này, chúng ta sẽ hiểu về hành trình phát triển của Phân tích dữ liệu nhé!.

THỜI KỲ CỔ ĐẠI ĐẾN TRƯỚC THẾ KỶ XX

Như phần mở đầu đã đề cập, nói “Phân tích dữ liệu” là một khái niệm mới thì sẽ không chính xác. Mặc dù thuật ngữ có thể mới, nhưng việc thực hành nó đã tồn tại từ lâu, ngay trước cả thời đại của máy tính! 

Từ xa xưa cho đến trước thế kỷ XX, con người phân tích dữ liệu theo các phương pháp truyền thống và thủ công. Dưới đây là một số phương pháp phổ biến được sử dụng trong quá trình phân tích dữ liệu trong thời gian đó:

  • Quan sát và ghi chép: Con người quan sát và ghi chép thông tin theo các hình thức như viết tay, vẽ biểu đồ, vẽ sơ đồ, và ghi lại các sự kiện, số liệu, hoặc quan sát quan trọng khác.
  • Phân loại và phân nhóm: Dữ liệu được phân loại và phân nhóm dựa trên các thuộc tính và đặc điểm chung. Những nhóm tương tự nhau có thể được so sánh và phân tích để tìm ra các mẫu, xu thế, hoặc sự khác biệt.
  • Thống kê đơn giản: Sử dụng các phép tính thống kê cơ bản như tính trung bình, tỉ lệ phần trăm, và đếm số lượng để mô tả và phân tích dữ liệu.
  • Phân tích đồ thị: Sử dụng biểu đồ, đồ thị, và sơ đồ để hình dung mối quan hệ, xu hướng, và mẫu dữ liệu. Các biểu đồ như biểu đồ cột, biểu đồ đường, biểu đồ hình tròn, và biểu đồ tâm lý được sử dụng để trực quan hóa dữ liệu.
  • Phân tích tương quan: Tìm hiểu mối tương quan giữa các biến dữ liệu bằng cách sử dụng phép tính tương quan và phân tích khác nhau như phân tích hồi quy và phân tích biến thiên.

Hoàn toàn có thể nói, việc phân tích dữ liệu theo những phương pháp trên tốt hơn là phán đoán theo cảm tính, trực giác để đưa ra quyết định. Tuy nhiên, nó vẫn còn nhiều hạn chế vì độ xảy ra sai sót cao, truy vấn chậm, và khó khăn trong việc lưu trữ. 

THẾ KỶ XX: NHỮNG BƯỚC ĐẦU TIÊN

Thế kỷ XX chứng kiến sự ra đời của các máy tính kỹ thuật số đầu tiên, có kích thước và phức tạp rất lớn, và chủ yếu được sử dụng cho mục đích quân sự. Tuy nhiên nó cũng chính là khởi đầu cho phương pháp thu thập và lưu trữ dữ liệu chuyển từ một hệ thống vật lý sang một hệ thống mạng. Với sự phát triển của công nghệ máy tính và sự xuất hiện của vi xử lý vào những năm 1970, máy tính trở nên nhỏ gọn và rẻ hơn, và được sử dụng nhiều hơn cho các ứng dụng kinh doanh. Dữ liệu được lưu trữ trên máy tính bằng cách sử dụng băng từ hoặc đĩa từ, và nhiệm vụ chính của các chuyên gia thông tin doanh nghiệp là trích xuất thông tin từ dữ liệu được lưu trữ trên các thiết bị này. Sự phát triển của các công nghệ phần mềm mới, chẳng hạn như ngôn ngữ truy vấn cấu trúc (SQL), đã mang lại cho các nhà quản lý kinh doanh khả năng truy cập và điều chỉnh dữ liệu được lưu trữ trong máy tính. Và vì vậy, cơ sở dữ liệu và hệ thống quản lý cơ sở dữ liệu ra đời. Với nhiều không gian để lưu trữ và xử lý dữ liệu, khái niệm về phân tích dữ liệu có khối lượng lớn cũng nhanh chóng xuất hiện. Để đáp lại sự phát triển này, chúng ta bắt đầu sử dụng các mô hình cơ sở dữ liệu quan hệ và bảng tính.

CUỘC CÁCH MẠNG KỸ THUẬT SỐ

Sự phát triển của Internet và sự xuất hiện của mạng xã hội đã mang đến một kỷ nguyên mới về kỳ vọng của người tiêu dùng. Chúng đã tạo ra tính đột phá của dữ liệu và khơi dậy nhu cầu về phân tích dữ liệu.

Các chuyên gia phân tích dữ liệu đã tìm ra một cách mới để xử lý, hiểu và tận dụng dữ liệu để tạo ra những insight kinh doanh có giá trị. Điều này đánh dấu sự bắt đầu của một cuộc cách mạng kỹ thuật số mới, được thúc đẩy bởi Dữ liệu lớn (Big Data) và phân tích dữ liệu. Dữ liệu lớn đề cập đến những khối lượng lớn dữ liệu được tạo ra hàng ngày, bao gồm các bài đăng trên mạng xã hội, thiết bị IoT, hình ảnh, video và các nguồn dữ liệu không cấu trúc khác. Số lượng dữ liệu được tạo ra hàng ngày quá lớn đến mức khó cho các tổ chức lưu trữ dữ liệu trên máy tính hoặc máy chủ của họ. Độ phức tạp trong việc xử lý và phân tích dữ liệu cũng đã tăng lên. Nhận ra rằng điều này sẽ trở thành một vấn đề trong tương lai, chúng ta đã tạo ra các công cụ để làm cho quá trình này dễ dàng hơn đối với người dùng kinh doanh.

Các công cụ như MS Excel đi kèm với các chức năng tích hợp khác nhau làm cho các phép tính và thống kê dễ dàng cho người dùng kinh doanh. Cơ sở dữ liệu quan hệ được hỗ trợ bởi các ngôn ngữ lập trình như MySQL và Oracle Database cũng cho phép truy vấn dữ liệu để sắp xếp, lọc và thực hiện các hoạt động nâng cao trên cơ sở dữ liệu.

Mặc dù những phát minh này đã giúp việc làm mọi thứ dễ dàng hơn nhưng điểm hạn chế lớn nhất của chúng là chỉ đơn giản hóa một phần của vấn đề - trích xuất thống kê từ dữ liệu. Còn lại, phần phân tích hay liên quan đến việc xem xét các con số để tạo ra những insight có giá trị, vẫn là trách nhiệm của người dùng kinh doanh.

Từ đó, đã hình thành nhu cầu về phân tích dữ liệu tự động trên Đám mây (Cloud), và để đáp ứng nhu cầu này, chúng ta đã chứng kiến sự gia tăng của Trí tuệ nhân tạo và các ứng dụng của nó, bao gồm cả Khoa học dữ liệu.

THỜI ĐẠI TRÍ TUỆ NHÂN TẠO

Như tên gọi, Khoa học dữ liệu là khoa học về việc làm việc với dữ liệu để trích xuất ý nghĩa từ nó. Chúng ta sử dụng phương pháp Khoa học dữ liệu để tạo ra những mô hình dữ liệu có thể chuẩn bị, xử lý, phân tích dữ liệu và tạo ra những insight có giá trị. Đầu tiên, chúng ta huấn luyện các mô hình dữ liệu này bằng các thuật toán học máy (Machine Learning) và sau đó kiểm tra chúng trên một tập dữ liệu mẫu để đánh giá độ chính xác của dự đoán. Dựa trên các đánh giá này, chúng ta thực hiện các thay đổi bổ sung và sau đó kiểm tra lại mô hình mới. Quá trình lặp lại này diễn ra nhiều lần để có một mô hình dữ liệu không thể gây lỗi. Sau đó, mô hình này được sử dụng để phân tích dữ liệu mới và cung cấp những insight cực kỳ chính xác.

Hiện nay, các nhà phân tích kinh doanh đang triển khai các mô hình Khoa học dữ liệu tương tự để tìm ra những insight phục vụ quyết định kinh doanh. Sức mạnh của tự động hóa và Trí tuệ Nhân tạo đã đơn giản hóa công việc của một nhà phân tích dữ liệu.

Ngoài ra, các thuật toán được sử dụng trong những mô hình này thực hiện công việc phân tích dữ liệu một cách toàn diện, xác định các mẫu và xu hướng dữ liệu trên một quy mô sâu hơn nhiều. Điều này không để lại chỗ cho lỗi của con người mà thường xuyên xảy ra.

SỰ BÙNG NỔ CỦA BUSINESS INTELLIGENCE

Business Intelligence (BI) đã phát triển với tốc độ chóng mặt trong những năm gần đây. Được định giá vào khoảng 20,516 tỷ USD vào năm 2020, dự báo ngành thông tin kinh doanh sẽ tăng đáng kể lên đến 40,5 tỷ đô la vào năm 2026.

Một nền tảng BI là một công cụ phân tích kinh doanh toàn diện, tạo ra actionable insight trong vài giây sau khi dữ liệu được tải lên. Với các nền tảng BI như MH Digital xây dựng, chúng ta chỉ cần kết nối các nguồn dữ liệu cần thiết với nền tảng. Dữ liệu có thể là các tệp CSV, Excels, bảng tính, các kênh tiếp thị như Facebook và cơ sở dữ liệu như MYSQL,...

Nền tảng BI thực hiện tất cả các nhiệm vụ liên quan đến khoa học dữ liệu và phân tích dữ liệu một cách tự động. Nó cung cấp cho bạn những insight sẵn sàng sử dụng dưới nhiều hình thức khác nhau. Thông qua các nền tảng BI này, các công ty có thể nhận được báo cáo phân tích chi tiết trong vài giây. Điều này cho phép họ đưa ra quyết định nhanh chóng dựa trên cơ sở của sự thật và có tác động đối với hoạt động tổng thể của tổ chức. Các công cụ BI cung cấp khả năng truy cập dữ liệu, tạo ra báo cáo, biểu đồ trực quan hóa và chia sẻ báo cáo với những bên liên quan. 

Đọc thêm: Business Intelligence (BI) là gì? Quy trình và Kinh nghiệm triển khai BI cho doanh nghiệp

TRIỂN VỌNG TƯƠNG LAI CỦA PHÂN TÍCH DỮ LIỆU

Phân tích dữ liệu đã trở thành một yêu cầu cần thiết đối với doanh nghiệp. Sự tiến hóa của trí tuệ nhân tạo và học máy, Internet và các tiến bộ công nghệ khác đã tạo ra những cách mới để xử lý và phân tích dữ liệu. Với dữ liệu lớn, nhu cầu về phân tích thời gian thực đã tăng lên. Hiện nay, các tổ chức phải có khả năng xử lý dữ liệu ngay khi nó được tạo ra và nắm bắt được những thông tin quan trọng từ đó. Có một sự tập trung ngày càng cao vào việc tích hợp dữ liệu từ các nguồn khác nhau vào một nền tảng duy nhất để tạo ra cái nhìn hữu ích. Các công cụ trực hóa và Trí tuệ nhân tạo được sử dụng để tạo ra Báo cáo từ dữ liệu sống động, dễ tương tác và dễ hiểu hơn. Chúng ta đang chứng kiến một nỗ lực toàn cầu để đơn giản hóa quá trình tạo ra thông tin từ dữ liệu.