Trong thập kỷ qua, dữ liệu đã trở thành một nhân tố mạnh mẽ trong phát triển của doanh nghiệp.
Các doanh nghiệp trang bị cho nhân sự các công cụ phân tích và nền tảng để ra quyết định dựa trên dữ liệu – để thực sự khai thác sức mạnh của dữ liệu. Ngược lại, những doanh nghiệp không làm điều này đang bỏ lỡ một lợi thế cạnh tranh quan trọng.
Bài viết này sẽ giới thiệu về 6 xu hướng hàng đầu trong phân tích dữ liệu (Data & Analytics), bao gồm AI, Business Intelligence …
Xu hướng 1: Ứng dụng AI trong Phân tích Dữ liệu
Sự phát triển của trí tuệ nhân tạo (AI), đặc biệt là học máy (ML), đang làm tăng tốc độ và quy mô các hoạt động phân tích dữ liệu.
Phân tích truyền thống yêu cầu một đội ngũ phân tích IT phải duyệt qua dữ liệu, lý thuyết hóa những Insight tiềm năng, kiểm tra các hiểu biết đó và báo cáo kết quả. Phân tích BI truyền thống phụ thuộc phần lớn vào IT, nhưng phân tích dựa trên ML lại đưa dữ liệu vào tay người dùng kinh doanh.
Các mô hình học máy có thể theo dõi dữ liệu liên tục, phát hiện những điểm bất thường và cảnh báo cho các đội ngũ liên quan ngay lập tức – mà không cần sự can thiệp của con người. Các mô hình này có thể xem xét bất kỳ tập con dữ liệu nào và tạo ra các hiểu biết. Chúng có thể tìm kiếm mối quan hệ giữa hàng triệu điểm dữ liệu.
Quan trọng là, con người không cần phải có giả thuyết trước. Bởi vì các thuật toán ML sẽ tự động phát hiện các hiểu biết (insight) mà người dùng cần. Và khi cần trích xuất hiểu biết từ một bộ dữ liệu, chúng ta có thể sử dụng các công cụ AI tạo sinh như ChatGPT để làm điều đó.
Ví dụ, một thành viên trong nhóm có thể tạo Mô hình ngôn ngữ lớn (LLM) tùy chỉnh dựa trên dữ liệu nội bộ và hỏi AI một câu hỏi như “Chúng ta có bao nhiêu khách hàng từ Hà Nội trong năm 2024?“.
Phân tích nâng cao cũng có thể được sử dụng cho vô số quy trình kinh doanh như dự báo, phân tích dự đoán, mô hình hóa và trực quan hóa.
Một lợi thế quan trọng của phân tích nâng cao là các nền tảng AI/ML có thể hiểu được dữ liệu không cấu trúc.
Ví dụ, Bệnh viện Đại học ở Cleveland, Ohio, nhận hơn 400.000 cuộc gọi mỗi tháng. Trước khi họ bắt đầu sử dụng nền tảng phân tích dữ liệu AI, việc nghe và ghi lại các cuộc gọi này là công việc của một số nhân viên. Sau khi Bệnh viện Đại học triển khai nền tảng phân tích nâng cao, họ có thể bắt đầu tự động giám sát các cuộc gọi thông qua nền tảng AI. Họ đã tiết kiệm được ít nhất 40 giờ mỗi tuần cho lao động của nhân viên.
Phân tích nâng cao cũng có thể hướng dẫn các doanh nghiệp tối ưu hóa chiến lược giá và dự báo nhu cầu.
Ví dụ, một mô hình AI có thể phân tích dữ liệu khách hàng để phát hiện các mẫu trong hành vi mua sắm và sử dụng giá động để tăng doanh thu. Phân tích nâng cao cũng có thể theo dõi dữ liệu cạnh tranh để các tổ chức có thể tối ưu hóa giá cả của họ cho phù hợp.
Thị trường cho phân tích nâng cao đang phát triển nhanh chóng. Theo Research and Markets, thị trường này sẽ tăng trưởng với tốc độ CAGR gần 26% đến năm 2027, đạt giá trị hơn 32 tỷ đô la.
Xu hướng 2: Sử dụng Business Intelligence để Thu Thập Thông Tin
Công cụ Business Intelligence (BI) khai thác dữ liệu thô để trích xuất các mẫu có ý nghĩa và những thông tin hữu ích.
Nhiều nền tảng BI phổ biến ngày nay tận dụng khả năng của AI/ML để cung cấp thông tin cho doanh nghiệp. Những thông tin này có thể giúp xác định vấn đề, phát hiện xu hướng hoặc tìm ra nguồn doanh thu mới.
Khai thác dữ liệu, truy vấn, báo cáo và trực quan hóa đều là một phần của hệ thống BI. Nhiều nhà lãnh đạo doanh nghiệp coi BI là yếu tố cần thiết cho sự tồn tại và thành công của tổ chức.
Theo một khảo sát, khoảng một phần tư các tổ chức hiện đang sử dụng BI, nhưng con số này tăng lên đến 80% khi xem xét các tổ chức có hơn 5.000 nhân viên.
Ví dụ về: Delta Airlines, nhà tuyển dụng gần 90.000 nhân viên. Công ty đã đầu tư hơn 100 triệu đô la vào một nền tảng BI để theo dõi việc xử lý hành lý. Thông tin dữ liệu từ nền tảng đó giúp các nhóm Delta xác định vấn đề và chậm trễ liên quan đến hành lý – một nguồn căng thẳng lớn cho khách hàng.
Ngoài ra, Doanh nghiệp có thể cải thiện hiệu suất của các chiến dịch tiếp thị bằng cách tích hợp phân tích từ nền tảng BI. Các tổ chức có thể sử dụng BI để tạo hồ sơ khách hàng và phân đoạn nhóm khách hàng. Với tất cả dữ liệu này, các doanh nghiệp có thể tạo ra các chiến dịch bán hàng và tiếp thị cá nhân hóa.
Các nền tảng BI có thể giúp các tổ chức sản xuất cải thiện chuỗi cung ứng, tránh sự chậm trễ và tăng lợi nhuận. Những công cụ này cung cấp cho các nhà sản xuất một phương pháp dựa trên dữ liệu để tối ưu hóa quy trình sản xuất trong khi duy trì chất lượng cao.
BI thậm chí có thể là công cụ quan trọng trong việc xử lý sự gián đoạn chuỗi cung ứng và chi phí. Khi các tổ chức muốn trình bày dữ liệu của họ theo cách dễ hiểu, họ sẽ sử dụng nền tảng BI của mình để tạo trực quan hóa dữ liệu.
Lượng tìm kiếm “trực quan hóa dữ liệu” đã tăng mạnh vào cuối năm 2022 và vẫn duy trì ở mức cao. Các trực quan hóa này có thể là biểu đồ, đồ thị, bản đồ và các dạng khác.
Một trong những hệ thống BI phổ biến nhất, Tableau, cung cấp nhiều tùy chọn trực quan hóa dữ liệu cho người dùng.
Người dùng có thể tạo biểu đồ hộp và ria mép để nhanh chóng xem phân phối dữ liệu, bản đồ nhiệt hiển thị dữ liệu cụ thể bằng màu sắc cụ thể và bản đồ cây để hiển thị dữ liệu phân cấp.
Với một loạt các ứng dụng đa dạng như vậy, BI đang trên đường trở thành tiêu chuẩn phổ quát cho các doanh nghiệp.
Theo Fortune Business Insights, thị trường business intelligence có thể đạt 54,27 tỷ đô vào năm 2030, tăng 27 tỷ đô la so với năm 2022.
Xu hướng 3: Tăng Cường Sử Dụng Data-As-A-Service
Khi dữ liệu ngày càng được tạo ra nhiều hơn mỗi ngày, việc sử dụng dữ liệu để duy trì tính cạnh tranh trở nên rõ ràng cho mọi doanh nghiệp.
Tuy nhiên, không phải doanh nghiệp nào cũng có khả năng thu thập, lưu trữ và phân tích dữ liệu dễ dàng như các công ty công nghệ lớn. Đây là lúc Data-as-a-Service (DaaS) phát huy vai trò của mình.
Các công ty DaaS thường cung cấp dịch vụ thu thập, lưu trữ và phân tích dữ liệu theo hình thức đăng ký. DaaS hoạt động qua điện toán đám mây và cung cấp dịch vụ cho người dùng cuối qua mạng thay vì phải phân tích hoặc lưu trữ dữ liệu tại chỗ.
Tùy thuộc vào khách hàng, nhà cung cấp DaaS có thể thu thập và sử dụng dữ liệu nội bộ của khách hàng hoặc cung cấp cho khách hàng các tập dữ liệu mà họ không thể tự mình tiếp cận.
Snowflake là một trong những công ty lớn và phổ biến nhất trong thị trường này. Công ty nổi tiếng với dịch vụ kho dữ liệu, nhưng cũng có thể hoạt động như một nhà cung cấp DaaS thuần túy.
Snowflake cho phép khách hàng lưu trữ và phân tích dữ liệu trên nền tảng của mình, đồng thời cung cấp các sản phẩm dữ liệu từ các nhà cung cấp đến người dùng cuối thông qua nền tảng của mình. Một mẫu thị trường của Snowflake cho thấy có 154 sản phẩm dữ liệu có sẵn trong danh mục dự báo nhu cầu.
Snowflake cũng đã đầu tư vào một công ty có trụ sở tại New York tên là Cybersyn trong vòng gọi vốn Series A trị giá 62,9 triệu đô la vào tháng 4 năm 2023. Công ty này tập trung vào việc tổng hợp dữ liệu kinh tế công cộng và độc quyền để tạo ra các tập dữ liệu và bán chúng cho các bên thứ ba.
Xu hướng 4: Cuộc Cách Mạng “Dân Chủ Hóa” Hệ Thống Dữ Liệu
Trong một doanh nghiệp hiện đại, dữ liệu thường bị cô lập. Dữ liệu bị kẹt trong một bộ phận và những người khác bỏ lỡ giá trị của dữ liệu đó.
Đó là lý do tại sao dân chủ hóa dữ liệu lại là một xu hướng quan trọng đối với doanh nghiệp. Việc này liên quan đến mở rộng thông tin để mọi người trong một doanh nghiệp đều có thể tiếp cận, bất kể trình độ kỹ thuật.
Dân chủ hóa dữ liệu giúp người dùng cuối truy cập vào các thông tin họ cần mà không cần phải chờ IT cấp quyền truy cập.
Một khảo sát của Harvard Business Review cho thấy 97% các nhà lãnh đạo doanh nghiệp nói rằng việc dân chủ hóa dữ liệu quan trọng đối với sự thành công của doanh nghiệp.
Coca-Cola đã đầu tư vào việc nâng cao kỹ năng cho các quản lý để tạo ra nhiều nhà khoa học dữ liệu hơn. Trong năm đầu tiên của chương trình, Coca-Cola đã đào tạo hơn 500 nhân viên về các kỹ năng phân tích dữ liệu. Chương trình sẽ mở rộng cho hơn 4.000 nhân viên trong những năm tới.
Dân chủ hóa dữ liệu cũng giúp mang lại hiểu biết sâu sắc hơn về khách hàng và hơn thế có thể mang lại trải nghiệm mới, ra mắt sản phẩm dịch vụ mới cho các tập khách hàng mới, từ đó tăng trưởng phát triển cho doanh nghiệp. Hơn nữa, dân chủ hóa dữ liệu có thể giúp tổ chức đưa ra quyết định kịp thời, tự tin điều chỉnh chiến lược kinh doanh và đưa ra những đánh giá chủ động.
Để cho phép mọi người sử dụng dữ liệu đúng cách mà không cần sự trợ giúp của các chuyên gia CNTT, các tổ chức cần các công cụ tự động hóa phân tích nâng cao. Các nền tảng này cho phép nhân viên có trình độ kỹ thuật khác nhau – từ không biết lập trình đến lập trình viên thấp đến lập trình viên – dễ dàng thực hiện các phân tích nâng cao mà không cần sự trợ giúp của CNTT để thực sự tạo ra giá trị thông qua dân chủ hóa.
Xu hướng 5: Triển Khai Kiến Trúc Data Mesh
Data mesh là một kiến trúc hỗ trợ phân tích dữ liệu tự phục vụ. Data mesh đề xuất việc phân cấp quyền sở hữu và quản lý dữ liệu, coi dữ liệu như một sản phẩm và thiết lập các đội ngũ dữ liệu theo Domain (miền).
Ý tưởng chính: của data mesh là phân phối trách nhiệm dữ liệu giữa các đội ngũ khác nhau trong doanh nghiệp. Điều này cho phép các đội ngũ tự quản lý các miền dữ liệu của riêng biệt và ra quyết định dựa trên dữ liệu một cách độc lập.
Ví dụ, đội ngũ quản lý tồn kho có thể sử dụng một hệ thống, trong khi các đội ngũ marketing và bán hàng sử dụng công cụ khác. Kết quả là các đội ngũ có dữ liệu họ cần và các công cụ để đổi mới, thử nghiệm và thực hiện quyết định hiệu quả.
Cách tiếp cận data mesh có nhiều lợi ích cho doanh nghiệp:
- tiết kiệm chi phí hơn vì giảm tải cho hệ thống lưu trữ
- tạo điều kiện cho sự tương tác
- tăng cường bảo mật
Người đầu tiên giới thiệu khái niệm data mesh, Zhamak Dehghani, đã công bố công ty dữ liệu của riêng cô – Nextdata – vào tháng 1 năm 2023.
Nextdata nhằm mục đích giúp các doanh nghiệp phân cấp dữ liệu bằng cách sử dụng kiến trúc data mesh và các container sản phẩm dữ liệu. Sản phẩm của Nextdata vẫn đang trong giai đoạn thiết kế và thử nghiệm.
Một ví dụ về kiến trúc data mesh đang hoạt động đến từ ngành tài chính, nơi dữ liệu cực kỳ quý giá nhưng việc chia sẻ nó đi kèm với các rủi ro về bảo mật và quyền riêng tư vốn có.
Ngân hàng JPMorgan Chase đã xây dựng một giải pháp data mesh với sự trợ giúp của AWS. Trước khi tích hợp data mesh, các đội ngũ cần phải trích xuất và kết hợp dữ liệu từ nhiều hệ thống và miền dữ liệu khác nhau để tạo báo cáo.
Nhưng với data mesh, các đội ngũ sở hữu dữ liệu làm cho dữ liệu có sẵn trong các Data Lake (Hồ dữ liệu). Các đội khác có thể tìm thấy dữ liệu đó qua danh mục dữ liệu doanh nghiệp và yêu cầu nó. Dữ liệu chảy trực tiếp từ ứng dụng của đội ngũ này sang ứng dụng của đội ngũ khác.
Xu hướng 6: Sử Dụng Dữ Liệu Tổng Hợp (Synthetic Data)
Dữ liệu tổng hợp (Synthetic Data) là dữ liệu giả, được tạo ra bởi một chương trình máy tính và không dựa trên bất kỳ người hoặc sự kiện thực tế nào. Nhưng nó đang trở nên cực kỳ giá trị trong lĩnh vực phân tích dữ liệu.
Khi ngày càng nhiều doanh nghiệp bắt đầu triển khai các hệ thống phân tích AI, họ cần dữ liệu để đào tạo các hệ thống đó. Một số công ty gặp khó khăn trong việc thu thập lượng dữ liệu lớn và chất lượng cao cần thiết để đào tạo các mô hình AI. Đây là lúc dữ liệu tổng hợp trở nên hữu ích.
Dữ liệu này được tạo ra bằng cách lấy một cơ sở dữ liệu, xây dựng một mô hình ML cho nó và tạo ra một tập dữ liệu thứ hai từ mô hình đó. Dữ liệu tổng hợp có cùng các mẫu và đặc điểm như dữ liệu thực tế, nhưng không gắn liền với bất kỳ định danh dữ liệu thực tế nào.
Một vấn đề lớn khác là bảo mật và quyền riêng tư.
Dữ liệu tổng hợp rất lý tưởng cho các doanh nghiệp cần giữ dữ liệu riêng tư. Việc ẩn danh dữ liệu có thể không hiệu quả, nhưng điều đó không bao giờ là vấn đề với dữ liệu tổng hợp vì nó không bao giờ là dữ liệu thực.
Ví dụ, UC Davis Health ở Sacramento, California, đã giành được khoản tài trợ 1,2 triệu đô la vào tháng 4 năm 2022 để đổi mới các phương pháp tạo dữ liệu tổng hợp nhằm dự đoán sự xuất hiện của bệnh tật.
Doanh nghiệp đã tiết kiệm được ba tháng vì không cần thực hiện các đánh giá quyền riêng tư. Họ cũng giảm thời gian xử lý dữ liệu xuống 4 tuần.
Họ đã phân tích dữ liệu tổng hợp để tạo ra các công cụ cho du khách, ứng dụng cho những người sử dụng phương tiện giao thông công cộng, và các giải pháp khác liên quan đến dữ liệu địa lý.
Gartner dự đoán rằng 60% dữ liệu được sử dụng bởi các giải pháp AI và phân tích sẽ là dữ liệu tổng hợp vào cuối năm nay.