Data democratization là gì? Làm thế nào để dân chủ hoá dữ liệu?

marketing foundation

Tomorrow MarketersDân chủ hoá dữ liệu là việc phá vỡ các data silo – tình trạng dữ liệu bị cô lập, chỉ có một phòng ban có thể truy cập được. Mục tiêu của việc dân chủ hoá dữ liệu là để mọi người sử dụng dữ liệu bất cứ lúc nào, lấy dữ liệu từ bất kỳ nguồn nào mà không có rào cản tiếp cận. Nói cách khác, nguyên tắc khi triển khai data democratization là dữ liệu phải luôn có sẵn với mọi đối tượng trong một tổ chức, không phải chỉ ở trong tay của nhà quản lý hay một chuyên gia dữ liệu nào đó. 

Nguyên tắc trong dân chủ hoá dữ liệu đã mang đến nhiều biến chuyển trong hệ thống công nghệ thông tin của doanh nghiệp. Và một trong số đó là ý tưởng về kiến trúc tự phục vụ (self-service architecture), giúp một lượng lớn người dùng có thể tự truy cập dữ liệu.

So sánh giữa quản lý dữ liệu tập trung và quản lý dữ liệu phi tập trung (Centralized vs. Decentralized Analytics Model)

Centralized Analytics ModelDecentralized Analytics Model (Data democratization)
Quản trị dữ liệuDễ dàng trong việc đảm bảo quản trị dữ liệu (data governance). Data team sẽ toàn quyền quản lý hệ thống dữ liệu và xuất báo cáo khi có yêu cầu.Khó khăn trong việc đảm bảo quản trị dữ liệu (data governance). 
Ví dụ, không đặt quy tắc chung cho dữ liệu gây ra tình trạng một chỉ số có nhiều cách tính khác nhau, những giá trị này được gán dựa trên cách hiểu của riêng từng người trong tổ chức
Thời gian có được insightMất nhiều thời gian để tìm insight hơn. Vì người đưa yêu cầu sẽ cần đợi data team xử lý dữ liệu và xuất báo cáo, nhiều khi quá trình này gây ra sự chậm trễ trong việc kịp thời ra quyết định xử lý các vấn đề phát sinh.Thời gian tìm ra insight và ra quyết định nhanh hơn vì tự người dùng có thể truy cập báo cáo và ngay lập tức có được thông tin mình cần.
Ad hoc data explorationKhó khăn khi cần phân tích ad hoc (cần dữ liệu đơn giản và có sẵn tại một thời điểm để ra quyết định nhanh chóng).Dân chủ hoá dữ liệu được xây dựng để đơn giản hoá việc triển khai ad hoc reporting.
Phân tích dữ liệuPhân tích dữ liệu chuyên nghiệp với data team.Phân tích dữ liệu dùng kỹ thuật đơn giản hơn vì đa số người dùng không phải chuyên gia dữ liệu.
Bối cảnh dữ liệuKhông hiểu hết bối cảnh đằng sau việc sử dụng dữ liệu, và các sắc thái của dữ liệu trong kinh doanh.Hiểu sâu về bối cảnh đằng sau việc sử dụng dữ liệu, và các sắc thái của dữ liệu trong kinh doanh.

Concept của data democratization ngày càng trở nên hoàn thiện hơn và có nhiều doanh nghiệp mong muốn áp dụng concept này, nhằm giúp quá trình ra quyết định trở nên dễ dàng và nhanh chóng hơn. 

Tuy nhiên, việc dịch chuyển từ mô hình quản trị dữ liệu đóng sang một mô hình mở sẽ gặp phải một số thách thức:

  • Đó có thể là vấn đề về văn hoá, với những công ty đang gặp khó khăn trong việc phổ biến kiến thức dữ liệu tới toàn bộ tổ chức.
  • Đó có thể là vấn đề về chính sách, khi đội ngũ kinh doanh đang quá phụ thuộc vào các chuyên gia dữ liệu.
  • Đó có thể là vấn đề về thủ tục, khi các nhà khoa học dữ liệu muốn kích hoạt một số khả năng phân tích cho người dùng, nhưng không có cách nào để dễ dàng làm điều đó.
  • Đó có thể là vấn đề về công nghệ, làm sao để các công cụ Business Intelligence có thể cân bằng giữa sức mạnh và khả năng sử dụng, vừa cho phép team kỹ thuật thiết lập, vừa cho phép team kinh doanh dễ dàng sử dụng dữ liệu trong từng bối cảnh chức năng cụ thể của họ.
  • Hoặc vấn đề cũng đến từ chính nguồn lực, doanh nghiệp không có những người đủ khả năng để quản trị, truy vấn và sắp xếp dữ liệu, trong khi các Data Scientists và Data Analysts lại có quá nhiều nơi cần, doanh nghiệp hiện tại chưa thể tuyển được họ.

Làm thế nào để dân chủ hoá dữ liệu?

1. Quản trị dữ liệu hiệu quả (Good data governance)

Bạn cần có sẵn hệ thống quy tắc và hướng dẫn thực hành được ghi chép đầy đủ để đảm bảo rằng, doanh nghiệp luôn có sẵn một nguồn tham khảo, đối chứng. Đây là nguyên tắc cơ bản khi quản trị dữ liệu, giúp dữ liệu trở nên đáng tin cậy, thống nhất, hoàn thiện và chính xác. 

Dân chủ hoá dữ liệu làm sao cho dữ liệu trở nên dễ hiểu đối với mọi người. Bạn sẽ không phải chạy thật nhiều truy vấn, diễn giải đồ thị phức tạp, cố gắng hiểu những phân tích đằng sau kết quả đưa ra, hiểu việc kết nối và so sánh bảng cohort. Đừng bao giờ suy nghĩ rằng, bạn ‘ban ơn’, cho phép mọi người nhìn vào thế giới mà dữ liệu mở ra, chỉ bởi họ loay hoay không biết phải tận dụng công cụ như thế nào. Đây không phải tư duy của một người thực hiện ‘cách mạng’ dân chủ hoá dữ liệu. Nói cách khác, dân chủ hoá yêu cầu doanh nghiệp cung cấp cho mọi người cách thức đơn giản nhất để xử lí và giải thích dữ liệu, chứ không phải bày sẵn tất cả mọi thứ phức tạp ở đó rồi đến cuối cùng, người dùng cũng không hiểu phải đọc ra sao và kết luận điều gì.

Đọc thêm: Doanh nghiệp SME xây dựng hệ thống dữ liệu nội bộ như thế nào? | Phỏng vấn anh Quốc Thắng, Data Service Manager @Base.vn

2. Tạo ra môi trường kết hợp (Hybrid environment)

Cloud computing đang dần thay thế các mô hình trung tâm dữ liệu truyền thống. Từ góc độ kinh doanh, cloud migration là một chiến lược đối với các doanh nghiệp SMEs. Hiểu một cách đơn giản, cloud computing chính là việc bạn lưu trữ tài liệu của mình “lơ lửng trên những đám mây” bằng một vài giải pháp nào đó uy tín như Google Drive hay OneDrive. Và chỉ cần có kết nối Internet, bạn có thể truy cập vào những dữ liệu đó ở bất cứ nơi đâu và bất cứ khi nào. 

Tuy nhiên, việc dịch chuyển toàn bộ sang cloud gặp phải rất nhiều thách thức lớn về kỹ thuật và tài chính. Lúc này, doanh nghiệp có thể lựa chọn phương án kết hợp giữa hệ thống CNTT truyền thống song song với triển khai cloud computing – một cái tên khác của dự án này là IT Hybrid. 

Trong môi trường kết hợp này, cách tối ưu nhất để tiếp cận data democratization là thông qua các giao diện tiêu chuẩn của ngành như OData, ADO.NET, JDBC và ODBC. Bằng cách này, bạn sẽ không cần duy trì code hoặc hàng loạt các APIs khác nhau, dữ liệu sẽ được coi như như một relational database và thực hiện chức năng của nó với công cụ SQL quen thuộc. Những giao diện này cung cấp quyền truy cập ‘point – and – click’ vào nhiều nguồn dữ liệu khác nhau trong thời gian thực và đảm bảo không có dữ liệu cũ hoặc dữ liệu trùng lặp.

3. Lựa chọn đúng công cụ và hướng dẫn các thành viên sử dụng thành thạo công cụ đó

Trong thế giới của dân chủ hoá dữ liệu, phá vỡ các data silo là bước đầu tiên tiến tới việc trao quyền cho người dùng. Điều này sẽ không thể thực hiện nếu thiếu đi các công cụ phân tích có thể tùy chỉnh phù hợp với nhu cầu doanh nghiệp. Những công cụ này có khả năng tách biệt và kết nối dữ liệu đã được lưu trữ trước đó, giúp bạn có thể quản lý dữ liệu từ một nơi duy nhất.

Lý tưởng nhất là các công cụ sẽ lọc dữ liệu, trực quan hoá và chia sẻ chúng với từng cá nhân – từ nhà quản lý tới nhân viên – dữ liệu có thể tùy chỉnh theo vai trò của từng người. Ví dụ, nếu một marketing manager cần dữ liệu để phân tích phân khúc khách hàng cho một chiến dịch mới, thì CMO sẽ cần dữ liệu để phân tích marketing ROI và lập kế hoạch ngân sách đầu tư cho năm tiếp theo.

Đọc thêm: Mẫu marketing dashboard giúp bạn theo dõi và đánh giá hiệu quả bộ phận marketing

Những công cụ đó phải giúp nhân viên trực quan hóa dữ liệu của họ. Việc trực quan hoá này cần giúp người dùng cảm thấy hài lòng và hữu ích mỗi khi họ truy cập. Những hình ảnh trực quan này phải phù hợp với KPI và metric quan trọng của tổ chức để có thể ra quyết định dựa trên dữ liệu một cách hiệu quả nhất.

Sau khi đã có trong tay công cụ phù hợp, việc tiếp theo là tổ chức các buổi đào tạo cho nhân viên. Vì quá trình dân chủ hoá dữ liệu được triển khai dựa trên self-service concept (tự phục vụ), mỗi thành viên trong team cần được hướng dẫn để làm quen với công cụ, concept và quy trình, cho đến khi thành thục, có thể tự triển khai phần phân tích của riêng mình.

4. Xây dựng niềm tin với người sử dụng dữ liệu

Các dự án phân tích dữ liệu liên tục bị cản trở bởi sự thiếu tin cậy. Khi các cá nhân trong một tổ chức được trao quyền sử dụng dữ liệu để ra quyết định chiến lược, họ sẽ mang lại sự tăng trưởng cho tổ chức. Nhưng sự trao quyền này có thể nhanh chóng chuyển thành ‘cơn ác mộng’ nếu hệ thống đầy rẫy các vấn đề về chất lượng dữ liệu. Sẽ không ai tin tưởng sử dụng nếu thấy dữ liệu hiển thị không đáng tin cậy. Niềm tin là vấn đề lớn nhất cần giải quyết khi bắt đầu bất kỳ dự án phân tích dữ liệu nào và những người xây dựng data stack phải làm sao để giải quyết thách thức này, có thể tạo niềm tin cho tất cả những người dùng cuối.

Bất cứ thứ gì được xây dựng để tồn tại lâu dài đều có một nền tảng vững chắc. Việc xây dựng một data analytics stack đạt tiêu chuẩn đòi hỏi các thành phần trong đường ống dữ liệu (data pipeline) và kho dữ liệu (data warehouse) phải kết nối vững chắc. Dữ liệu được sản xuất bởi con người và sinh ra trong quá trình hoạt động của doanh nghiệp. Dòng chảy của dữ liệu sẽ đi qua từ nơi sản xuất, qua đường ống và về kho lưu trữ. Cần chú ý dòng chảy đó không được làm thay đổi dữ liệu và đảm bảo tốc độ cập nhật kịp thời.

Giải pháp kiến trúc, bao gồm những công cụ và công nghệ được tích hợp trong data stack, có thể được liệt kê với các thành phần như: một công cụ ETL trích xuất, chuyển đổi và tải dữ liệu, các đầu nối giao tiếp với quy trình ETL, một kho lưu trữ dữ liệu, và không thể thiếu là một layer trực quan hoá dữ liệu, cho phép người dùng thấy được báo cáo mà không cần cố gắng hiểu bất cứ cách thức xử lý dữ liệu nào. Khi các thành phần thiết yếu này được cấu trúc, lắp ráp và triển khai đúng cách, người dùng sẽ có được kết quả mà họ mong muốn và từ đó, niềm tin của họ với hệ thống này được củng cố, họ sẽ ủng hộ và đóng góp tích cực tới dự án dân chủ hoá dữ liệu hơn.

Tạm kết

Áp dụng công nghệ chỉ là một phần của việc dân chủ hoá dữ liệu. Dân chủ hoá dữ liệu là một hành trình xây dựng và cải tiến của một tổ chức. Để ứng dụng thành công mô hình này vào vận hành, doanh nghiệp cần:

  • Hiểu rõ bài toán của mình, tại sao doanh nghiệp cần quản lý dữ liệu phi tập trung, doanh nghiệp đang cần xử lý bài toán nào?
  • Biết rõ những gì mình đang có sẵn trong tay: quy mô dữ liệu, văn hoá công ty, nguồn lực tài chính, con người, công cụ,…
  • Lựa chọn công cụ phù hợp, kết hợp hài hoà giữa những gì mình cần và những gì mình đang sở hữu

Đó là tư duy mà khoá học Data System của Tomorrow Marketers muốn truyền tải, để giúp các doanh nghiệp xây dựng văn hoá dữ liệu và khai phá những tiềm năng tăng trưởng ngay từ dữ liệu nội bộ. Khóa học Data System sẽ giúp bạn hiểu rõ:

  • Tầm quan trọng của hệ thống dữ liệu nội bộ đối với sự tăng trưởng dài hạn của doanh nghiệp.
  • Cấu trúc của hệ thống dữ liệu nội bộ: Hiểu rõ các thành phần của một hệ thống dữ liệu hoàn chỉnh.
  • Tư duy xây dựng quy trình và số hoá quy trình kinh doanh nhằm thu thập được dữ liệu qua thời gian
  • Tư duy xây dựng đường ống dữ liệu và nhà kho dữ liệu, giúp doanh nghiệp chuẩn hoá dữ liệu từ sớm.
  • Tư duy khai thác dữ liệu để xây dựng các dashboard & báo cáo quản trị, cung cấp bức tranh toàn cảnh của kinh doanh và giám sát hoạt động.

Tìm hiểu và đăng ký khoá học tại đây.

Bài viết được biên soạn bởi Tomorrow Marketers, vui lòng không sao chép dưới mọi hình thức!

Tagged: