Dark data: Rủi ro tiềm ẩn khi dữ liệu không được khai thác? Doanh nghiệp nên làm gì để cải thiện tình trạng này?

tình trạng dark data
marketing foundation

Tomorrow Marketers – Chúng ta đang sống trong một thế giới được bao quanh bởi vô vàn thông tin và dữ liệu. Dữ liệu truyền cảm hứng cho mọi ý tưởng và giải pháp của doanh nghiệp, thậm chí được coi như một tài sản, một đơn vị tiền tệ mới. 

Tuy nhiên, nghiên cứu của TRUE Global Intelligence vào năm 2020 chỉ ra rằng một nửa lượng dữ liệu trong các doanh nghiệp được khảo sát được coi là “dark data”, tức là những dữ liệu chưa được biết đến, khai thác và sử dụng. Đây là một vấn đề lớn, có thể tạo ra những tác động tiêu cực đối với hoạt động kinh doanh của doanh nghiệp hiện nay. 

Vậy tại sao dark data tồn tại và doanh nghiệp có thể làm gì để đối phó với tình trạng này? Cùng TM tìm hiểu thêm trong bài viết sau nhé!

Dark data là gì?

Theo Gartner, công ty đầu tiên đưa ra khái niệm này, dark data là những thông tin mà doanh nghiệp đã thu thập, xử lý và lưu trữ trong quá trình hoạt động kinh doanh thông thường, nhưng không được khai thác và sử dụng cho mục đích khác. 

Cụ thể hơn, dark data chứa tất cả những thông tin về hoạt động của khách hàng, người dùng, máy chủ, mạng xã hội và các thiết bị di động. Dark data thường là những tệp dữ liệu không có cấu trúc hoặc bán cấu trúc, chẳng hạn như:

  • Dữ liệu thô từ khảo sát
  • Dữ liệu của nhân viên cũ
  • Phiên bản cũ của tài liệu có liên quan
  • Báo cáo tài chính
  • Hồ sơ chi tiết cuộc gọi
  • Thư điện tử
  • Tệp nhật ký (log file)
  • Các ghi chú khác

Cần lưu ý rằng dark data có thể đến từ nguồn dữ liệu nội bộ (first-party data) như hệ thống quản lý khách hàng CRM và thư điện tử, hoặc nguồn dữ liệu từ bên thứ ba (third-party data) như dữ liệu từ mạng xã hội (social data) hoặc nội dung của các trang web ngoài (external site content). 

Tại sao lại xuất hiện tình trạng dark data?

Theo báo cáo của Splunk, có rất nhiều lý do tại sao dark data tồn tại trong hệ thống của doanh nghiệp. Có thể kể đến một vài những nguyên nhân và thách thức như:

  • Data chưa đủ hoặc trùng lặp, cần được “làm sạch” trước khi sử dụng
  • Data được xem là quá cũ và lỗi thời để có thể cung cấp thêm giá trị cho công ty. 
  • Data tồn tại ở dạng thức không thể truy cập được với công cụ có sẵn của tổ chức
  • Doanh nghiệp không có thời gian và tài nguyên để xử lý data
  • Doanh nghiệp chưa hiểu hết tiềm năng của data đó nên chưa thể sử dụng
  • Tình trạng data silo trong doanh nghiệp
  • Doanh nghiệp thậm chí không biết rằng dark data tồn tại

Nhìn chung, dark data là một nguồn tài nguyên tiềm năng chưa thực sự được khai thác và tận dụng triệt để bởi doanh nghiệp, do một số lý do cả chủ quan và khách quan đem lại. 

Đọc thêm: Data overload: Quá nhiều data phải xử lý? Lời giải nào cho Marketers?

Doanh nghiệp có thể đối mặt với những vấn đề gì được gây ra bởi dark data?

Mất đi lợi thế cạnh tranh

Theo Datawatch, nếu không đầu tư vào việc xử lý và phân tích dark data, doanh nghiệp có thể mất đi lợi thế cạnh tranh so với đối thủ. 

Trên thực tế, marketer có thể tiếp cận những data này để hiểu thêm về khách hàng và những hành vi của họ, từ đó cải thiện mối quan hệ giữa thương hiệu và khách hàng. 

Cụ thể, dark data có thể đem đến cho marketer những nguồn insight vô cùng giá trị từ hệ thống quản lý khách hàng CRM và tài chính của doanh nghiệp, cũng như tiêu chuẩn đối sánh (competitive benchmarks) và dữ liệu trong ngành (có thể kể đến thông tin độc quyền về sản phẩm, tình trạng tài chính và thị phần). 

Nắm được những điều này, doanh nghiệp có thể nâng cao hiệu suất kinh doanh và tối đa lợi tức ROI của mình. 

Rủi ro lưu trữ và bảo mật dữ liệu

Dữ liệu tích tụ trong thời gian dài sẽ làm đầy kho lưu trữ dữ liệu và chiếm dung lượng của những tài sản giá trị khác của doanh nghiệp. Bộ nhớ dữ liệu tăng lên cũng đồng nghĩa với việc phát sinh chi phí chung (overhead cost) của doanh nghiệp. 

Tuy nhiên, điều đáng lo ngại hơn là việc lượng dữ liệu lớn và lộn xộn có thể tiềm ẩn những rủi ro về bảo mật. 

Cùng với tài liệu lỗi thời và dường như vô ích, dark data có thể chứa những thông tin nhạy cảm và độc quyền của doanh nghiệp, như hồ sơ thanh toán, tài liệu cũ hoặc thông tin về cựu nhân viên. 

Bên cạnh đó, dark data cũng chứa những thông tin cá nhân của khách hàng trong quá trình giao dịch và tương tác với doanh nghiệp. Theo Gartner, ngày nay, khách hàng sẵn sàng cung cấp thông tin của họ để đổi lại những trải nghiệm cá nhân hấp dẫn hơn. 

Tuy nhiên, báo cáo của Gartner vào năm 2019 dự đoán rằng cho đến năm 2025, 80% marketer có thể từ bỏ nỗ lực cá nhân hóa trải nghiệm của mình do sự khó khăn về quản lý dữ liệu khách hàng. 

Quan trọng hơn, doanh nghiệp có thể vi phạm các quyền riêng tư và đánh mất lòng tin của khách hàng, đặc biệt khi những dữ liệu thu được tạo nên kẽ hở cho các hacker xâm nhập và trục lợi. 

Theo báo cáo của Security Intelligence, chi phí trung bình cho một vụ vi phạm dữ liệu (data breach) đã tăng từ 3.5 triệu USD vào năm 2014 lên đến 4 triệu USD vào năm 2016. Tuy con số này có giảm vào năm 2017 (3,62 triệu USD), nó lại tiếp tục tăng lên qua các năm sau đó và đạt mức 3,92 triệu USD vào năm 2019, gây nên những tổn thất không hề nhỏ cho các doanh nghiệp. 

Làm thế nào để cải thiện tình trạng dark data trong doanh nghiệp?

Phát triển chiến lược làm việc với dữ liệu

Dark data là một trong những vấn đề gây nhức nhối lớn nhất trong các doanh nghiệp hiện nay, và không thể giải quyết trong nay mai. 

Tuy nhiên, doanh nghiệp hoàn toàn có thể từng bước cải thiện tình trạng này thông qua việc xây dựng một chiến lược cụ thể để tiếp cận và làm việc với số liệu trong lâu dài. 

Để xây dựng được một chiến lược hiệu quả, doanh nghiệp cần coi dữ liệu là ưu tiên số một và tài sản cốt yếu của mình, từ đó chủ động tiếp cận, phân loại và đưa ra hướng hành động cho những data thu được. 

Chẳng hạn, doanh nghiệp cần nắm được rằng nhóm dữ liệu khách hàng (customer data) có thể cung cấp những insight hữu ích liên quan đến hành vi mua hàng của người tiêu dùng. Từ đó, doanh nghiệp có thể biết được nên đầu tư vào các kênh nào để tăng trưởng doanh số và phát triển sản phẩm. 

Ngoài ra, doanh nghiệp cần chú ý cân bằng giữa việc bảo mật dữ liệu và việc đem lại những trải nghiệm cá nhân hóa cho khách hàng. 

Để thực hiện được điều này, doanh nghiệp cần đảm bảo chỉ thu thập những thông tin phù hợp cho việc nghiên cứu hành vi của họ, dựa trên việc tuân thủ chặt chẽ các quy định và điều luật liên quan đến người tiêu dùng. 

Trang bị tư duy và nâng cao kỹ năng làm việc với dữ liệu của nhân sự

Phát triển chiến lược và văn hóa làm việc với dữ liệu là định hướng xuyên suốt. Tuy nhiên, làm thế nào để doanh nghiệp có thể đảm bảo chiến lược đó được thực thi, duy trì và đem lại hiệu quả?

Câu trả lời chính là đầu tư vào nhân sự. 

Một số công ty lớn có thể nghĩ đến việc thuê chuyên gia về dữ liệu, hoặc bổ nhiệm những vị trí chuyên đảm đương các vấn đề về số liệu. Tuy nhiên, nhìn chung các công ty dù lớn hay nhỏ thì cũng cần đào tạo và trang bị kỹ năng làm việc với số liệu cho toàn bộ nhân viên. 

Doanh nghiệp nên thường xuyên cung cấp cơ hội cho nhân viên học hỏi và thực hành với dữ liệu thông qua các lớp học, sự kiện, hội thảo. 

Bên cạnh đó, cần khuyến khích những cá nhân này hình thành khả năng tự học và đảm bảo rằng họ luôn đưa ra quyết định dựa trên tư duy về dữ liệu (data-driven mindset) trong công việc hàng ngày. 

Đọc thêm: Data-driven marketing: Kim chỉ nam dẫn lối cho các chiến lược kinh doanh kỷ nguyên số

Khám phá tiềm năng của trí tuệ nhân tạo (Artificial Intelligence) 

Bên cạnh việc tập trung xây dựng đội ngũ nhân viên có tư duy làm việc với dữ liệu, một trong những biện pháp mà doanh nghiệp có thể cân nhắc là ứng dụng các công cụ thông minh giúp tự động hóa quá trình phân tích số liệu. 

Nói cách khác, doanh nghiệp nên xem xét và khai thác tiềm năng của trí tuệ nhân tạo (Artificial Intelligence). Tuy không thể thay thế khả năng suy luận của con người, AI là một công cụ đắc lực giúp thu thập và xử lý dữ liệu với tốc độ và quy mô mà khả năng của con người chưa đạt tới được. 

Nhờ vậy, doanh nghiệp có thể đưa ra các dự đoán và quyết định nhanh chóng, chính xác hơn.

Một vài ứng dụng của AI trong hoạt động phân tích số liệu như:

  • Xác định các xu hướng (trend) và dạng thức (pattern) từ các số liệu thu được. 

Ví dụ: Google Analytics, Tableau, Power BI.

  • Tích hợp dữ liệu từ nhiều nguồn và nền tảng khác nhau.

Ví dụ: Microsoft Azure, IBM, Google Data Studio.

  • Phân tích chuyên sâu và đưa ra các dự đoán như về hành vi khách hàng và phát triển sản phẩm. 

Ví dụ: Python, R, SPSS.

Để có thể ứng dụng công cụ AI hiệu quả nhất, doanh nghiệp nên tích cực theo dõi và cập nhật thông tin về sự phát triển của công cụ AI trong lĩnh vực của mình, đồng thời đầu tư ngân sách vào các công cụ thích hợp với quy mô và năng lực.

Đọc thêm: Giới thiệu một số công cụ phân tích dữ liệu cho cá nhân và doanh nghiệp

Tạm kết

Dark data là một vấn đề phức tạp, tồn tại dưới nhiều dạng thức khác nhau và có thể tiềm ẩn những nguy cơ gây tổn hại đến hiệu suất vận hành của doanh nghiệp. Tuy nhiên, doanh nghiệp vẫn có thể cải thiện tình trạng này, thông qua việc xây dựng chiến lược làm việc với dữ liệu, đào tạo kỹ năng số liệu cho nhân viên và ứng dụng các công cụ trí tuệ nhân tạo.

Tư duy làm việc với dữ liệu, bao gồm việc đọc hiểu, kết nối và phân tích các nhóm dữ liệu khác nhau cũng là nội dung chính được truyền đạt trong khóa học Data Analysis của Tomorrow Marketers. 

Đến với khóa học này, marketer trẻ không chỉ được lắng nghe chia sẻ về bí quyết xử lý biển dữ liệu đồ sộ và phức tạp từ các chuyên gia nhiều kinh nghiệm mà còn có cơ hội được trực tiếp thực hành giải các case study thực tiễn, qua đó được rèn luyện và nâng cao khả năng làm việc với số liệu của mình. 

Tagged: