Doanh nghiệp SME xây dựng hệ thống dữ liệu nội bộ như thế nào? | Phỏng vấn anh Quốc Thắng, Data Service Manager @Base.vn

marketing foundation

Tomorrow Marketers – Tầm quan trọng của dữ liệu đang ngày càng được khẳng định, nhất là khi sự phát triển của các thiết bị điện tử đang góp phần ghi lại dấu chân số của con người mọi lúc mọi nơi. Nhận thức được điều này, không chỉ tập đoàn lớn đầu tư xây dựng hệ thống dữ liệu nội bộ, các doanh nghiệp vừa và nhỏ cũng tìm cách số hóa để vận hành hiệu quả và mang lại sự tăng trưởng trong dài hạn. Tuy nhiên, việc thiếu nguồn lực khiến họ chưa thể áp dụng mô hình triển khai như các tập đoàn lớn trên thị trường, vậy giải pháp nào dành cho doanh nghiệp SME nếu họ muốn xây dựng hệ thống dữ liệu nội bộ cho riêng mình?

Cùng Tomorrow Marketers tìm hiểu trong bài phỏng vấn với anh Trương Quốc Thắng, Data Service Manager đến từ Base.vn – nền tảng quản trị doanh nghiệp được tin dùng bởi hơn 5,000 doanh nghiệp thuộc nhiều lĩnh vực khác nhau.

Cảm ơn anh Thắng đã nhận lời tham gia buổi phỏng vấn của Tomorrow Marketers.

Theo anh, điều gì là quan trọng nhất trong quá trình xây dựng hệ thống dữ liệu nội bộ?

Điều quan trọng nhất chính là các yếu tố xuất phát từ ban lãnh đạo công ty. Họ cần xác định rõ bài toán doanh nghiệp và tin rằng bài toán đó có thể giải quyết bằng dữ liệu. Nói cách khác, ban lãnh đạo phải có nhu cầu và quyết tâm áp dụng dữ liệu vào vận hành. Bởi trong bước đầu xây dựng hệ thống, doanh nghiệp sẽ phải tính toán rất nhiều thứ, từ yếu tố liên quan đến cơ sở hạ tầng dữ liệu, công cụ thu thập – quản lý – khai thác, đến yếu tố về mặt con người như đội ngũ chuyên môn, đội ngũ outsource. Mà đây mới là bước đầu đặt nền móng cho văn hoá ‘data – driven decision making’, nếu chủ doanh nghiệp chỉ đơn thuần chuyển đổi số theo phong trào mà không xuất phát từ nhu cầu cụ thể, họ sẽ không thể kiên trì đi theo cả quá trình dài này.

Đọc thêm: Data – driven marketing: Kim chỉ nam dẫn lối cho các chiến lược kinh doanh kỉ nguyên số

Có quan điểm cho rằng dữ liệu là đặc quyền của các công ty công nghệ và chỉ có các công ty công nghệ mới có đủ khả năng để xây dựng hệ thống dữ liệu nội bộ.  các công ty vừa và nhỏ, họ không có đủ nguồn lực để mua các công cụ đắt tiền hay tự lập 1 team data, anh có gợi ý nào giúp các doanh nghiệp này sử dụng dữ liệu hiệu quả được không?

Đối với các doanh nghiệp SME đã nhận thấy tầm quan trọng của dữ liệu, việc đầu tiên cần làm là đồng nhất chúng về 1 nguồn, có 2 cách: Làm thủ công hoặc sử dụng công cụ Data Pipeline.

Cách thứ nhất dành cho các doanh nghiệp SME có ít dữ liệu phát sinh. Bởi dữ liệu ít nên họ có thể đến từng nguồn để nhặt và tổng hợp dữ liệu vào một nơi duy nhất. Ví dụ, team marketing cần thu thập các số liệu quảng cáo để tính toán hiệu quả hoạt động marketing, tuy nhiên những dữ liệu họ cần lại nằm ở các nền tảng khác nhau như Facebook Ad Manager, Google Adwords và Google Analytics, khiến họ khó có cái nhìn tổng quan để so sánh và đánh giá. Để khắc phục sự phân mảnh rải rác đó, họ có thể xuất báo cáo và nhập dữ liệu về một file chung. Việc này tốn ít chi phí xây dựng hệ thống hay thuê nhân lực, tuy nhiên, vì con người làm thủ công nên có thể sẽ sai sót và không cập nhật theo thời gian thực.

Doanh nghiệp SME xây dựng hệ thống dữ liệu nội bộ như thế nào?

Cách thứ 2 dành cho các doanh nghiệp SME có nhiều dữ liệu phát sinh trong 1 khoảng thời gian ngắn. Với trường hợp này, doanh nghiệp có thể sử dụng công cụ như Zapier để tự động hóa việc cập nhật thông tin. Có thể hiểu Zapier như đường ống truyền dẫn dữ liệu từ nơi sản xuất về kho lưu trữ. Để xây dựng được “đường ống” này, doanh nghiệp có thể thuê ngoài (outsource) hoặc tự lập team data nội bộ đảm nhiệm.

Doanh nghiệp SME xây dựng hệ thống dữ liệu nội bộ như thế nào?

Thường thì những doanh nghiệp mới thử thu thập dữ liệu và cũng chưa biết rõ về các phần mềm, họ sẽ thử làm thủ công. Đến một lúc nào đó, khi dữ liệu phát sinh quá nhiều thì họ sẽ nghĩ đến chuyện đầu tư vào công cụ.

Doanh nghiệp có nhiều dữ liệu, nhưng không sử dụng được bởi chúng đang bị phân mảnh rời rạc ở nhiều nơi. Có cách nào để khắc phục vấn đề này?

Doanh nghiệp cần xây dựng một hệ thống dữ liệu nội bộ. Hệ thống đó sẽ bao gồm  4 yếu tố: Công cụ sản xuất dữ liệu (Data Collector), Công cụ dẫn truyền dữ liệu (Data Pipeline), Công cụ lưu trữ dữ liệu (Data Warehouse) và Công cụ khai thác dữ liệu (Data Mining Tool).

Công cụ sản xuất dữ liệu (Data Collector) là những phần mềm, công cụ với mục đích số hóa thông tin, dữ liệu thành các tài nguyên số. Vì đơn giản thôi, doanh nghiệp không thể trực quan hoá doanh thu của mình nếu như các con số vẫn chỉ nằm trên bản cứng của hợp đồng. Tuỳ thuộc vào loại dữ liệu muốn số hóa, mà doanh nghiệp có thể lựa chọn phần mềm phù hợp. Ví dụ, các phần mềm CRM như Nhanh.vn, Pipedrive được sử dụng cho bài toán số hoá doanh thu, Kiotviet cho bài toán quản lý hàng tồn kho, hay Base.vn, Trello cho bài toán vận hành. Nếu doanh nghiệp không muốn sử dụng phần mềm bên ngoài, có thể tận dụng excel lưu trữ dữ liệu, tuy nhiên cần thiết lập và tùy chỉnh để đáp ứng nhu cầu cụ thể.

Công cụ dẫn truyền dữ liệu (Data Pipeline): Giống như một ống dẫn nước, Data pipeline là công cụ dẫn dữ liệu lưu trữ từ các nguồn khác nhau về một nơi duy nhất là kho dữ liệu (Data Warehouse). Lấy ví dụ về Base Request, đây là phần mềm xử lý đề xuất trong nội bộ doanh nghiệp. Khi doanh nghiệp sử dụng Base Request để quản lý các đề xuất tài chính (tạm ứng, duyệt chi tiêu…), khi đó Base Request là nơi sinh ra các khoản chi của doanh nghiệp. Để kéo dữ liệu từ Base Request ra kho dữ liệu là Google Sheet, chúng ta cần đường ống – một đầu nối với Base Request và một đầu nối với Google Sheet. Để xây đường ống này, doanh nghiệp có thể sử dụng phương thức viết API hoặc mua phần mềm trung gian như Zapier.

Công cụ lưu trữ dữ liệu (Data Warehouse): Google Sheet có ưu điểm là linh hoạt và dễ dùng, tuy nhiên, sự toàn vẹn của thông tin có thể bị đe dọa bởi nhiều người cùng có quyền truy cập và thao tác với dữ liệu. Trong trường hợp cần bảo mật, chỉ cho phép vài người được truy cập, doanh nghiệp nên sử dụng database server như MySQL hay SQLserver.

Dữ liệu đã được đưa về kho, nhiệm vụ bây giờ là sử dụng các công cụ phù hợp để khai thác và chế biến (Data Mining Tool – các công cụ giúp xử lý dữ liệu, để biến dữ liệu thô thành các thông tin hữu ích cho doanh nghiệp). Nếu nhu cầu là giám sát tình hình kinh doanh thì Excel, PowerBI là công cụ khai thác phù hợp. Trường hợp nhu cầu là phân tích dự báo, việc sử dụng R và Python sẽ được cân nhắc để tạo ra các mô hình đáp ứng nhu cầu doanh nghiệp.

Doanh nghiệp SME xây dựng hệ thống dữ liệu nội bộ như thế nào?

Cần lưu ý gì về chất lượng dữ liệu trong quá trình thu thập và khai thác?

Dữ liệu được sản xuất bởi con người và sinh ra trong quá trình hoạt động của doanh nghiệp. Dòng chảy của dữ liệu sẽ đi qua các nơi như đường ống dữ liệu, kho dữ liệu rồi ra báo cáo. Cần chú ý dòng chảy đó không được làm thay đổi dữ liệu, phải đảm bảo tính toàn vẹn của nó. Bởi vậy, nên chúng ta cần có các quy tắc để dữ liệu được thống nhất, ví dụ muốn nhập doanh số năm mươi triệu, cần viết rõ là 50.000.000 thay vì ‘50 triệu’ để thuận tiện cho làm báo cáo sau này.

Từ kho dữ liệu, phát triển ra các báo cáo theo thời gian thực như thế nào (real-time dashboard)?

Đầu tiên, doanh nghiệp cần xác định rõ nhu cầu là họ cần cập nhật báo cáo theo chu kì nào, theo từng giây, từng phút, từng giờ hay theo ngày, và cân đối với chi phí doanh nghiệp có thể đáp ứng. Chu kì càng ngắn thì chi phí càng lớn. Bởi để ra được một bản báo cáo, mọi yếu tố từ Data collector, Data Pipeline đến Data Visualization đều phải được cập nhật. Ví dụ như việc một sàn chứng khoán phải cần đến vài trăm IT cùng vận hành mới có thể đáp ứng nhu cầu theo dõi số theo từng phút. Hay báo cáo của PowerBI tính phí 10$/tháng với 8 lần cập nhật dữ liệu trong ngày và 5000$/tháng cho 48 lần cập nhật dữ liệu trong ngày. Hãy cân đối chi phí và nhu cầu về tần suất xem báo cáo để lựa chọn cách làm phù hợp.

Tạm kết

Dữ liệu được truyền thông ví như vàng đen của thời đại 4.0, được gắn với những mác danh cao siêu như học máy, trí tuệ nhân tạo, kết nối vạn vật… vô tình khiến cho nó trở thành một mặt hàng xa xỉ, khó tiếp cận. Nhưng sự thật rằng, không cần phải sử dụng đến công cụ ‘cao siêu’ đó thì mới có thể khai thác. Dữ liệu có thể được xử lý bằng những công cụ đơn giản với chi phí thấp, thậm chí không mất phí như Excel hay Google Sheet. Quan trọng là doanh nghiệp cần xác định rõ bài toán của mình, quyết tâm xây dựng hệ thống dữ liệu, và hiểu được logic nội tại của từng phương pháp để có thể tận dụng chúng hiệu quả.

Nếu bạn muốn tìm hiểu sâu hơn cách thiết lập và vận hành dữ liệu, hãy tham khảo khóa Data System của Tomorrow Marketers!

Tagged: