3 bước biến dữ liệu thành “Actionable Insight” – Chia sẻ từ kinh nghiệm làm Data tại Meta, Uber, Rippling

marketing foundation

Tomorrow Marketers – Dữ liệu ngày càng đóng vai trò quan trọng giúp doanh nghiệp đưa ra các quyết định tốt hơn. Nhiều doanh nghiệp cũng nhận ra điều này, và tập trung rất nhiều nguồn lực vào việc thu thập dữ liệu, xây dựng văn hóa doanh nghiệp dựa trên dữ liệu. Dù vậy, trên thực tế nhiều quyết định cuối cùng của doanh nghiệp vẫn dựa vào kinh nghiệm chứ không dựa trên dữ liệu, bởi doanh nghiệp thiếu đi khả năng biến dữ liệu thành những insight hay đề xuất “có thể ứng dụng” được trong thực tế. 

Bài viết này sẽ cung cấp cho bạn một mindset bao gồm 3 bước để biến dữ liệu thành “Actionable Insight”, được đúc kết từ kinh nghiệm làm Data tại Meta, Uber, Rippling của tác giả Torsten Walbaum. 

Bước 1: Xác định các chỉ số quan trọng để theo dõi và phân tích

Trước tiên, bạn cần xác định những chỉ số “key” cần theo dõi và phân tích, điều này sẽ đảm bảo không bị dàn trải nguồn lực của mình, mà chỉ tập trung vào phân tích những yếu tố tác động trực tiếp đến kết quả kinh doanh cuối cùng. 

Một phương pháp hiệu quả để làm điều này chính là sử dụng Driver/Issue tree để chia nhỏ vấn đề hoặc mục tiêu mà bạn muốn đạt được.

Hãy xem một ví dụ dưới đây: 

sử dụng Driver/Issue tree để chia nhỏ vấn đề

Ví dụ, mục tiêu cuối cùng ở đây là tăng doanh thu từ quảng cáo. Chúng ta sẽ sử dụng công thức toán học để chia nhỏ ra: 

Revenue (Doanh thu) = Impressions (Số lượt hiển thị) * CPM / 1000

Từ phương trình này, ta có thể tiếp tục bẻ nhỏ Impressions = Active users * Impression/user >  Active users = New active users * Retained active users,… 

Sau quá trình “bẻ nhỏ” này, bạn sẽ xác định rõ ràng các yếu tố cần tập trung để tăng doanh thu từ quảng cáo, từ đó thu thập và xây dựng các dashboard để theo dõi, phân tích các yếu tố đó. 

Lưu ý: Các doanh nghiệp với các mô hình kinh doanh (business model) khác nhau sẽ có những công thức khác nhau để tính toán, đòi hỏi bạn phải có hiểu biết về mô hình kinh doanh của doanh nghiệp. Nếu bạn đang làm cho các doanh nghiệp công nghệ, có thể tham khảo một số công thức tại đây

Ngoài phương pháp sử dụng công thức toán học (Algebra structure), có một số phương pháp khác mà bạn có thể tham khảo để phát triển Driver/Issue tree như Process Structure, Conceptual Framework,… Bạn có thể tham khảo thêm trong bài viết 3 kỹ thuật lập Issue Tree để xác định và giải quyết vấn đề hoặc trong khóa học Data Analysis – Phân tích dữ liệu cho quyết định chiến lược

3 kỹ thuật lập Issue Tree

3 kỹ thuật lập Issue tree giúp chia nhỏ vấn đề để phân tích – Slide khóa học Data Analysis with Power BI | Tableau – Phân tích dữ liệu cho quyết định chiến lược.  

Từ Driver/Issue tree đã được phát triển, để xác định những chỉ số “key” hiệu quả, có một số khái niệm mà bạn sẽ cần biết: 

Leading Indicators (Chỉ số dẫn dắt): 

Đây là những chỉ số mà bạn theo dõi để dự đoán và điều chỉnh chiến lược nhằm đạt kết quả mong muốn. 

Ví dụ: Số lượt hiển thị quảng cáo (Impressions) có thể là một chỉ số dẫn dắt, giúp bạn biết được mức độ tiếp cận của quảng cáo và dự đoán số lượng người dùng mới. Nếu sau khi thay đổi nội dung quảng cáo, số lượt hiển thị tăng, bạn có thể tiếp tục sử dụng mẫu quảng cáo đó để đạt mục tiêu về số lượt hiển thị đề ra.

Các chỉ số càng ở cuối Driver/Issue tree thường sẽ là chỉ số dẫn dắt mà bạn có thể tác động vào và điều chính nhằm đạt được mục tiêu cuối cùng. 

Lagging Indicators (Chỉ số trễ):

Là những chỉ số phản ánh kết quả cuối cùng, cung cấp cái nhìn toàn diện về hiệu quả của các chiến lược và hành động đã thực hiện, từ đó giúp rút ra bài học để cải thiện các hành động trong tương lai. 

Chỉ số trễ thường cho thấy kết quả của các hành động đã thực hiện từ vài tuần đến vài tháng trước đó. Doanh thu (Revenue) là một ví dụ điển hình của chỉ số trễ. Team Sales và Marketing thực hiện rất nhiều hành động để thu hút lead, nhưng để lead chuyển đổi thành deals, và cuối cùng chốt thành công để tạo ra doanh thu sẽ là một quá trình có thể kéo dài đến nhiều tháng. 

Các chỉ số càng ở đầu của Driver/Issue tree thường sẽ là các chỉ số trễ. 

Lag (Độ trễ): 

Là khoảng thời gian giữa một hành động và kết quả của nó. Ví dụ, từ khi thực hiện chiến dịch quảng cáo đến khi thấy được doanh thu từ chiến dịch đó có thể có một khoảng thời gian nhất định.

Việc xác định độ trễ giúp bạn hiểu được phải chờ bao lâu mới thấy kết quả từ các hành động, từ đó đưa ra quyết định tiếp tục hoặc điều chỉnh chiến lược kịp thời.

Ví dụ, nếu bạn biết rằng phải mất 3 tháng để thấy kết quả từ một chiến dịch quảng cáo, bạn sẽ không vội vàng thay đổi chiến dịch trước khi hết khoảng thời gian này. 

Ban đầu, bạn sẽ cần thử nghiệm để có thể xác định một khoảng thời gian hợp lý, sau khi có được mốc thời gian rồi, bạn sẽ biết được với một hành động mới sẽ cần bao lâu để có thể thấy kết quả.  

Bước 2: Thu thập và khám phá dữ liệu

Sau khi xác định được các chỉ số quan trọng, bước tiếp theo là thiết lập các hệ thống và quy trình để theo dõi và thu thập dữ liệu về các chỉ số này. Điều này giúp bạn có được cái nhìn liên tục và cập nhật về hiệu suất của doanh nghiệp, từ đó có thể đưa ra các quyết định kịp thời và chính xác.

Để theo dõi các chỉ số một cách hiệu quả, bạn cần thiết lập các dashboard (bảng điều khiển) để hiển thị dữ liệu một cách trực quan và dễ hiểu. Các công cụ BI (Business Intelligence) như Power BI, Tableau, Google Sheets hay Excel đều có thể được sử dụng cho mục đích này.

Đọc thêm: Excel vs Power BI: Nên Dùng Công Cụ Nào Để Phân Tích Dữ Liệu?

Bài viết này sẽ không đi quá sâu vào cách để tạo một Dashboard mà sẽ đi vào các tips thực tiễn để bạn hiểu rõ tệp dữ liệu, thu thập được data một cách hợp lý, từ đó tránh việc đưa ra những insight thiếu chính xác từ dữ liệu. 

Nếu bạn muốn tìm hiểu thêm về cách xây dựng Dashboard có thể tham khảo một số bài viết dưới đây:

Hoặc có thể tham khảo khóa học Data Analysis with Power BI | Tableau để được hướng dẫn chi tiết.

Chọn khung thời gian thu thập dữ liệu phù hợp

Để tránh việc thu thập quá nhiều dữ liệu gây ra nhiễu, nhưng vẫn đảm bảo có đủ dữ liệu để phát hiện ra những “điểm nóng” kịp thời, việc xác định khoảng thời gian để thu thập dữ liệu là vô cùng quan trọng. 

Để xác định khoảng thời gian thu thập dữ liệu phù hợp, sẽ phụ thuộc vào việc bạn có thể đưa ra hành động dựa trên những dữ liệu đó hay không. 

Ví dụ: Việc đo lường dữ liệu theo thời gian thực sẽ rất hữu ích cho các nền tảng B2C như Uber vì các giao dịch có chu kỳ ngắn (một chuyến đi Uber thường được yêu cầu, chấp nhận và hoàn thành trong vòng chưa đầy một giờ) và Uber có các “công cụ” để hành động ngay lập tức dựa trên các data thu thập được (giá tăng vào giờ cao điểm, khuyến khích người dùng đặt xe nhờ thêm mã giảm giá, hay thông báo cho tài xế mỗi khi có khách đặt xe).

Ngược lại, với một doanh nghiệp B2B SaaS, các giao dịch thường có chu kỳ giao dịch dài ngày, team kinh doanh có thể sẽ không có các hành động liên tục để tác động đến khách hàng, nên việc thu thập dữ liệu bán hàng hằng ngày sẽ khiến dữ liệu bị nhiễu. 

Tuy nhiên, nếu không thu thập dữ liệu theo ngày, mà sử dụng chỉ số theo tháng, hoặc dài hơn, bạn sẽ có một vấn đề phát sinh là bạn sẽ có rất ít điểm dữ liệu để quan sát, và sẽ phải chờ một thời gian dài để có đủ data. 

Một giải pháp để cân bằng chính là sử dụng phương pháp trung bình cuốn (Rolling Average). 

Trung bình cuốn được tính bằng cách lấy trung bình cộng của một tập hợp các điểm dữ liệu trong một khoảng thời gian nhất định, sau đó dịch chuyển khung thời gian này một khoảng nhất định và tính lại trung bình.

Ví dụ, nếu bạn sử dụng trung bình cuốn 7 ngày, bạn sẽ tính trung bình cộng của dữ liệu từ ngày 1 đến ngày 7, sau đó từ ngày 2 đến ngày 8, từ ngày 3 đến ngày 9, và cứ tiếp tục như vậy.

Đây là một phương pháp tính toán được sử dụng để làm mượt dữ liệu, giúp loại bỏ nhiễu do các biến động ngẫu nhiên, giúp bạn có cái nhìn chính xác hơn về xu hướng thực sự. 

Hãy nhìn vào ví dụ dưới đây: 

Doanh thu thực tế vs goal

Nếu nhìn vào chart bên trái, doanh thu tăng theo từng tháng và đều đạt hoặc vượt goal, có thể kết luận rằng chúng ta có vẻ sẽ tiếp tục đạt được mục tiêu tháng 4, tuy nhiên nếu thu thập dữ liệu theo ngày và sử dụng phương pháp trung bình cuốn (30 ngày) để làm mượt dữ liệu sẽ có thể nhìn thấy doanh thu đang có xu hướng đi xuống, nếu không “đào sâu” và đưa ra giải pháp kịp thời có khả năng cao sẽ không đạt goal tháng 4. 

Thiết lập Benchmarks cho các chỉ số

Việc thiết lập benchmarks rất quan trọng trong quá trình thu thập và khám phá dữ liệu vì nó giúp bạn hiểu rõ hơn và đánh giá được các chỉ số bạn đang theo dõi. Cụ thể, benchmarks cung cấp một tiêu chuẩn để so sánh hiệu suất hiện tại với hiệu suất quá khứ hoặc với các mục tiêu đã đề ra. Điều này giúp bạn biết được các hoạt động hiện tại có đang diễn ra theo kế hoạch hay không. 

Ví dụ: Nếu doanh thu trong 3 tháng gần đây đều thấp hơn so với benchmark, bạn có thể thấy việc giảm doanh thu không chỉ là ngẫu nhiên, bạn có thể cần xem xét lại chiến lược marketing hoặc kiểm tra các yếu tố ảnh hưởng khác.

Ngoài ra benchmarks giúp bạn thiết lập các mục tiêu thực tế và khả thi hơn dựa trên dữ liệu lịch sử trước đó. Nếu bạn biết rằng một chỉ số cụ thể thường dao động trong một phạm vi nhất định, bạn có thể đặt ra các mục tiêu dựa trên phạm vi đó và điều chỉnh chiến lược nếu cần thiết. 

Ví dụ, nếu tỷ lệ giữ chân khách hàng trung bình là 70%, bạn có thể đặt mục tiêu tăng lên 75% và theo dõi tiến độ đạt được mục tiêu này.

Cân nhắc đến yếu tố mùa vụ khi đánh giá dữ liệu

Trong quá trình thu thập và theo dõi dữ liệu, nếu bỏ qua tính mùa vụ, bạn sẽ rất dễ bị dữ liệu đánh lừa và đưa ra những quyết định sai lầm. Hãy cùng xem một ví dụ nhỏ dưới đây: 

doanh thu hàng tháng của một doanh nghiệp SaaS B2B

Đây là dữ liệu doanh thu hàng tháng của một doanh nghiệp SaaS B2B. Nếu chỉ nhìn vào biểu đồ này, có thể thấy doanh thu sau khi đạt đỉnh vào tháng 6 đã bắt đầu tụt giảm liên tiếp xong hai tháng 7 và 8, và có khả năng cao sẽ tiếp tục giảm vào tháng 9, chắc chắn chúng ta sẽ cần “nhanh chóng” đưa ra những điều chỉnh để ngăn việc doanh thu tiếp tục giảm vào các tháng tiếp theo. 

doanh thu hàng tháng của một doanh nghiệp SaaS B2B

Tuy nhiên, nếu so sánh với dữ liệu về doanh thu của công ty đó trong quá khứ, có một xu hướng chung về việc doanh thu thường sẽ giảm trong tháng 7, 8 (những tháng hè) và sẽ phục hồi dần từ tháng 9. 

Nếu biết được tính mùa vụ này, khi doanh thu có xu hướng tụt giảm vào tháng 7, 8, bạn sẽ không còn quá hoảng hốt, bạn sẽ biết rõ nguyên nhân doanh thu giảm là do tính mùa vụ, và biết liệu có cần thực hiện các hành động “khẩn cấp” để khắc phục tình hình, hay chờ cho doanh thu tự phục hồi.  

Tính mùa vụ không chỉ giới hạn ở các tháng trong năm; mà có thể là các ngày trong tuần, hoặc các thời điểm trong tháng. Hãy cùng xem một ví dụ nữa: 

hiệu suất bán hàng của team Sales

Đường màu vàng thể hiện hiệu suất bán hàng của team Sales trong tháng 4, nếu chỉ dựa vào kết quả trong vòng 15 ngày đầu, team sales bán được $26,000, việc team có thể bán thêm gấp đôi trong vòng 6 ngày để đạt mục tiêu $50,000 vào ngày 21 gần như là không thể. Tuy nhiên, nếu nhìn vào dữ liệu ở tháng 2 và tháng 3, có thể thấy team Sales thường chốt được nhiều deal vào cuối tháng, đồng nghĩa với việc tổng doanh thu tháng hoàn toàn có thể tăng gấp đôi và đạt con số $50,000 chỉ trong vòng 6 ngày.  

Có thể thấy tính mùa vụ đóng vai trò quan trọng trong việc diễn giải dữ liệu đã thu thập được, từ đó tránh việc bị dữ liệu đánh lừa, dẫn đến những insight và những quyết định thiếu chính xác. 

Để xác định được liệu dữ liệu có tính mùa vụ hay không, bạn hãy xem xét xem dữ liệu của bạn có xuất hiện các mẫu lặp lại theo thời gian trong ngày, ngày trong tuần, thời gian trong tháng, hoặc tháng trong năm không?

Bạn có thể đọc thêm về tính mùa vụ (Seasonality), tính chu kỳ (Cyclicity) hay tính bất thường (Irregularity) của dữ liệu khi phân tích theo thời gian trong bài viết: Dữ liệu chuỗi thời gian (Time series) là gì? Phân tích dữ liệu chuỗi thời gian như thế nào?

Xử lý dữ liệu chưa thu thập được đầy đủ

Một trong những cạm bẫy phổ biến nhất khi phân tích các chỉ số là xem xét các chỉ số đó khi dữ liệu chưa đạt đến giá trị cuối cùng của chúng.

Ví dụ: Bạn đang đo lường tỷ lệ chuyển đổi từ đăng ký thành khách hàng, ở thời điểm hiện tại con số ở là 50%. Nhưng vì một chu kỳ bán hàng có thể kéo dài trong nhiều tháng, bạn sẽ không thể biết trước được có bao nhiêu người đăng ký trong tháng này chưa được team Sales chốt thành công, có thể trở thành khách hàng ở những tháng sau. Điều này dẫn đến việc tỷ lệ chuyển đổi 50% sẽ còn có thể thay đổi sau khi chúng ta đã đo lường.  

Việc dữ liệu chưa đạt đến giá trị cuối cùng ở thời điểm đo lường, có thể khiến dữ liệu trở nên sai lệch và dễ khiến chúng ta đưa ra những kết luận sai lầm. Thông thường chúng ta sẽ cần đợi đến khi dữ liệu hoàn chỉnh, trở về đúng giá trị thật của nó, sao đó mới đánh giá và đưa ra kết luận. 

Tuy nhiên trong một số trường hợp, như ví dụ ở trên, một chu kỳ bán hàng có thể kéo dài trong nhiều tháng, để tránh việc phải chờ đợi quá lâu có 3 phương pháp mà bạn có thể áp dụng:  

Phương pháp 1: Chia nhỏ chỉ số theo thời gian

Cách đơn giản nhất là chia các chỉ số theo thời gian (ví dụ: tỷ lệ chuyển đổi tuần đầu, tỷ lệ chuyển đổi tuần thứ hai,…). Điều này cho phép bạn không phải chờ đợi dữ liệu đạt đến giá trị cuối cùng, mà vẫn có thể tránh được sự “thiên vị” khi đánh giá dữ liệu. 

Hãy xem ví dụ dưới đây:  

cohort heatmap để theo dõi tỷ lệ chuyển đổi

Trên đây là biểu đồ (cohort heatmap) để theo dõi tỷ lệ chuyển đổi (CVR – Conversion Rate) từ đăng ký (signup) đến hoạt động (active) theo tuần cho từng nhóm người dùng (cohort) khác nhau theo ngày đăng ký.

Nếu chỉ nhìn vào tỷ lệ chuyển đổi Total (cột cuối cùng), chúng ta sẽ không thể biết được tỷ lệ giảm từ khoảng 43% xuống khoảng 30% trong tháng 4 là do giảm thật hay dữ liệu chưa hoàn chỉnh, bởi tỷ lệ chuyển đổi ở Week 2, Week 3, Week 4+ đang trống và vẫn có thể sẽ thay đổi trong tương lai. 

Tuy nhiên nếu đánh giá dựa trên dữ liệu ở Week 1 (dữ liệu lúc này đã hoàn chỉnh và không thể thay đổi) có thể thấy tỷ lệ chuyển đổi của chúng ta đang tệ đi (tỷ lệ chuyển đổi trong tuần đầu tiên giảm từ 22% xuống còn 15% với các nhóm đăng ký gần đây). 

Xem thêm: Cách đọc và hiểu bản chất của từng yếu tố trong một bảng báo cáo Cohort Analysis

Phương pháp 2: Thay đổi định nghĩa chỉ số

Trong một số trường hợp, bạn có thể thay đổi định nghĩa của chỉ số để tránh nhìn vào dữ liệu chưa hoàn chỉnh.

Ví dụ, thay vì nhìn vào có bao nhiêu giao dịch đã vào được đưa lên hệ thống trong tháng Ba và đã hoàn thành cho đến nay, bạn có thể xem có bao nhiêu giao dịch đã hoàn thành trong tháng 3 mà đã được chuyển đổi thành khách hàng thay vì lost (khách hàng hủy đăng ký). Con số này sẽ không thay đổi theo thời gian, trong khi dữ liệu về giao dịch đã vào được đưa lên hệ thống trong tháng Ba và đã hoàn thành sẽ còn có thể tiếp tục cập nhật. 

Phương pháp 3: Dự báo

Dựa trên dữ liệu quá khứ, bạn có thể đưa ra dự báo về giá trị cuối cùng mà mà chỉ số đó có thể đạt được. Càng có nhiều dữ liệu bạn đã thu thập được trong quá khứ, dự báo của bạn sẽ càng sát với giá trị thực.

Ví dụ: CR của team Sales trong 6 tháng đầu năm dao động trong khoảng 45 – 50%, nếu không có gì thay đổi trong chiến lược, hay hoạt động của team, khả năng cao CR trong tháng 6 có thể tiếp tục sẽ giao động trong khoảng từ 45 – 50%. 

Tuy nhiên, dự báo là một công việc rất khó, và có nhiều “biến số bất ngờ” có thể ảnh hưởng đến dự đoán của bạn, vì vậy cần rất cẩn thận khi thực hiện các hoạt động dự báo để tránh sai lầm. 

Nếu bạn quan tâm đến các bài toán dự báo (ứng dụng Machine Learning), có thể tham khảo khóa học Advanced Analytics:

Ứng dụng phương pháp Linear Regression cho bài toán dự báo doanh thu – Nội dung khóa học Advanced Analytics with Python

Vậy là chúng ta đã hoàn thành bước 2 thu thập & khám phá dữ liệu, sau bước này bạn đã có thể hiểu hơn về đặc điểm của tệp dữ liệu, biết cách thu thập dữ liệu, đồng thời thiết lập được các dashboard để theo dõi các chỉ số. 

Bước 3: Tìm insight từ dữ liệu 

Sau bước trên, chúng ta đã thu thập được “một núi” dữ liệu, xây dựng được nhiều dashboard để theo dõi hiệu quả. Câu hỏi tiếp theo đặt ra ở đây là: “Làm thế nào để chuyển các dữ liệu đó thành insight?”

Nếu xem xét và đánh giá tất cả các chỉ số, bạn sẽ rất dễ rơi vào tình trạng “lạc lối” giữa một rừng dữ liệu và không đưa ra được kết luận gì hết. Thay vào đó, hãy tập trung nhìn vào những “điểm nóng” hoặc những điểm mà dữ liệu có sự biến động nhiều nhất. 

Ví dụ: 

  • Team có đang không hoàn thành được mục tiêu nào không? 
  • Có con số nào tăng trưởng hay giảm mạnh bất thường hay không? 
  • Có xu hướng nào đang diễn ra không?

Dưới đây là một số dạng xu hướng của các chỉ số mà bạn sẽ gặp phải và ví dụ cụ thể cho từng loại, hiểu các xu hướng này sẽ giúp bạn biết cách tìm ra “insight” thật sự ẩn đằng sau những con số: 

Net neutral movements (Chuyển động không ròng)

Hiểu một cách đơn giản, đây là các tình huống mà, mặc dù có sự biến động rõ ràng trong dữ liệu, kết quả cuối cùng không thay đổi nhiều, vì sự thay đổi này được bù đắp bởi các yếu tố khác.

Khi bạn thấy một sự thay đổi đáng kể trong một chỉ số, hãy quay ngược trở lại Driver/Issue tree để xem chỉ số đó có thật sự ảnh hưởng đến những chỉ số quan trọng mà bạn đang quan tâm hay không, nếu có thì cần có hành động để giải quyết luôn, còn không chúng ta có thể tạm thời bỏ qua để ưu tiên cho những mục tiêu quan trọng hơn. 

Hãy cùng xem một ví dụ dưới đây:  

tỷ lệ chuyển đổi từ lượt truy cập sang đăng ký

Trong hình trên, nếu chỉ nhìn vào tỷ lệ chuyển đổi từ lượt truy cập sang đăng ký trên trang web của bạn giảm mạnh vào tháng 4. Như bình thường, có thể bạn sẽ hoảng loạn và cho rằng chắc hẳn lượt đăng ký trong tháng 4 sẽ tụt thê thảm. Tuy nhiên, nếu nhìn vào dữ liệu về số người đăng ký (Signups) và lượt truy cập trang (Daily Unique Visitors) có thể thấy tổng số đăng ký vẫn ổn định, tỷ lệ chuyển đổi giảm là do lượt truy cập tăng bất thường, các lượt truy cập này có vẻ không quá chất lượng, dẫn đến việc khó chuyển đổi. Về cơ bản hiệu suất của lượng truy cập “cốt lõi” của bạn không thay đổi. Bạn có thể không cần hành động luôn nếu ưu tiên của bạn chỉ là duy trì số lượng người đăng ký. 

Denominator vs. numerator (Mẫu số vs. tử số)

Khi xử lý các thay đổi trong các chỉ số tỷ lệ (ví dụ: impressions per user, trips per driver,…), trước tiên hãy kiểm tra xem tử số hay mẫu số đã thay đổi.

Chúng ta thường cho rằng sự thay đổi thường đến từ tử số, ví dụ: số lượng khách mỗi nhân viên sales chốt được giảm, thường được cho rằng do Conversion rate thấp của nhân viên đó thấp (do chất lượng tư vấn kém, nhân viên Sales không nhiệt tình,…). Điều này là do tử số thường là những chỉ số hiệu suất (productivity) mà chúng ta muốn tăng trưởng trong ngắn hạn, nên mọi người thường tập trung vào hơn. Tuy nhiên trên thực tế thì không phải lúc nào cũng vậy. 

Số lượng khách mỗi nhân viên sales chốt được giảm có thể là do doanh nghiệp mới tuyển thêm một đội sales mới (số lượng nhân viên sales tăng) trong khi số lượng khách hàng tiềm năng thì không đổi, dẫn đến việc một nhân viên có ít khách hàng hơn để tư vấn. Vì vậy bạn sẽ cần xác định rõ nguyên nhân thay đổi đến từ đâu, để tránh đưa ra những insight và quyết định sai lầm. 

Isolated / Concentrated Trends (Xu hướng tập trung/ Cô lập)

Hiểu đơn giản Isolated / Concentrated Trends là các xu hướng thường chỉ xuất hiện ở một khu vực hoặc một nhóm nhỏ trong tổng thể, và không phản ánh toàn bộ tình hình chung.

Ví dụ: Bạn nhận thấy tổng doanh số bán hàng ở 10 chi nhánh giảm trong tháng vừa rồi, nhưng trên thực tế không phải doanh số của cả 10 chi nhánh đều giảm, mà chỉ giảm ở 1 hoặc 2 chi nhánh, nhưng do doanh thu giảm mạnh nên ảnh hưởng đến tổng thể. 

Với nếu dữ liệu của bạn có xu hướng này, đầu tiên bạn hãy sử dụng Driver/Issue tree kết hợp cùng các dữ liệu đã thu thập được để xác định được đâu là nguyên nhân chính dẫn đến sự tăng hay giảm.  

Sau đó tiếp tục nhìn dữ liệu theo nhiều lát cắt khác nhau như:

  • Địa lý (khu vực, quốc gia, thành phố,…)
  • Thời gian (tuần, tháng,…)
  • Sản phẩm (các sản phẩm khác nhau như Instagram Feed với Reels)
  • Nhân khẩu học của người dùng hoặc khách hàng (độ tuổi, giới tính,…)
  • Thực thể (người dùng, đại lý,…)

Ví dụ: Giả sử bạn làm việc tại DoorDash (ứng dụng giao đồ ăn) và thấy rằng số lượng đơn hàng hoàn tất ở Boston giảm theo tuần. Thay vì nhanh chóng đề ra các ý tưởng để thúc đẩy nhu cầu hoặc tăng tỷ lệ hoàn tất đơn hàng, hãy thử cô lập vấn đề, tìm ra nguyên nhân gốc rễ để có thể phát triển các giải pháp cụ thể hơn.

ứng dụng Issue tree case của DoorDash

Dựa trên Issue tree ở trên, số đơn hàng thành công bị ảnh hưởng bởi 2 yếu tố, yêu cầu giao hàng (Delivery requests) và tỷ lệ đơn hàng hoàn thành (Completion rate), không có vấn đề gì với yêu cầu giao hàng, số đơn hàng giảm do tỷ lệ đơn hàng hoàn thành giảm, cụ thể -5pp WoW. Tiếp tục nhìn sâu hơn, vấn đề cốt lõi là do các đơn hàng không có tài xế hoặc người giao hàng nhận để thực hiện (% order w/o couriers). 

Cuối cùng, chúng ta sẽ kiểm tra xem đây có phải là vấn đề phổ biến hay không. Cách để kiểm tra chính là nhìn dữ liệu theo nhiều lát cắt khác nhau. Nếu nhìn theo các nhà hàng, ta thấy vấn đề này phổ biến và ảnh hưởng đến nhiều nhà hàng khác nhau, do đó việc nhìn theo lát cắt này sẽ không giúp chúng ta thu hẹp phạm vi.  

biểu đồ heatmap theo thời gian và địa lý

Tuy nhiên, nếu tạo một biểu đồ heatmap theo thời gian và địa lý với chỉ số các đơn hàng không tìm được tài xế như trên, ta sẽ thấy phần lớn các đơn hàng không có tài xế đều ở ngoại ô, và thường được giao vào ban đêm. 

Vậy chúng ta có thể làm gì với “insight” này?  

Việc có thể xác định chính xác vấn đề cho phép chúng ta sử dụng tài nguyên một cách hiệu quả hơn. Ví dụ chúng ta có thể tập trung vào việc tuyển dụng thêm tài xế hoặc người giao hàng ở khu vực ngoại ô thay, hay tạo ra những chương trình khuyến khích dành riêng cho các tài xế nhận thêm đơn vào ban đêm thay vì dàn trải nguồn lực tuyển thêm tài xế khắp Boston. 

Mix Shifts (Sự thay đổi hỗn hợp) & Simpson’s Paradox (Nghịch lý Simpson)

Mix shift là sự thay đổi trong thành phần hoặc cấu trúc của các phần tử trong một tổng thể, dẫn đến sự thay đổi trong chỉ số tổng hợp. Điều này thường xảy ra khi các phần khác nhau của tổng thể thay đổi tỷ lệ, gây ra sự thay đổi trong kết quả tổng thể mặc dù các phần tử riêng lẻ có thể không thay đổi.

Simpson’s Paradox (Nghịch lý Simpson) là một hiện tượng thống kê trong đó một xu hướng hoặc mối quan hệ xuất hiện trong một số nhóm dữ liệu nhưng lại đảo ngược hoặc biến mất khi dữ liệu được gộp lại thành một nhóm duy nhất. 

Để hiểu hơn về khái niệm và ứng dụng của 2 xu hướng này, hãy xem một ví dụ sau: 

Giả sử bạn đang theo dõi doanh thu từ quảng cáo cho một nền tảng như YouTube. CPM (cost per mille) là chi phí trung bình trả cho mỗi 1.000 lượt hiển thị quảng cáo. Bạn nhận thấy rằng doanh thu tổng thể đang giảm và khi tìm hiểu sâu hơn, bạn thấy rằng CPM cũng đang giảm.

CPM của từng khu vực địa lý

Tuy nhiên, khi bạn phân tích kỹ hơn, bạn nhận thấy rằng CPM của từng khu vực địa lý riêng lẻ (như US, CAN, EMEA, APAC) không thay đổi. Điều này có nghĩa là CPM tổng giảm không phải do CPM của từng khu vực bị giảm. 

Vậy nguyên nhân CPM giảm là do đâu? 

Đây là nơi sự Mix shift và Simpson’s Paradox xuất hiện: 

tỷ lệ của lượt hiển thị theo khu vực

Cụ thể, CPM của từng khu vực địa lý riêng lẻ không thay đổi, nhưng nếu bạn nhìn vào tỷ lệ của lượt hiển thị theo khu vực, bạn thấy rằng các lượt hiển thị đang dần đang chuyển từ US sang APAC. Và vì APAC có CPM thấp hơn Mỹ, nên CPM tổng cũng giảm theo.

Vậy chúng ta có thể làm gì với “insight” này?  

Sau khi biết được nguyên nhân gốc rễ này, bạn sẽ có thể có được những chiến lược cụ thể hơn để tăng CPM. Có thể là kích thích tăng trưởng ở các khu vực CPM cao, suy nghĩ về các tùy chọn kiếm tiền bổ sung cho khu vực APAC, hoặc tập trung vào việc bù đắp cho CPM thấp thông qua tăng trưởng số lượt hiển thị (Impression) ở khu vực APAC.

Kết luận 

Vậy là TM đã vừa cùng bạn đi qua 3 bước biến dữ liệu thành “Actionable Insight” được đúc kết từ kinh nghiệm làm Data tại Meta, Uber, Rippling của tác giả Torsten Walbaum. Hãy nhớ rằng, dữ liệu chỉ có giá trị khi bạn sử dụng chúng để tìm ra các insights, đưa ra được những đề xuất hữu ích cho doanh nghiệp. 

Nếu bạn mong muốn trang bị tư duy làm việc với dữ liệu (Data Mindset) bài bản, cải thiện kỹ năng “đọc số tìm insight” qua các case study thực tế với dữ liệu Sales, Customers, Marketing,… nhằm hỗ trợ cho việc ra quyết định, hãy tham khảo thêm khóa học Data Analysis – Phân tích dữ liệu cho quyết định chiến lược!

khóa học Data Analysis - Phân tích dữ liệu cho quyết định chiến lược

Còn nếu bạn muốn tìm hiểu thêm về tư duy trực quan hóa dữ liệu (Data Visualization Mindset) và nâng cao kỹ năng xây dựng báo cáo trên Excel, hãy tham khảo khóa học Data Visualization & Analytics with Excel của TM Data School nhé!

khóa học Data Visualization & Analytics with Excel
Tagged: