Tomorrow Marketers – The Gartner Analytic Ascendancy Model là mô hình được phát triển bởi Gartner, giúp doanh nghiệp khai thác tối đa “mức độ trưởng thành của dữ liệu”. Mô hình này chia quá trình phân tích thành 4 giai đoạn: descriptive analytics (phân tích mô tả), diagnostic analytics (phân tích chẩn đoán), predictive analytics (phân tích dự đoán), và prescriptive analytics (phân tích đề xuất). Trong đó, các giai đoạn sau được coi là “trưởng thành” hơn với mức độ phức tạp tăng dần, tương ứng với mức độ hữu ích trong quá trình đưa ra quyết định.
Những giai đoạn phân tích này có gì khác biệt? Cùng tìm hiểu trong bài viết sau nhé!
1. Descriptive Analytics (Phân tích mô tả)
Phân tích mô tả trả lời cho câu hỏi “Điều gì đã diễn ra?”. Loại hình phân tích này sử dụng phương pháp thống kê để mô tả dữ liệu quá khứ, từ đó giúp doanh nghiệp khám phá xu hướng, phát hiện sự bất thường và hiểu những gì đã diễn ra.
Đây là giai đoạn đầu tiên của phân tích và có độ phức tạp thấp nhất, phần lớn doanh nghiệp SMEs hiện nay mới chỉ dừng lại ở giai đoạn phân tích này. Mặc dù phương pháp này có nhiều giá trị trong việc cho thấy các dấu hiệu và xu hướng diễn ra trong quá khứ, nhưng doanh nghiệp không rút ra được giải pháp xử lý vấn đề, hoặc tìm ra được vấn đề cốt lõi, do đó, cần có giai đoạn phân tích chẩn đoán (Diagnostic analysis) tiếp theo.
Các câu hỏi mà Descriptive Analysis có thể trả lời:
- Bộ phận Sales: Phân khúc khách hàng nào tạo ra doanh thu cao nhất trong năm qua?
- Bộ phận Marketing: Kênh social media nào có ROAS cao nhất trong quý trước?
- Bộ phận Tài chính: Doanh thu hàng tháng và hàng năm thay đổi như thế nào trong năm qua?
- Bộ phận Vận hành: Nhu cầu sử dụng các dòng sản phẩm/ SKU khác nhau trên từng khu vực địa lý trong năm qua?
Phân tích mô tả sử dụng các phương pháp cơ bản như:
Descriptive Statistics (Thống kê mô tả)
Thống kê mô tả sử dụng các tham số thống kê quan trọng để tóm tắt đặc điểm của một tệp dữ liệu, ví dụ như:
- Min: giá trị nhỏ nhất,
- Max: giá trị lớn nhất,
- Mean: giá trị trung bình,
- Median: giá trị trung vị
- Mode: giá trị xuất hiện nhiều nhất trong tệp dữ liệu
- Standard Deviation: Độ lệch chuẩn …
Bảng dưới đây minh họa các tham số này cho tổng số tiền mà khách hàng chi tiêu trong một cửa hàng trực tuyến. Như chúng ta có thể thấy, trung bình mỗi khách hàng đã chi 51 USD, nhưng con số chi tiêu của mỗi người có thể dao động từ 12 tới 500 USD.
Minimum | Maximum | Mean | Standard deviation | |
Total amount (USD) | 12 | 500 | 51 | 56 |
Distribution (Phân phối)
Mức độ phân phối thể hiện tần suất xuất hiện của các giá trị trong một dataset. Biểu đồ tần suất histogram sẽ cho thấy sự phân phối của các biến liên tục.
Ví dụ: biểu đồ dưới đây mô tả phân phối độ tuổi của khách hàng một doanh nghiệp, với trục hoành là các khoảng tuổi của khách hàng, trục tung là tần suất độ tuổi đó xuất hiện trong dataset. Dựa vào biểu đồ này, khách hàng của doanh nghiệp này có độ tuổi trải dài từ 22 – 70 tuổi, tuy nhiên khách hàng ở độ tuổi từ 30 đến 40 chiếm tỷ lệ nhiều nhất.
2. Diagnostic Analytics (Phân tích chẩn đoán)
Khác với phân tích mô tả tập trung vào “điều gì xảy ra”, phân tích chẩn đoán sẽ tập trung vào câu hỏi “nguyên nhân nào dẫn đến kết quả đó?”. Phân tích chẩn đoán sẽ tìm ra nguyên do gốc rễ của một vấn đề, của một thay đổi bất thường hoặc xu hướng biến động trong dữ liệu.
Các câu hỏi mà Diagnostic Analytics có thể trả lời:
- Bộ phận Sales: Xác định đặc điểm và hành vi chung giữa các phân khúc khách hàng sinh lời để giải thích tại sao họ chi tiêu nhiều hơn.
- Bộ phận Marketing: Các mẫu nội dung quảng cáo hiệu quả cao có đặc điểm gì chung?
- Bộ phận Vận hành: Tìm ra mối quan hệ giữa thời tiết trong khu vực với nhu cầu sử dụng của từng SKU cụ thể.
Phân tích chẩn đoán sử dụng các phương pháp cơ bản như:
Drilling down – Điều hướng việc phân tích, chuyển từ chế độ xem tổng quan sang chế độ tập trung vào một dữ liệu chi tiết để tìm ra pattern của dữ liệu. Ví dụ, với PowerBI, bạn có thể ấn vào một khu vực cụ thể trong map chart để làm nổi bật dữ liệu của khu vực đó đó, hoặc chuyển từ dữ liệu theo tháng hoặc quý thành dữ liệu theo ngày,…
Root cause analysis
Đọc thêm:
- 5 bước áp dụng mô hình Issue Tree của McKinsey trong Problem-solving
- Case study sử dụng Issue Tree để xác định nguyên nhân vấn đề cốt lõi
Finding Correlations – so sánh để tìm ra mối tương quan giữa các biến và xác định mối quan hệ nhân quả.
Scatter charts
Biểu đồ phân tán (Scatter charts) có thể giúp khám phá sự phụ thuộc giữa các biến đầu ra và đầu vào.
Biểu đồ dưới đây cho thấy khi giá trị của Feature 1 tăng lên thì giá trị của Target giảm xuống.
Correlations
Phân tích mối tương quan giữa các biến đầu vào và đầu ra. Giá trị nằm giữa 0 và 1 thể hiện mức độ tương quan mạnh yếu giữa hai biến số.
Với biểu đồ dưới đây, hệ số tương quan tối đa thu được là -0,287 giữa hai biến số khoảng thời gian mua hàng gần đây nhất (recency) và số lần chuyển đổi (conversion). Hệ số tương quan lớn cho thấy chúng ta phải nghiên cứu biến số này kỹ lưỡng.
3. Predictive Analytics (Phân tích dự báo)
Khi doanh nghiệp có khả năng phân tích dữ liệu nâng cao, mục tiêu của khai thác dữ liệu sẽ chuyển từ việc đánh giá hoạt động trong quá khứ sang tìm ra hành động nên làm trong hiện tại và dự đoán cho tương lai.
Phân tích dự báo sẽ kết hợp mô hình phân tích dự đoán, toán xác suất thống kê và công nghệ máy học để đưa ra dự đoán về các xu hướng hoặc sự kiện trong tương lai nhằm trả lời câu hỏi “Điều gì sẽ xảy ra?”. Phân tích dự báo còn giúp doanh nghiệp dự đoán và đánh giá kết quả của các quyết định khác nhau.
Lưu ý rằng, dự báo chỉ là một ước tính, và những ước tính đó có thể xảy ra, nhưng không chắc chắn. Độ chính xác của nó dựa trên số lượng cũng như chất lượng dữ liệu bạn có.
Thách thức với phân tích dự báo chính là cần có dữ liệu đầu vào lớn để đưa ra kết luận dự báo chính xác. Vì vậy, nếu doanh nghiệp chỉ có ít dữ liệu hoặc dữ liệu không đầy đủ thì sẽ không thể có được dự đoán hữu ích.
Các câu hỏi mà Predictive Analytics có thể trả lời:
- Bộ phận Sales: Dự đoán doanh thu tiềm năng của một phân khúc khách hàng cụ thể.
- Bộ phận Marketing: Dự đoán doanh thu từ một marketing campaign sắp tới.
- Bộ phận Tài chính: Dự báo chính xác hơn cho năm tài chính tiếp theo.
- Bộ phận Vận hành: Dự đoán tốt hơn nhu cầu đối với các sản phẩm khác nhau ở các khu vực khác nhau tại các thời điểm cụ thể trong năm tới.
Phân tích dự đoán sử dụng các phương pháp cơ bản như:
Phân tích dự đoán liên quan đến các kỹ thuật như phân tích hồi quy (regression analysis), dự báo (forecasting), thống kê đa biến (multivariate statistics), đối sánh mẫu (pattern matching), mô hình dự đoán (predictive modeling), k-nearest neighbors, cây quyết định (decision trees),…
K – Nearest neighbors
Đây là phương pháp đơn giản thường được sử dụng trong phân loại và phép tính xấp xỉ. Phương pháp này lưu trữ tất cả các trường hợp có sẵn và phân loại các trường hợp mới dựa trên thước đo độ tương tự.
Biểu đồ dưới đây cho thấy thuật toán phân loại nhiều điểm dữ liệu thành A (vòng tròn màu xanh) và B (hình vuông màu cam). Một điểm dữ liệu mới được giới thiệu (hình tam giác màu xanh lá cây). Phương pháp này sẽ quyết định điểm dữ liệu mới đó thuộc loại A hay B dựa trên sự tương đồng giữa chúng.
Cây quyết định (Decision trees)
Tương tự, đây cũng là một phương pháp đơn giản thường được sử dụng trong phân loại và phép tính xấp xỉ. Cây quyết định là một mô hình toán học giúp so sánh, lựa chọn giữa các hướng hành động. Nó ước tính xác suất để tính toán các kết quả có thể xảy ra.
Trong sơ đồ cây quyết định dưới đây, Feature 1, Feature 2 và Feature 3 là ba tính năng số của bộ dữ liệu; A, B và C là ba loại “lá” cần phân loại; và a, b, c và d là các giá trị số.
Để phân tích theo phương pháp này, bạn cần kiểm tra giá trị của Feature 1. Nếu lớn hơn a, đối tượng sẽ được phân loại vào loại B; nếu bằng hoặc nhỏ hơn a, tiếp tục kiểm tra giá trị Feature 2. Lần theo quy trình này cho đến khi phân loại thành công loại “lá” (A, B hoặc C).
Để áp dụng những kỹ thuật này, chú ý rằng:
- Đảm bảo rằng tất cả các biến liên quan ảnh hưởng đến kết quả đều được xem xét trong quá trình dự đoán.
- Thử nghiệm việc xây dựng mô hình bằng nhiều thuật toán và xem thuật toán nào phù hợp nhất dựa trên độ chính xác và thời gian phản hồi.
- Quyết định mức độ chính xác của các phân tích dự đoán của bạn.
- Lập kế hoạch cho sự gián đoạn, tiếp tục tinh chỉnh các mô hình phân tích dự đoán của bạn.
- Kiểm tra, kiểm tra lại và kiểm tra định kỳ độ chính xác của mô hình với các bộ dữ liệu mới.
4. Prescriptive Analytics (Phân tích đề xuất)
Phân tích đề xuất là giai đoạn cuối cùng của mô hình phân tích dữ liệu, xác định hành động nào cần thực hiện để giải quyết một vấn đề hoặc đưa ra một quyết định, trả lời câu hỏi, “Chúng ta nên làm gì tiếp theo?”.
Phân tích đề xuất sẽ tính đến tất cả các giả định “what-if”, các yếu tố có thể xảy ra trong một tình huống và đề xuất các biện pháp có thể thực hiện được. Loại phân tích này có thể đặc biệt hữu ích khi đưa ra quyết định dựa trên dữ liệu.
Các câu hỏi mà Prescriptive Analytics có thể trả lời:
- Bộ phận Sales: Cải thiện quy trình bán hàng cho từng ngành hàng.
- Bộ phận Marketing: Xác định cần quảng cáo sản phẩm nào trong quý tới.
- Bộ phận Tài chính: Tối ưu hóa quản lý rủi ro.
- Bộ phận Vận hành: Xác định cách tối ưu hóa kho bãi.
Phân tích dự đoán sử dụng các phương pháp cơ bản như:
Mô hình dự đoán (predictive model)
Ví dụ, hai trường hợp dưới đây nhằm kiểm tra biến mục tiêu (Value) sẽ thay đổi như nào khi biến đầu vào duy nhất (Feature 3) thay đổi. Bảng giá trị tương ứng sẽ thể hiện thay đổi tương ứng của trường hợp 1, trong khi biểu đồ dưới sẽ thể hiện thay đổi tương ứng của trường hợp 2.
Khi so sánh, có thể thấy Feature 3 là 1010, Target đạt giá trị tối đa 484,93.
5. Ví dụ khái quát
Descriptive analytics (phân tích mô tả): Một doanh nghiệp đang phân tích dữ liệu bán hàng và nhận thấy doanh số của sản phẩm bảng điều khiển trò chơi điện tử tăng đột biến theo mùa. Phân tích mô tả có thể cho doanh nghiệp đó biết, “Bảng điều khiển trò chơi điện tử này có doanh số bán hàng tăng vọt vào tháng 10, tháng 11 và đầu tháng 12 hàng năm.”
Diagnostic analytics (phân tích chẩn đoán): Dữ liệu nhân khẩu học của người dùng bảng điều khiển trò chơi điện tử và thấy rằng họ ở độ tuổi từ 8 đến 18. Tuy nhiên, khách hàng có xu hướng ở độ tuổi từ 35 đến 55. Dữ liệu tiết lộ rằng động lực chính để khách hàng mua bảng điều khiển trò chơi điện tử là làm quà tặng cho con. Doanh số bán hàng tăng đột biến vào các tháng mùa thu và đầu mùa đông có thể do các ngày lễ bao gồm tặng quà.
Predictive analytics (phân tích dự đoán): Biết rằng doanh số bán máy chơi game video tăng đột biến vào tháng 10, tháng 11 và đầu tháng 12 hàng năm trong thập kỷ qua sẽ cung cấp cho bạn nhiều dữ liệu để dự đoán rằng xu hướng tương tự sẽ xảy ra vào năm tới, đặc biệt khi toàn bộ ngành công nghiệp trò chơi cũng có xu hướng tăng trưởng tích cực.
Prescriptive analytics (phân tích đề xuất): Doanh nghiệp có thể chạy thử nghiệm A/B với hai quảng cáo: một dành cho người dùng của sản phẩm (trẻ em) và một dành cho khách hàng (phụ huynh). Dữ liệu từ thử nghiệm đó sẽ cho biết cách tận dụng mức tăng đột biến theo mùa. Hoặc, doanh nghiệp có thể đưa ra các chiến dịch Marketing vào tháng 9 với chủ đề ngày lễ để kéo dài đà tăng tới các tháng sau đó.
Tạm kết
Bốn giai đoạn phân tích dữ liệu cần được áp dụng đồng thời để tạo ra bức tranh đầy đủ về câu chuyện mà dữ liệu kể và đưa ra quyết định sáng suốt. Tùy thuộc vào vấn đề bạn đang cố gắng giải quyết và mục tiêu của mình, bạn có thể chọn sử dụng hai hoặc ba trong số các loại phân tích này—hoặc sử dụng tất cả chúng theo thứ tự tuần tự để hiểu sâu nhất về câu chuyện mà dữ liệu kể.
Dữ liệu không có nhiều ý nghĩa nếu nó không được phân tích và diễn giải. Nếu bạn mong muốn trang bị thêm các kỹ năng phân tích dữ liệu, tham gia ngay khóa học Data Analysis của Tomorrow Marketers nhé!