Data Visualization – Cách chọn loại biểu đồ minh hoạ tốt nhất cho metrics của bạn?

data visualization
marketing foundation

Tomorrow MarketersTrực quan hóa dữ liệu (Data Visualization) là minh hoạ dữ liệu thành các biểu đồ, đồ thị hoặc định dạng trực quan khác. Nó giúp người xem nhanh chóng nhận ra các xu hướng, thay đổi bất thường, thay vì nhìn vào hàng tá dữ liệu khô khan. Từ đó, họ có thể kịp thời đưa ra các quyết định cần thiết.

Trong thực tế, việc lựa chọn biểu đồ giúp người xem nhanh chóng tìm ra Insight không hề dễ dàng. Bởi, mỗi loại biểu đồ sẽ có mục đích sử dụng khác nhau trong việc truyền đạt câu chuyện của dữ liệu (Data Story-telling) tới người đọc. Trong một vài trường hợp, dữ liệu sẽ không cần được trực quan bằng các biểu đồ phức tạp, mà chỉ cần thể hiện dưới dạng bảng biểu là đủ. Vì vậy, nếu hiểu rõ chức năng của từng loại biểu đồ để sử dụng phù hợp, việc trực quan hóa dữ liệu sẽ mang lại nhiều giá trị nhất cho người đọc. Trong bài viết này, Tomorrow Marketers sẽ cùng bạn tìm hiểu về chức năng và cách sử dụng của các loại biểu đồ được sử dụng rộng rãi khi trực quan hóa dữ liệu.

Cách lựa chọn biểu đồ, đồ thị phù hợp khi trực quan hóa dữ liệu

Hình ảnh minh họa bên trên là một “Decision Tree – Cây quyết định”, nó thể hiện một cách tổng quan về mục đích sửa dụng của một số loại biểu đồ tiêu biểu. Nhìn chung, sơ đồ trên đưa ra hướng dẫn để lựa chọn biểu đồ theo 2 mục đích chính:

  • Thể hiện mối quan hệ của 2 hay nhiều dữ liệu với nhau.
  • Thể hiện một loại giá trị dữ liệu cụ thể.

Các ví dụ minh họa và giải thích bên dưới sẽ đưa ra góc nhìn cụ thể hơn về mục đích sử dụng của những biểu đồ được trình bày bên trên.

Single Value – Biểu đồ thể hiện một giá trị dữ liệu cụ thể

1. Single Value Chart

Single Value Chart thường được sử dụng để giúp người đọc nhanh chóng nắm bắt được thông tin của một dữ liệu cụ thể. Ở hình minh họa phía trên, Single Value Chart sử dụng để tạo sự nổi bật và thu hút sự chú ý đối với Operation Cost (chi phí vận hành) – một chỉ số khá quan trọng mà hầu hết các quản lý cấp cao cần nắm rõ.

2. Single Value Indicator Chart

Khác với Single Value Chart, ngoài việc làm cho người đọc nhanh chóng chú ý đến metric quan trọng đang được trình bày, loại biểu đồ này còn gắn thêm một Indicator (Chỉ báo) bên cạnh để cho thấy sự thay đổi của dữ liệu.

3. Bullet Chart

Bullet Chart cũng thường được sử dụng để biểu diễn metric quan trọng. Điểm đặc biệt của loại biểu đồ này là nó đồng thời phản ánh hiện trạng của metric so với mục tiêu.

Multiple Values – Biểu đồ thể hiện sự tương quan của nhiều giá trị dữ liệu

Thông thường, có 4 nhóm biểu đồ được sử dụng để thể hiện mối liên hệ của nhiều giá trị dữ liệu khác nhau:

  • Relationship: được sử dụng để thể hiện mối liên hệ giữa các dữ liệu riêng biệt.
  • Comparison: được sử dụng để so sánh hai hoặc nhiều loại dữ liệu với nhau.
  • Composition: được sử dụng để làm nổi bật tỷ trọng thành phần của nhiều dữ liệu so với tổng thể mà chúng tạo nên.
  • Distribution: được sử dụng để giúp người đọc dễ dàng hình dung được sự phân bổ của dữ liệu trên trên một phạm vi.

Relationship – Thể hiện mối liên hệ giữa các dữ liệu riêng biệt

1. Scatter Plot (Biểu đồ tán xạ)

Scatter Plot ( Biểu đồ tán xạ) thường được sử dụng để trực quan hóa mối quan hệ giữa 2 biến số định lượng (Quantitative Variables). Mối quan hệ giữa 2 biến số ấy sẽ được biểu diễn dưới các dạng chấm tròn trên đồ thị, với một biến đại diện cho trục tung và một biến đại trên cho trực hoành. Mỗi chấm tròn trên đồ thị có nghĩa là khi x = này thì giá trị của y tương ứng với điểm dữ liệu đó trên trục y.

2. Bubble Plot (Biểu đồ bong bóng)

Tương tự như Scatter Plot, các điểm tròn cũng thể hiện mối quan hệ giữa 2 biến số được biểu diễn ở trục tung và trục hoành. Ngoài ra, kích thước của các điểm tròn ấy cũng đại diện cho một loại dữ liệu khác. Vậy, có thể hiểu là, Bubble Plot (Biểu đồ bong bóng) thường được sử dụng để trực quan hóa mối quan hệ giữa 3 biến số định lượng.

Comparison – So sánh hai hoặc nhiều loại dữ liệu với nhau

1. Bar Chart (Biểu đồ cột)

Sử dụng Bar charts sẽ là lựa chọn phù hợp khi cần so sánh sự chênh lệch của các dữ liệu khác nhau trong cùng một mốc thời gian cố định.

2. Line Chart (Biểu đồ đường)

Khi muốn thể hiện xu hướng, biến động, và diễn biến liên tục của một hoặc nhiều dữ liệu trong 1 khoảng thời gian, Line chart sẽ là lựa chọn phù hợp trong trường hợp này.

Composition – Sử dụng để làm nổi bật tỷ trọng thành phần của từng dữ liệu so với tổng thể mà chúng tạo nên

1. Area Chart (Biểu đồ khu vực)

Về cơ bản, có thể hiểu Area chart (Biểu đồ khu vực) là một dạng của biểu đồ đường, nhưng từ phần bên dưới của đường đến trục hoành sẽ được tô màu. Việc tô màu sẽ giúp cho người đọc dễ dàng hình dung được sự đóng góp của từng thành phần dữ liệu so với tổng thể. Vậy nên, có thể hiểu rằng, Area Chart được sử dụng để cho thấy mối quan hệ của các phần với tổng thể qua một khoảng thời gian.

2. Pie Chart

Pie Chart (Biểu đồ tròn) thường được sử dụng để thể hiện tỷ trọng của các dữ liệu thành phần so với tổng thể. Các thành phần trong biểu đồ tròn sẽ được biểu thị dưới dạng tỷ lệ phần trăm, và tổng của tất cả thành phần dữ liệu sẽ là 100%.

Distribution – Sử dụng để giúp người đọc dễ dàng hình dung sự phân bổ của dữ liệu trên trên một phạm vi

1. Map

Map (Bản đồ) thường được sử dụng để cho thấy sự phân bổ của dữ liệu trong từng khu vực địa lý-chính trị khác nhau một cách tổng quan. Như ví dụ trên, người xem biểu đồ có thể nhanh chóng nhận ra ở khu vực nào đang có số lượng Users nhiều nhất, và ngược lại.

2. Bubble Map

Bubble Map (bản đồ bong bóng) sẽ đặc biệt hữu ích khi sử dụng để làm nổi bật độ phủ của dữ liệu tại các khu vực địa lý cụ thể.

3. Funnel Chart

Funnel Chart (Biểu đồ hình phễu) có lẽ là loại biểu đồ khá quen thuộc đối với những người đang làm hoặc theo học ngành Marketing. Biểu đồ này thường được sử dụng để biểu thị sự phân bổ của một loại dữ liệu trong từng giai đoạn của phễu, còn toàn bộ giai đoạn của phễu thể hiện một quy trình.

Áp dụng vào Case thực tế như thế nào?

Cùng tìm hiểu ví dụ bên dưới để hiểu rõ việc áp dụng các kiến thức bên trên vào một yêu cầu trực quan hóa cụ thể.

Giả sử, bạn được yêu cầu làm 1 Dashboard bao gồm các loại metrics và chỉ định về cách trình bày như sau:

* Chú thích bảng yêu cầu trên: 

  • Metric: Các chỉ số cần được biểu diễn trong Dashboard.
  • Aggregation: Cách thức tính toán Metric tương ứng.
  • Grouping: Cách mà người đọc Dashboard muốn nhóm dữ liệu.
  • Filtering: Cách mà người đọc Dashboard muốn filter Data.

Áp dụng những kiến thức ở trên, ta có thể thực hiện trực quan hóa các dữ liệu được yêu cầu như sau:

1. Operations Cost (Chi phí vận hành)

Để thể hiện Operations Cost, chúng ta được yêu cầu biểu diễn theo 3 dạng: Total (Tổng), Department (Phòng ban), và Month (Tháng). Để nhanh chóng thu hút sự chú ý của người đọc với tổng quan Operations Cost, ta có thể biểu diễn Total Operations Cost dưới dạng Single Value. 

Tiếp theo, để người đọc có góc nhìn tương quan về dữ liệu Operation Costs của từng Phòng ban theo từng Tháng, ta có thể sử dụng Line Chart (Biểu đồ đường).

* Lưu ý: Với doanh nghiệp có nhiều phòng ban (5-7), việc biểu diễn chi phí của tất cả các phòng ban lên biểu đồ có thể làm rối mắt người xem. Vậy nên, hãy cố gắng giảm bớt số lượng đường hiển thị trong biểu đồ bằng cách nhóm các đường có giá trị nhỏ và không quá quan trọng thành một đường biểu diễn chung (Other).

2. Revenue (Doanh thu)

Giống như Operations Cost, Revenue trong trường hợp này cũng nên được biểu thị dưới dạng Single Value để nhanh chóng thu hút được sự chú ý của người xem Dashboard.

3. Subscriptions (Lượng đăng ký)

Tương tự, Subcription trong trường hợp này cũng nên được biểu thị dưới dạng Single Value. Nhưng, bạn cũng có thể thêm một biểu đồ đường ở bên cạnh để thể hiện được sự thay đổi của nó từ quá khứ đến thời điểm hiện tại.

Đọc thêm: Người đọc biểu đồ trên Dashboard có xu hướng theo dõi thông tin như thế nào?

Sau khi thực hiện nghiên cứu hơn 100,000 dashboards tại Chartio (một công cụ Business Intelligence), những người thực hiện nghiên cứu phát hiện ra rằng, hầu hết lượng lớn biểu đồ được tạo ra là Table (bảng biểu), Single value (Thể hiện một giá trị cụ thể),… Đây đều là những dạng trực quan không hỗ trợ người xem quá nhiều trong việc nhìn nhận xu hướng và thay đổi bất thường trong vận hành.

Tuy nhiên, phần sau của nghiên cứu lại chỉ ra rằng, Bar-line chart (Biểu đồ cột đường), Bubble chart (biểu đồ bong bóng), Bullet chart, Single value, và Bar chart (biểu đồ cột) lại là những loại biểu đồ có lượng xem trung bình nhiều nhất khi người xem tiếp cận với Dashboards.

Hi vọng rằng, từ nghiên cứu trên, bạn sẽ có thêm góc nhìn về thiên hướng xem biểu đồ của người dùng để giúp bạn lựa chọn những biểu đồ thân thiện hơn với họ trong quá trình trực quan hóa dữ liệu.

Để tóm tắt lại nội dung chính của bài viết, có 2 ý chính bạn nên ghi nhớ để chọn biểu đồ phù hợp, giúp người đọc biểu đồ dễ dàng hơn trong việc tìm kiếm các Insights.

  • Khi quyết định sử dụng một biểu đồ nào đó, hãy xem xét kĩ về loại dữ liệu mà bạn có và điều bạn muốn thể hiện cho người đọc biểu đồ.
  • Khi muốn thể hiện nhiều giá trị dữ liệu trong cùng một biểu đồ, hãy quyết định xem bạn muốn thể hiện mối quan hệ gì giữa chúng: Relationship, Comparison, Composition, hay Distribution. Điều này sẽ giúp bạn lựa chọn được biểu đồ phù hợp hơn.

Trực quan hóa dữ liệu (data visualization) hiệu quả là bước quan trọng của để người đọc Dashboard có thể tìm kiếm và khai thác các insight quý giá từ dữ liệu. Qua đó, họ có thể đưa ra những quyết định mang tính ảnh hưởng tích cực cho doanh nghiệp. Để các quyết định kinh doanh luôn được bổ trợ bởi các Insight đắt giá ẩn trong dữ liệu, doanh nghiệp sẽ cần xây dựng một hệ thống dữ liệu để từ đó tạo ra các Dashboard luôn được cập nhật liên tục. Hệ thống này xuất phát từ:

  • Số hoá quy trình làm việc và lưu trữ dữ liệu của mình trong các Data Collectors (các phần mềm/app).
  • Đưa những dữ liệu đó về một nguồn duy nhất để dữ liệu được thống nhất, toàn vẹn, bảo mật, và không bị tác động bởi sai sót từ con người.
  • Khai thác các dữ liệu đó và xử lý chúng để thiết kế ra những Dashboards có ý nghĩa với từng bộ phận.

Đó cũng chính là tư duy mà khoá học Data System của Tomorrow Marketers muốn truyền tải, để giúp các doanh nghiệp xây dựng văn hoá dữ liệu và khai phá những tiềm năng tăng trưởng ngay từ dữ liệu nội bộ. Khoá học Data System sẽ giúp bạn hiểu rõ:

  • Tầm quan trọng của hệ thống dữ liệu nội bộ đối với sự tăng trưởng dài hạn của doanh nghiệp.
  • Cấu trúc của hệ thống dữ liệu nội bộ: Hiểu rõ các thành phần của một hệ thống dữ liệu hoàn chỉnh.
  • Tư duy xây dựng quy trình và số hoá quy trình kinh doanh nhằm thu thập được dữ liệu qua thời gian
  • Tư duy xây dựng đường ống dữ liệu và nhà kho dữ liệu, giúp doanh nghiệp chuẩn hoá dữ liệu từ sớm.
  • Tư duy khai thác dữ liệu để xây dựng báo cáo quản trị, cung cấp bức tranh toàn cảnh của kinh doanh và giám sát hoạt động.

Hãy để dữ liệu trở thành lợi thế cạnh tranh của doanh nghiệp bạn. Tìm hiểu thêm về thông tin khóa học tại đây!

Bài viết bởi dataschool và được biên dịch bởi Tomorrow Marketer, xin vui lòng không sao chép dưới mọi hình thức!