Tomorrow Marketers – Google Analytics là công cụ phổ biến của Google giúp các digital marketer trong việc phân tích hiệu quả của trang web. Điểm mạnh của GA là miễn phí, thân thiện và nhiều khả năng xử lý dữ liệu như theo dõi theo phễu chuyển đổi, phân khúc người dùng và có thể kết nối với các công cụ khác cùng hệ sinh thái. Nhờ những ưu điểm này, việc phân tích và khám phá dữ liệu mà GA thu thập được sẽ đem lại nhiều góc nhìn và insight đáng giá.
Bạn có thể tích hợp dữ liệu Google Analytics với các nguồn dữ liệu khác để hiểu sâu và chi tiết hơn về hành vi người dùng, ví dụ như: Kết hợp GA với CRM, các social platform (Facebook, Linkedin,…) hoặc các công cụ Analytics khác (Branch.io, Klipfolio, Appsflyer,…).
Đọc thêm: Sử dụng Google Analytics thế nào để theo dõi sức khỏe website?
Dù vậy, vẫn có một số hạn chế khi sử dụng dữ liệu từ công cụ này:
- Giới hạn về cấp độ chi tiết của dữ liệu – Dữ liệu của từng dimension và metric sẽ có mức độ sâu và chi tiết khác nhau: user-level, session-level, và hit-level. Dữ liệu trong báo cáo của Google Analytics đã được tổng hợp và thực hiện các phép tính toán theo cấp session thay vì cấp hit. Ví dụ, dữ liệu trong báo cáo được hiển thị dưới dạng một user có tất cả bao nhiêu lần truy cập trang sản phẩm trong một session, thay vì mỗi một click truy cập được hiển thị một record khác nhau.
Việc có thể export dữ liệu chi tiết ở mức độ từng truy cập/click riêng (hit level) sẽ giúp giữ được tính chi tiết của dữ liệu và đảm bảo linh hoạt trong tính toán, tổng hợp dữ liệu theo các tiêu chí và dimension mong muốn. Ví dụ, bạn có thể phân nhóm dữ liệu theo source/medium, browser hoặc thiết bị,… để theo dõi hành trình của từng người dùng.
Đồng thời, nếu chỉ đánh giá riêng biệt dữ liệu về event và các action truy cập của người dùng sẽ không có đủ ngữ cảnh để bạn đưa ra các quyết định mà cần bổ sung thêm dữ liệu về source, medium, campaign, thiết bị người dùng sử dụng hoặc thông tin về vị trí, chi phí quảng cáo,… Cách tiếp cận theo hit sẽ giúp làm tăng độ sâu và chính xác của từng bản ghi, hạn chế các giới hạn của dữ liệu đã được xử lý và tổng hợp theo cấp session — chẳng hạn như dựa vào action người dùng bấm chọn thanh toán thành công, hệ thống sẽ tự động gửi email xác nhận giao dịch một cách kịp thời.
- Dữ liệu bị phân mẫu – Nếu sử dụng phiên bản Google Analytics miễn phí, bạn có thể cần đợi tới 24-48 giờ để hệ thống xử lý dữ liệu hoàn tất. Nhược điểm này cũng đi kèm với việc nếu bạn yêu cầu xử lý một lượng lớn dữ liệu, Google Analytics sẽ áp dụng lấy mẫu (sampling) để tối ưu thời gian phản hồi yêu cầu. Việc lấy mẫu dữ liệu này khác với giới hạn 10 triệu record. Sampling (Lấy mẫu) là phương pháp phân tích một tập hợp con của tất cả dữ liệu để khám phá thông tin có ý nghĩa trong tập dữ liệu lớn hơn. Nhược điểm chính của việc lấy mẫu là bạn sẽ không nhận được thông tin chính xác vì báo cáo đã được chọn và lấy theo một tệp nhất định.
Sampling có thể làm sai lệch nghiêm trọng dữ liệu. Xử lý và phân tích từ dữ liệu thô trước khi được phân mẫu sẽ giúp bạn có thể đảm bảo tính toàn vẹn và tính chính xác khi tính toán các chỉ số hiệu quả quảng cáo.
- Dữ liệu bị phân mảnh rời rạc – Báo cáo GA chỉ có thể chứa một số lượng giới hạn và các kết hợp cụ thể của các parameters và metrics chính, trong đó không phải tất cả metrics có thể kết hợp với mọi dimension.
- Hạn chế trong lưu trữ dữ liệu lịch sử – Bạn chỉ có thể truy cập dữ liệu trong khoảng thời gian tối đa là 90 ngày, tương đương 3 tháng. Giới hạn thời gian này khiến việc hiểu xu hướng hành vi của người dùng hàng năm hoặc hai năm một lần trên trang web sẽ trở nên vô cùng khó khăn. Với dữ liệu thô, bạn có thể truy xuất dữ liệu lịch sử vào nhiều thời điểm trước đó, đảm bảo tính đầy đủ cho bất kỳ khoảng thời gian nào.
Đọc thêm: Dữ liệu chuỗi thời gian (time series) là gì? Phân tích dữ liệu chuỗi thời gian như thế nào?
Những vấn đề và nhược điểm của GA có thể được giải quyết hầu hết bằng cách làm việc với dữ liệu thô. Trong bài viết này, cùng Tomorrow Marketers khám phá làm thế nào để lấy được dữ liệu thô từ Google Analytics và cách để lưu trữ dữ liệu.
Nội dung bài viết:
- Export dữ liệu Google Analytics từ dashboard một cách thủ công
- Sử dụng Google Analytics Query Explorer
- Export dữ liệu sử dụng Google Analytics Spreadsheet Add-on (API)
- Sử dụng Google Analytics APIs
- Export dữ liệu từ Google Analytics sang BigQuery
1. Export dữ liệu Google Analytics từ dashboard một cách thủ công
Google Analytics cho phép người dùng có thể export dữ liệu trực tiếp, chỉ đơn giản với việc mở báo cáo Google Analytics cần tải dữ liệu thô > Bổ sung filter hoặc các segment tùy chọn > click EXPORT ở góc phải giao diện > chọn định dạng tệp PDF, Google Trang tính, Excel (XLSX) hoặc CSV.

Bạn cũng có thể export dữ liệu thô của Google Analytics từ phần custom report trong GA panel.

Sau khi tạo mới báo cáo được tùy chỉnh, bạn có thể bổ sung dimension, metrics và filters cho báo cáo.

Cách thức export data này dễ dàng và nhanh chóng do bạn chỉ cần thao tác trực tiếp với các filters trên Google Analytics. Tuy nhiên, việc export data theo cách này lại tốn rất nhiều thời gian và công sức do bạn cần thay đổi filter theo từng tệp người dùng khác nhau và dữ liệu không có tính cập nhật liên tục. Bạn phải xuất dữ liệu nhiều lần, với nhiều biểu đồ và khoảng thời gian khác nhau.
Không chỉ vậy, bạn chỉ có thể xuất tối đa 5000 dòng dữ liệu một lần – tương đương với số record mà Google Analytics hiển thị trên giao diện – và cũng sẽ cần hình dung một sampling data (để filter) trước khi xuất dữ liệu.
Vì vậy, cần có cách export data khác hiệu quả hơn, thay vì phải filter và xuất dữ liệu hàng chục report khác nhau theo mỗi ngày.
2. Sử dụng Google Analytics Query Explorer
Google Analytics Query Explorer là công cụ cho phép tạo các query để truy xuất dữ liệu từ tài khoản Google Analytics dựa trên nhiều dimension và metric khác nhau.
Để xuất dữ liệu với cách này, trước tiên, mở Query Explorer và đăng nhập vào tài khoản Google Analytics có quyền truy cập vào property bạn cần xuất dữ liệu, lựa chọn tài khoản, property và chế độ xem mà bạn muốn truy xuất.

Sau đó, lựa chọn phạm vi ngày của dữ liệu (ở định dạng YYYY-MM-DD), tùy chọn dimensions và metrics mà bạn muốn có dữ liệu. Bạn cũng có thể sắp xếp, phân loại hoặc filter dựa trên bất kỳ dimensions/metrics nào.
Tất cả các dimension và metric bạn có thể truy xuất thông qua Core Reporting API được GA Query Explorer liệt kê tại đây.

Lưu ý rằng:
- Không phải tất cả dimension và metric đều có thể kết hợp được với nhau: Bạn có thể chọn checkbox để xem tất cả các giá trị có thể được kết hợp trong một truy vấn.
- Nếu một truy vấn liên quan đến các số liệu có phạm vi thời gian khác nhau: Kết quả sẽ trả về lỗi 400 Không hợp lệ.
- Có giới hạn về số lượng dimension và metric được yêu cầu: Bạn có thể chỉ định không quá 10 dimension và 7 metric trong một truy vấn.

Ví dụ, bạn cần export dữ liệu về source/channel, thành phố, số session và số người dùng cho các parameter này. Bạn có thể điền các field như dưới đây để export dữ liệu.
Lưu ý: Đặt riêng các tham số ga:Medium và ga:Source nếu bạn dự định trực quan hóa thông tin này trong Google Data Studio.

Sau đó click ‘Run Query’ và bạn sẽ nhận được kết quả dưới dạng download data.
Bạn có thể export kết quả truy vấn bằng một trong 3 tùy chọn dưới đây:
- Chia sẻ đường link
- Sử dụng các công cụ của bên thứ 3
- Export kết quả dưới dạng tệp TSV, mở bằng Excel hoặc Google Sheets

Lưu ý:
Giống với cách 1, export dữ liệu bằng Query Explorer cũng có giới hạn chỉ được truy xuất 10.000 record cùng một lúc. Nếu kết quả của query trả về là 11.080 record, bạn sẽ cần chạy truy vấn lần đầu để nhận 10.000 record và chạy truy vấn lần hai để nhận 1.080 record còn lại. Để thực hiện việc này, bạn cần viết 10001 vào field “start-index” và chạy yêu cầu (nếu trường “start-index” bị bỏ trống, hệ thống sẽ mặc định là giá trị 1). Sau đó, bạn cần chạy lại truy vấn và tải xuống các kết quả còn lại.

Sau khi truy vấn hoàn tất, bạn có thể tải xuống dữ liệu ở định dạng TSV.

Trong trường hợp này, vì có nhiều dữ liệu nên việc lấy mẫu sẽ được sử dụng. Nếu bạn thấy cụm từ “Does not contain sampled data” thì dữ liệu không áp dụng bất kỳ phương pháp lấy mẫu nào. Để giải quyết vấn đề này, bạn sẽ phải chạy nhiều truy vấn để lấy dữ liệu raw.
3. Export dữ liệu sử dụng Google Analytics Spreadsheet Add-on (API)
Việc xuất dữ liệu sang Google Sheets và xuất dữ liệu bằng Query Explorer đều sử dụng phương pháp đưa ra yêu cầu tới Core Reporting API.
Với Google Analytics Spreadsheet Add-on, bạn có thể:
- Yêu cầu dữ liệu từ nhiều chế độ xem
- Tùy chỉnh các phép tính toán tổng hợp
- Trực quan hóa dữ liệu với chart và biểu đồ, đồng thời có thể nhúng các biểu đồ này trên các trang web của bên thứ ba
- Lên lịch tự động update báo cáo
- Kiểm soát những người có thể truy cập dữ liệu bằng cách sử dụng các tính năng bảo mật và chia sẻ hiện có của Google Spreadsheet
Để tải dữ liệu từ Google Analytics lên Google Sheets, trước tiên bạn cần đăng nhập vào Google Sheets và tạo một bảng tính trống.

Trong bảng tính mới, bạn cần thay đổi cài đặt bảng để có thể thay đổi định dạng của một ô dữ liệu dưới dạng số, ngày tháng hoặc đơn vị tiền tệ cụ thể khi Google Analytics tự động tải dữ liệu lên Google Sheets.
Google Sheets hiện tại đang mặc định một số cài đặt theo khu vực, điều này có thể khiến dữ liệu tải lên sẽ gặp một vài vấn đề: giả sử, trong trường hợp dữ liệu chi phí từ Google Analytics được tải lên có dấu chấm/dấu chấm, kết quả trả về sẽ sai nếu cần cộng hai số. Vì vậy, để tránh những sai sót như này, bạn cần mở cài đặt bảng (File → Settings).

Thay đổi cài đặt khu vực thành United States và lưu cài đặt.

Tiếp theo, bạn cần cài đặt tiện ích bổ sung (add-on), bằng cách mở Extensions > Add-ons > Get add-ons.

Trong hộp thoại tìm và chọn Google Analytics (có thể sử dụng thanh tìm kiếm):

Cài đặt tiện ích bổ sung. Tiếp theo, bạn cần chọn tài khoản có dữ liệu cần xuất tới Google Analytics, sau đó cấp quyền truy cập Google Analytics vào tài khoản. Sau đó nhấp chọn Extensions > Google Analytics > Create new report:

Một menu sẽ xuất hiện và bạn cần chỉ định cài đặt cho yêu cầu xuất dữ liệu.

Tiếp theo, nhấp vào Create Report. Từ đây, bạn có thể thay đổi phạm vi ngày hoặc áp dụng các filter và cách sắp xếp khác nhau.
Tham khảo một số parameters và đọc thêm về tips hướng dẫn cách làm việc với tiện ích bổ sung của Google Analytics và Spreadsheet tại đây.

Cuối cùng, chạy báo cáo để tải dữ liệu lên Google Trang tính bằng cách mở Extensions → Google Analytics → Run reports.

Bạn sẽ nhận được dữ liệu được tải lên trong một trang tính mới

Đọc thêm: Tại sao không nên phụ thuộc vào Excel hay Google Sheets?
4. Sử dụng Google Analytics APIs
Google Analytics cho phép bạn truy xuất dữ liệu bằng API, đồng thời tích hợp dữ liệu phân tích với các ứng dụng khác thông qua Core Reporting API. Ví dụ: bạn có thể lưu ID người dùng từ cơ sở dữ liệu nội bộ và sử dụng nó để tích hợp các hành động ngoại tuyến và trực tuyến.
Tuy nhiên, export dữ liệu thô thông qua API Analytics không dễ dàng như việc click chọn Export hay Run Query. Bạn sẽ cần có kiến thức kỹ thuật để cài đặt mã API và kết nối mã đó với các ứng dụng/website. Script của API cũng sẽ phụ thuộc vào loại ứng dụng/website và ngôn ngữ lập trình cơ sở.
Bạn cũng có thể export dữ liệu chi tiết bằng cách kết hợp API cùng với custom dimensions trong Google Analytics, nhằm mục đích xuất dữ liệu theo nhiều yêu cầu để tổng hợp nhiều field mô tả dữ liệu cấp độ truy cập của người dùng.
Ví dụ, bạn có thể sử dụng custom dimensions với các field:
- Hit timestamp — custom dimension này capture thời điểm chính xác của lần truy cập xảy ra (hit-scope), ở định dạng yyyy-mm-ddThh: mm: ss với độ lệch múi giờ.
- Session ID — custom dimension này thu thập giá trị ngẫu nhiên, duy nhất, được sử dụng để xác định các lần truy cập thuộc cùng một session.
- Client ID — custom dimension này thu thập giá trị duy nhất trong một session được gán cho thiết bị của khách hàng từ cookie _ga.
- User ID — custom dimension thu thập giá trị định danh cho người dùng đã đăng nhập vào trang web, cho phép bạn xác định tất cả các session và lượt truy cập của người dùng này.
Đọc thêm về ví dụ với bài viết cải thiện quá trình tổng hợp dữ liệu với custom dimensions và Google Tag Manager của Simo Ahava.
Tuy nhiên, cách export dữ liệu theo API vẫn có một số hạn chế:
- API Google Analytics không giải quyết được vấn đề data bị gom nhóm thành các tập mẫu khác nhau (sampling). API Google Analytics cũng phụ thuộc vào lượng lưu lượng truy cập trang web (traffic). Nếu lưu lượng truy cập không quá cao và bạn chọn khoảng thời gian báo cáo ngắn thì có thể tránh được việc data bị sampling.
- Phải chạy hàng trăm truy vấn để có được dữ liệu. Vì thông tin sẽ được xuất từ Google Analytics nên tất cả các điều kiện xử lý dữ liệu GA, bao gồm cả khả năng tương thích của dimension và metrics cũng như thời gian xử lý dữ liệu, cũng được áp dụng.
- Ngoài ra còn có các giới hạn và quota như số lượng dimensions và metrics trong truy vấn cũng như lượng dữ liệu bạn có thể trích xuất mỗi ngày từ API Google Analytics. Bên cạnh đó, bạn sẽ cần công cụ để lưu trữ những dữ liệu được trích xuất và vấn đề này đòi hỏi một hướng tiếp cận phức tạp hơn đối với hệ thống xử lý dữ liệu.
Dù vậy, API vẫn là giải pháp khá ổn với các công ty khởi nghiệp và các dự án nhỏ. Bạn có thể tìm hiểu thêm về Export Schema của Google BigQuery và Data Access Schema của Google Analytics để hiểu thêm các dataset, data table và data field có thể truy cập.
5. Export dữ liệu từ Google Analytics sang BigQuery
5.1. Google Analytics 360
Không giống như Google Analytics, bạn sẽ cần trả một khoản phí để sử dụng Google Analytics 360. Nhưng với công cụ này, bạn có thể tiếp cận các tính năng nâng cao của một nền tảng trả phí như truy xuất dữ liệu thô theo hit-level và session-level từ GA sang Google BigQuery thông qua tính năng tích hợp.
Khi bạn liên kết chế độ xem GA với Google BigQuery lần đầu tiên, Google Analytics 360 sẽ tự động xuất 10 tỷ lượt truy cập hoặc dữ liệu lịch sử trong 13 tháng gần nhất vào BigQuery. Việc xuất dữ liệu tích lũy (accumulated data) chỉ được thực hiện một lần cho mỗi lượt xem. Nếu bạn hủy liên kết một chế độ xem và liên kết lại chế độ xem đó với một dự án BigQuery khác thì GA sẽ không xuất lại dữ liệu cho chế độ xem đó.
Khi nâng cấp standard property lên phiên bản được Google Analytics 360 hỗ trợ, hệ thống cũng export dữ liệu được thu thập trong 13 tháng trước khi nâng cấp (giới hạn ở 10 tỷ hit). Bạn có thể tham khảo quy trình chi tiết để cài đặt export dữ liệu Google Analytics 360 sang BigQuery tại Help Center của.
Khi export dữ liệu từ Google Analytics 360 sang BigQuery, bạn có hai lựa chọn:
- Dữ liệu được xuất liên tục (Data exported continuously): Khi lựa chọn option này, mỗi ngày công cụ sẽ xuất một tệp dữ liệu Google Analytics của ngày hôm trước và ba tệp dữ liệu khác với dữ liệu ngày hôm nay.
- Xuất dữ liệu liên tục (Export data continuously): Với option này, bạn sẽ nhận được dữ liệu được cập nhật liên tục nhờ xuất dữ liệu sang Google BigQuery mỗi 10 đến 15 phút một lần. Google BigQuery tính thêm 0,05 USD cho mỗi gigabyte dữ liệu được xử lý. Lưu ý rằng dữ liệu từ các dịch vụ được liên kết với Google Analytics — chẳng hạn như DoubleClick dành cho nhà xuất bản, AdSense và AdX — chỉ có thể được xuất hàng ngày cho ngày hôm trước.
5.2. Google Analytics 4
Một trong những ưu điểm chính của version mới nhất của GA – Google Analytics 4 – chính là tính năng export miễn phí dữ liệu thô sang Google BigQuery. Tùy chọn này trước đây chỉ có sẵn trong phiên bản trả phí của Google Analytics 360.
Bạn có thể setup tích hợp Google Analytics 4 với Google BigQuery để thu thập dữ liệu thô vào bộ nhớ trên đám mây, nơi mỗi người dùng và dữ liệu cấp hành động của họ sẽ được hiển thị trong các bảng riêng biệt.
Sau đó bạn có thể truy vấn dữ liệu bằng SQL để tính toán các parameters và metrics theo tùy chỉnh. Nhờ thu thập dữ liệu trang web trong Google BigQuery, cách thức này có thể tránh việc lấy mẫu và các hạn chế khác của Google Analytics 4 như giới hạn về dữ liệu lịch sử được lưu trữ.
Các doanh nghiệp sẽ bắt buộc phải chuyển sang Google Analytics 4 do Google đã thông báo sẽ ngừng hỗ trợ Google Analytics phiên bản Universal Analytics Standard vào tháng 7/2023 và phiên bản Universal Analytics 360 từ tháng 10/2023.
Đọc thêm: Google Analytics 4 (GA4) có gì mới? Hướng dẫn cách thiết lập Google Analytics 4
Điểm hạn chế của cách thức export data này chính là mức chi phí cần bỏ ra cho dịch vụ. Các doanh nghiệp sẽ phải chi trả cho cả Google Analytics 360 và BigQuery, trong đó chi phí cho rơi vào khoảng $150,000/năm đổ lên và chi phí cho BigQuery sẽ rơi vào khoảng $.02/1 GB dữ liệu.
Tạm kết
Dữ liệu ngày càng được sử dụng nhiều trong các doanh nghiệp, vì vậy những kiến thức về dữ liệu, cũng như kỹ năng làm việc với dữ liệu đang dần trở thành một yêu cầu bắt buộc đối với các nhân sự có background business.
Đọc thêm: Lộ trình học Data Analysis chi tiết cho dân trái ngành có background business
Nếu bạn muốn trang bị tư duy phân tích dữ liệu để tìm kiếm insights, xây dựng báo cáo, đưa ra các next steps, chiến lược đúng đắn, tham khảo ngay khóa học Data Analysis của Tomorrow Marketers. Khóa học sẽ giúp bạn:
- Nắm được các bước trong quy trình làm việc với dữ liệu: Nắm được 6 bước trong quy trình làm việc với dữ liệu bao gồm Define problem, Data collection, Data preparation, Data exploration, Building report, Insight & Recommendation để tiếp cận dữ liệu một cách hiệu quả.
- Rèn luyện tư duy đặt vấn đề, xác định bài toán phân tích dữ liệu: Nắm vững tư duy ‘đặt câu hỏi đúng’, xác định đúng bài toán để đảm bảo dữ liệu sau khi phân tích giải quyết được đúng vấn đề của doanh nghiệp thông qua công cụ Issue Tree.
- Trang bị kỹ năng xử lý và trực quan dữ liệu với công cụ: Cách sử dụng công cụ như Power BI, Excel để hỗ trợ quá trình xử lý và trực quan hóa giúp khai phá dữ liệu tốt hơn.
- Cải thiện khả năng đọc số rút ra insight: Luyện tập đọc số rút ra insight (các điểm bất thường, xu hướng, nguyên nhân,…) và trình bày đề xuất qua các case study ở nhiều lĩnh vực khác nhau (Sales, Product, Digital,…) dưới sự hướng dẫn của các trainers nhiều năm kinh nghiệm.

Bên cạnh đó, nếu bạn mong muốn tìm hiểu thuật toán của các digital platform và cách ứng dụng dữ liệu để tăng tính hiệu quả trong việc sử dụng công cụ, kết hợp đa kênh trên nền tảng số, tham khảo ngay khóa học Digital Foundation tại Tomorrow Marketers nhé! Khoá học sẽ giúp bạn:
- Trang bị tư duy Marketing trên môi trường số: Hiểu được bản chất của việc làm Quảng cáo, Marketing trên các nền tảng Digital. Biết cách vận dụng tư duy và kỹ năng Digital Marketing để phân tích & nghiên cứu ngành hàng, khách hàng, đối thủ trên môi trường Digital.
- Hiểu đặc thù các kênh truyền thông Digital: Hiểu cách thức vận hành, nguyên lý hoạt động của các Digital Channel nhằm tăng hiệu quả quảng cáo trên các kênh. Nắm vững các thông số (Metrics) đo lường hiệu quả để đánh giá và tối ưu các hoạt động digital của doanh nghiệp.
- Tư duy lập kế hoạch Digital bài bản: Hiểu tư duy lập kế hoạch Digital tích hợp đa kênh, biết cách phối hợp chiến lược Content (nói cái gì/nói với ai) và chiến lược Digital (nói bằng cách nào).
