Kết nối GA4 và Google BigQuery

Google BigQuery đang được sử dụng ngày càng rộng rãi như một kho lưu trữ dữ liệu marketing (marketing data warehouse) với mục đích kết nối và lưu trữ dữ liệu từ nhiều nguồn khác nhau, giúp phân tích chéo dữ liệu từ nhiều kênh từ đó ra quyết định tốt hơn và trong bài viết ngày hôm nay mình sẽ giới thiệu qua lợi ích của BigQuery và đặc biệt hướng dẫn cách kết nối giữa Google Analytics 4 và Google BigQuery cũng như làm thể nào để xuất dữ liệu qua kho lưu trữ dữ liệu đám mây như thế nào.

Google BigQuery là gì?

Trước khi đi vào chi tiết, hãy cùng nhau tìm hiểu vậy Google BigQuery là gì mà sao gần đây được rất nhiều công ty hay các doanh nghiệp sử dụng làm kho dữ liệu đám mây nhé.

BigQuery là một kho dữ liệu đám mây được tạo và nằm trong hệ sinh thái của Google. Kho dữ liệu cho phép lưu trữ dữ liệu dưới dạng bảng chứa hàng và cột, và sử dụng ngôn ngữ SQL để truy vấn dữ liệu. BigQuery được phát triển bởi Google do đó rất thuận tiện để kết nối với sản phẩm khác như GA4 với tốc độ nhanh nhưng lại hoàn toàn MIỄN PHÍ.

Tại sao cần kết nối GA4 và Google BigQuery?

Có 2 lợi ích chính khi kết nối GA4 và BigQuery

  • Bạn có thể truy cập được dữ liệu sơ cấp (raw data), do đó xoá bỏ được giới hạn dữ liệu trong giao diện người dùng của công cụ GA4, và nếu có kiến thức ngôn ngữ SQL bạn hoàn toàn có thể truy vấn và chạy các báo cáo tuỳ ý. Ngoài ra, việc truy cập được vào dữ liệu cơ sở, bạn có thể xây dựng được các mô hình máy học (machine learning models) cho sản phẩm hoặc đưa ra các dự báo tốt hơn
  • BigQuery cho phép bạn truy cập dữ liệu theo thời gian thực trong khi GA4 thường có độ trễ và phải mất thời gian nhất định để xử lý dữ liệu. Bằng cách sử dụng BigQuery để lưu trữ và truy vấn sau đó dùng Looker Studio (trước đây là Data Studio) để trực quan hoá dữ liệu qua đó cho phép bạn ra quyết định nhanh hơn.
Ví dụ: Thời gian giữ lại dữ liệu mặc định của người dùng và sự kiện trong GA4 chỉ là 2 tháng hoặc bạn có thể điều chỉnh thời gian lưu trữ này lên đến tối đa 14 tháng đi chăng nữa thì nếu bạn muốn chạy báo cáo phân tích sự kiện của người dùng sau 14 tháng thì dữ liệu hoàn toàn đã bị xoá. BigQuery có thể giúp bạn khắc phục vấn đề này, sau khi dữ liệu được xuất qua BigQuery thì được lưu trữ không giới hạn thời gian.

Cách tính chi phí khi kết nối GA4 và BigQuery như thế nào?

Kết nối GA4 và BigQuery là hoàn toàn MIỄN PHÍ, bạn sẽ chỉ phải thanh toán khi sử dụng BigQuery dựa theo hai phần chính, gồm: Dung lượng lưu trữ và Truy vấn dữ liệu nếu sử dụng vượt quá 1TB yêu cầu xử lý dữ liệu hàng hàng và 10 GB dung lượng lưu trữ của gói miễn phí.

Hoặc bạn có thể sử dụng BigQuery sandbox để xuất data miễn phí. tuy nhiên, bạn sẽ bị giới hạn về thời gian lưu trữ dữ liệu khi sử dụng sandbox, các bảng dữ liệu sẽ hết hạn sau 60 ngày. Nếu bạn thực hiện nâng cấp tài khoản trước thời hạn này, để tránh bị mất dữ liệu bạn phải đảm bảo cập nhật lại ngày hết hạn của bảng dữ liệu

Khám phá bảng giá BigQuery chi tiết tại đây: https://cloud.google.com/bigquery/pricing

Kết nối GA4 và Google BigQuery như thế nào?

1. Tạo tài khoản Google Cloud

Nếu chưa có tạo khoản bạn có thể tạo cho mình một tài khoản Google cloud bằng cách vào đường link: https://console.cloud.google.com/


2. Tạo một dự án mới cho Google BigQuery

  • Tạo một dự án mới trong tài khoản Google Cloud Console
  • Thêm thông tin thẻ thanh toán cho dự án mới
  • Thiết lập và bật BigQuery API để bật BigQuery cho dự án

3. Kết nối tài sản GA4 và Google BigQuery

Bước 1: Đăng nhập tài khoản GA4 và tiếp tục chọn Quản trị phía cuối góc trái của thanh menu


Bước 2: Trong phần Đường liên kết sản phẩm chọn Đường liên kết đến BigQuery



Bước 3: Chọn Đường liên kết


Bước 4: Tiếp tục Chọn một dự án BigQuery 


Bước 5: Chọn dự án để kết nối sau đó bấm vào nút Xác nhận để tiếp tục, một dự án BigQuery chỉ kết nối được với 1 tài sản GA4


Bước 6: Chọn vị trí dữ liệu từ danh sách sau đó nhấp vào nút Tiếp



Bước 7: Trong phần thiết lập tuỳ chọn cài đặt, chọn Định cấu hình các sự kiện và luồng dữ liệu để loại trừ luồng dữ liệu và sự kiện không cần thiết tránh vượt quá hạn mức 1 triệu tổng số lượng sự kiện/ ngày



Mặc định nếu không chọn luồng dữ liệu và chỉ định sự kiện, toàn bộ luồng dữ liệu và tất cả sự kiện sẽ được xuất qua BigQuery

Bước 8: Loại bỏ các luồng dữ liệu không muốn xuất qua BigQuery


Bước 9: Trong phần những sự kiện bị loại trừ chọn Thêm để chọn các sự kiện không muốn xuất qua BigQuery


Bước 10: Chọn sự kiện muốn loại trừ sau đó bấm nút Thêm


Bước 11: Sau khi định cấu hình luồng dữ liệu và sự kiện xong, chọn Áp dụng



Bước 12: Lưu ý đừng quên chọn vào ô Bao gồm giá trị nhận dạng quảng cáo cho luồng ứng dụng dành cho thiết bị di động


Bước 13: Trong phần loại xuất dữ liệu chọn xuất dữ liệu hàng ngày và truyền trực tuyến


Do tài khoản của mình chưa được cài đặt thông tin thẻ thanh toán nên chưa chọn được được lạoi xuất dữ liệu truyền trực tuyến

Bước 14: Chọn loại xuất dữ liệu Hằng ngày


Bước 15: Kiểm tra kỹ lại các bước kết nối đã thiết lập một lần nữa rồi bấm Gửi


Chúc mừng bạn vậy là bạn đã hoàn thành xong các bước thiết lập kết nối tài khoản GA4 và BigQuery

Khi nào bạn nhìn thấy dữ liệu trong BigQuery

Sau khi kết nối thành công tài khoản GA4 và BigQuery, sẽ mất khoảng 24 giờ trước khi bạn nhìn thấy những dữ liệu đầu tiên được ghi nhận. Dữ liệu sẽ xuất hiện nhanh hơn nếu dự án được thêm thẻ thanh toán và đã được bật loại xuất dữ liệu truyền trực tuyến.

Để truy cập vào dữ liệu, bạn đăng nhập trình Cloud Console -> Chọn BigQuery -> Chọn BigQuery -> Chọn Tập dữ liệu GA4

Giản đồ GA4 BigQuery Export

Dưới đây là định dạng và giản đồ của dữ liệu GA4 khi được xuất qua BigQuery
  • Tập dữ liệu (dataset): Tài sản GA4 sau khi được liên kết với BigQuery sẽ được đặt tên analytics_<id tài sản google analytics 4> vào dự án BigQuery.
  • Bảng dữ liệu (tables): Bảng dữ liệu được đặt tên theo định dạng events_YYYYMMDD và được tạo mỗi ngày nếu bật chế độ xuất hằng ngày.
  • Cột (columns): Cột trong bảng events_YYYYMMDD biểu thị thông số theo các sự kiện cụ thể
  • Hàng (rows): Hàng chứa dữ liệu của sự kiện, dữ liệu cho một sự kiện có thể được trình bày trong một hoặc nhiều hàng tuỳ thuộc vào tham số dữ liệu của sự kiện.
Bạn tham khảo thêm tại đây Giản đồ Google Analytics 4 BigQuery Export

Trực quan hóa dữ liệu GA4 BigQuery với Looker

Để trực quan hoá dữ liệu GA4 BigQuery trong Google Looker Studio, bắt buộc bạn phải chọn BigQuery là nguồn dữ liệu

Truy cập vào tài khoản Looker Studio, kích vào dấu cộng để tạo nguồn dữ liệu


Chọn BigQuery làm nguồn dữ liệu cho Looker Studio


Tiếp tục chọn dự án, tập dữ liệu và bảng muốn kết nối để làm nguồn dữ liệu


Sau khi đã tạo và kết nối thành công nguồn dữ liệu cho Looker bạn có thể tuỳ ý tạo biểu đồ, đồ thị, bảng biểu cho các báo cáo dựa vào dữ liệu GA4 BigQuery

Giới hạn khi kết nối BigQuery và GA4

Một số giới hạn bạn cần biết trước khi kết nối BigQuery và Google Analytics 4 (GA4):

  • Giới hạn lưu trữ: BigQuery có giới hạn lưu trữ tuỳ theo gói đăng ký bạn đã chọn, với gói FREE người dùng có tối đa 10GB để lưu trữ dữ liệu, trong khi đó người dùng trả phí có thể lưu trữ đến 1 triệu tỷ dữ liệu (petabytes of data)
  • Giới hạn truy vấn: BigQuery cũng có giới hạn truy vấn tuỳ theo số lượng dữ liệu được xử lý hằng ngày. Gói FREE có giới hạn 1TB/ngày trong khi đó người dùng trả phí thì tuỳ thuộc vào gói đã đăng ký
  • Truy vấn đồng thời (concurrent queries): BigQuery giới hạn số lượng truy vấn đồng thời được xử lý. Giới hạn này tuỳ thuộc vào gói đăng ký trả phí.
  • Chi phí truyền dữ liệu: Di chuyển dữ liệu giữa GA4 và BigQuey có thể làm tăng chi phí truyền dữ liệu, tuỳ thuộc vào số lượng dữ liệu được truyền. Các tài sản GA4 tiêu chuẩn có giới hạn mức tối đa 1 triệu sự kiện được xuất mỗi ngày và không có giời hạn cho xuất lường dữ liệu

Kết Luận

GA4 được tích hợp sẵn kết nối với BigQuery, nơi bạn có thể lưu trữ dữ liệu cơ sở của website để sử dụng cho việc báo cáo và phân tích hiệu quả hoạt động marketing. Ngoài ra, kết nối với BigQuery cũng cho phép bạn chạy các báo cáo dữ liệu của GA4 theo thời gian thực.

BigQuery có thể kết nối được hầu hết các công cụ trực quan hoá dữ liệu phổ biến giúp bạn có thể tạo các bảng điều khiển, các báo cáo để ra quyết định tốt hơn nhằm giúp phát triển công việc kinh doanh.


Tham khảo thêm: Maketing Data Warehouse là gì? Tại sao bạn cần biết?


Nhận xét