GA4 & 빅쿼리 내보내기(Bigquery Export) (1편) - traffic_source VS. collected_traffic_source 레코드 분석
간단하지만 설명이 필요하신 분들을 위해 나중에는 GA4(Google Analytics 4) 데이터를 빅쿼리(Bigquery)로 쌓는 방법에 대해서도 포스팅 해보겠습니다.
오늘 작성할 글은 GA4를 통해 빅쿼리(Bigquery)에 쌓인 "events_" 에서 짚고 넘어가면 좋은 내용에 대한 것입니다.
애널리틱스 고객센터에는 GA4 빅쿼리 내보내기 스키마(GA4, Bigquery Export schema)가 잘 설명되어 있습니다.
이 링크에서 더 자세한 내용을 보실 수 있습니다.
traffic_source VS. collected_traffic_source
"열(Columns)" 데이터를 보면 traffic_source
와 함께 collected_traffic_source
가 있습니다. 이것에 대한 정의와 함께 어떤 것을 의미하는지 안다면, 서비스에 어떤 경로로 어떤 활동을 통해 유저가 유입되었는지 파악하고 분석할 수 있습니다.
애널리틱스 고객센터에 의하면 traffic_source
와 collected_traffic_source
에는 다음과 같이 정의되어 있고, 필드가 구성되어 있습니다.
collection_traffic_source
레코드에는 이벤트와 함께 수집된 트래픽 소스 데이터가 포함됩니다.traffic_source
레코드에는 사용자를 처음 획득한 트래픽 소스에 대한 정보가 포함됩니다. 일중 표에서는 이 레코드가 채워지지 않습니다.
- 참고: 사용자가 설치 후 후속 캠페인과 상호작용하면traffic_source
값이 변경되지 않습니다.
collection_traffic_source
부터 설명하면서 차이점을 보겠습니다. 이 필드에는 manual이 포함된 manual_campaign_name
, manual_source
, manual_medium
등 utm param 으로 지정한 값들이 쌓이게 됩니다. 이와 함께 gclid, dclid 등이 쌓이는 것을 볼 수 있습니다.
이번에는 traffic_source
를 확인해보면, 필드에 traffic_source.name
, traffic_source.medium
, traffic_source.source
의 값이 쌓이며 이 필드의 정의는 모두 "사용자를 최초로 획득"한 트래픽 소스에 대한 정보가 포함되는 것을 볼 수 있습니다. 즉, 퍼스트 터치(first touch)값을 의미하며, 설명의 "참고"란에 있는 것 처럼, 사용자가 설치 후 후속 캠페인과 상호작용 해도, traffic_source
값은 변경되지 않는 것을 알 수 있습니다.
Insight
이것이 의미하는 것은 무엇이며, 어떤 인사이트를 얻을 수 있을까요?
짧게 예시를 통해 설명하면, 특정 캠페인을 통해 첫 번째로 방문한 유저는 GA4에 의해 퍼스트 터치(First Touch)기준인 traffic_source
에 쌓이게 되고, 이후 이 유저가 다른 캠페인으로 다시 유입되었다면
traffic_source
와 collection_traffic_source
를 비교하며 후속 캠페인의 성과와 유입을 통한 행동을 파악해 볼 수 있을 것입니다.
다른 표현으로 다시 이야기 하면, 첫 방문자의 주요 트래픽 소스를 확인해보고 싶다면 traffic_source
데이터를 활용하고, 현재 진행중인 캠페인의 트래픽 소스를 보고 싶다면 collection_traffic_source
데이터를 활용하는 것이 보다 적합할 것으로 보입니다. 왜냐하면 traffic_source
데이터를 사용할 경우 이전에 방문한 유저가 이번 캠페인에 포함되어 있다면, 이번 캠페인의 성과를 분석할 때의 "기여"가 이전 캠페인으로 이전되어 보여질 수 있기 때문입니다.
이 두 가지 데이터를 효과적으로 조합해 사용하면, GA4 를 통해 측정되는 디지털 마케팅 전략의 초기 효과와 장기적인 추이를 함께 평가하고 최적화 할 수 있을 것이라고 생각합니다.