타겟 마케팅 – 3. 기업들이 DSP를 써야하는 이유

81

기업들 세일즈 미팅이나 외부 특강을 가면 꼭 듣는 질문들이 있다.

  • 우리가 가입자들 데이터를 내부적으로 굉장히 많이 갖고 있는데, 우리보다 더 많은 데이터를 갖고 있는가?
  • 우리가 자체 DMP를 만들어서 광고할 유저를 뽑아내는 것보다 타게팅 알고리즘이 더 나은가?
  • 어차피 구매할려고 했던 유저들에게 다시 광고 보여줘놓고 효율 좋다고 우기는건 아닌가?
  • 우리가 모든 앱 이용자들에게 광고 메세지를 보내는 건 공짜인데, 타게팅은 돈이 든다. 그만한 가치가 있나?

이런 질문들에 엄청난 내부 Bias를 가진 상태에서 결론을 내린 다음, DSP 서비스를 쓰지 않는 경우를 너무 많이 봐왔다. Criteo 재직 시절에는 콧대 높은 게임사들에서 주로 봤었고, Pabii 에서는 대기업 쇼핑몰들에서 주로 들었던 질문들이다. 질문 받은 당시에 나름대로 조리있게 설명을 드렸는데, 잘 이해하고 가신다는 느낌도 못 받았고, 사실 전달하기도 쉽지 않은 지식이었다는 생각이 든다.

Pabii가 곧 DSP형태의 서비스를 출시할 계획이어서가 아니라, 그 분들이 매우 잘못된 생각을 갖고 있다는 판단아래, 조목조목 반박하는 글을 올린다.

* DMP: Data Management Platform – 온라인 유저 데이터를 포괄 관리하는 거대 데이터 베이스, 유저 분석 업무를 포괄 지칭한다

* DSP: Demand Side Platform – 유저 분석을 통해 선별된 유저들에게 광고를 보여주는 플랫폼, 타겟팅 정확도가 핵심 기술력이 된다.

Q. 기업이 고객 데이터를 내부적으로 많이 갖고 있는데, DSP가 더 많은 데이터를 갖고 있을리가 있나?

A. 필요한 데이터, 적절하게 가공된 데이터가 있는지가 중요하다

Criteo 서비스를 써 보신 분들은 다 알겠지만, Criteo가 (필자의 재직당시) 원했던 데이터는 몇 종류되지 않는다. 온라인 쇼핑몰 기준으로 1.홈페이지, 2.검색 페이지, 3.상품 페이지, 4.장바구니 페이지, 5.구매 페이지 로그가 전부다. 여기에 상품 페이지와 실제 상품을 매칭할 수 있도록 상품 Feed를 따로 받은 것 밖에 없다. 그런 정보만으로 어떻게 구글, 페북 같은 업체들보다 더 높은 퍼포먼스를 보일 수 있는 타게팅 알고리즘을 가질 수 있게 되었을까? 유저들의 모든 검색어를 다 알고 있는 구글이나, 사용자가 하루에 몇 시간씩 시간을 보내는 페북이 훨씬 더 고급 타게팅을 해야하는거 아닌가?

제대로 DB만 구축해놨다면 당연히 기업들이 훨씬 더 많은 유저 데이터를 갖고 있을 것이라는데 별 이의가 없다. 근데 그런 데이터가 다 필요할까? 그런 데이터가 있으면 온라인 쇼핑몰 타게팅이 훨씬 더 정교해질 수 있을까? 근데 왜 구글, 페북이 그런 엄청난 DB를 들고도 Criteo 하나 못 잡아서 매번 Head-to-Head 테스트를 하면 패배의 쓴 맛을 봐야했을까?

매번 Factor Analysis 이야기할 때마다 강조하는거지만, 데이터를 많이 갖고 있다는 장점이 효과를 볼려면 다른 데이터로는 표현할 수 없는 Vector Space를 커버하는 데이터를 모델에 쓸 수 있어야한다. 그런데, 세상의 많은 데이터들은 서로간에 높은 Correlation을 갖고 있고, 꼭 1:1이 아니라 최소한 1:N의 비율로 Linear dependency를 갖는 경우를 자주 볼 수 있다. 다시 말하면, 꼭 데이터가 많아야 이기는 승부가 아니라, 필요한 데이터좋은 모델로 활용하는 데이터 전처리 및 모델링의 싸움이 훨씬 더 승패에 큰 영향을 미친다.

어느 사회학 공부하는 분의 댓글에서 봤듯이, 사회과학하는 사람들에게 데이터 속의 Implication을 잡아내는 작업은 친숙하다못해 당연한 작업인데, 반대편 극단의 공대생들은 일단 자동화할 수 있는지 없는지에 더 초점을 맞추는 경우가 흔하기 때문에, 그래서 너무 공대생스럽게 타게팅 알고리즘을 만들어놨기 때문에 구글, 페북이 조그마한 Criteo 하나 못 따라잡고 있는건 아닐까 싶다. (더 자세히 이야기하면 Criteo에서 고소들어올지도 몰라서 여기까지…)

 

Q. 기업들이 자체 DMP를 만들어서 광고할 유저를 뽑아내는 것보다 타게팅 알고리즘이 더 나은가?

A. 당신네들 인력이 DSP 전문 Data Scientist들보다 뛰어난가?

위의 대답과 연결된 질문이다. 요즘 한국의 대형 온라인 업체들이 데이터 Hype에 걸려서 너도나도 데이터 베이스 구축하고, DMP를 만든다면서 빅데이터 처리를 담당하는 Data Architect들의 몸값이 폭등했다. (네X버, 카X오 등에서 Hadoop 써 봤다고 그러면 그 개발자는 서로 데려가려고 난리란다. 굳이 그래야하는지는 잘 모르겠지만….)

그렇게 빵빵한 DMP를 만들어놨으니, 이제 뭔가 마술을 확~ 부리면 데이터 속의 Implication이 마구 쏟아질 것 같아서 Data Scientist를 뽑겠다고 하더니 정작 Data Analyst와 Data Engineer들만 있는 팀을 만들고 있으시던데? 가끔 그런 팀 만들어놓고 날 불러서 Case Study 들어간 강의 한번만 들으면 그 분들의 “역량”이 뿅~ 하고 업그레이드 될 줄 알고 있으시던데?

당신네 회사는 거들떠 보지도 않을 “수준 높은 인재”들이 가 있을 구글, 페북도 Criteo 못 따라 잡아서 안달이고, 당장 구글, 페북의 타게팅 알고리즘도 따라해보려다가 고생하는, 실리콘 밸리의 똘똘이 스머프 가득한 스타트업들이 널려있다. 근데 DMP가 무슨 데이터를 보유하고 있어야되는지도 잘 모르는 수준의 인력만 밀어넣으면 그런 마술을 부릴 수 있을 것 같은가?

예전에 판교 어딘가에서 고생하는 개발자 친구가 0.18%에서 0.2%로 Click Through Rate (CTR) 올리는 싸움하는걸로 데이터 사이언스 폄하하길래 반박해줬던 글 기억나시는가?

 

Q. 원래 구매할려고 했던 유저들에게 다시 광고 보여줘놓고 효율 좋다고 우기는건 아닌가?

A. 궁금할 땐 A/B Test 를 해 보시면 된다.

예전에 30대 남성들만 들어가는 페이지, 20대 여성들만 들어가는 페이지에 광고할 때보다, 유저의 특성을 계산해서 선택적으로 광고를 보여주는 타게팅 광고가 더 저렴해서 썼나? 눈 앞의 비용은 분명히 비싸다. (당장 CPC가 훨씬 더 높을텐데?) 단순 비용이 적게 들어서가 아니라, 그렇게 광고 봤던 유저들이 구매로 이어져서 회사 수익이 커지는 부분, 즉 ROAS (Return on Advertiser Spending)이 눈에 띄게 크기 때문에 그런 비용을 썼을 것이다. 그렇다고 ROAS값만 높으면 무조건 좋은 광고 타게팅 알고리즘일까?

어차피 구매할 유저들이있는데, 그런 유저들에게 광고 보여줘놓고 생색내기 하는거 아닌가라는 질문을 하시는 분들이 많다. 보통 이런 이슈 때문에 A/B Test를 진행한다. 유저들을 절반으로 나눈 다음, A 그룹에게는 아예 광고 노출을 하지 않고, B그룹 중 타게팅 알고리즘에서 선별되는 유저들에게 광고 노출을 해놓고, 두 그룹간 소비 금액의 차이를 확인한다. B 그룹 전체한테 다 보여주는게 아니라 일부한테 보여주는건 반칙아니냐고들 하시던데, 원래 타게팅 알고리즘 자체가 선별된 유저에게만 광고를 보여주는 서비스다. 단지 A는 선별 자체를 안 하는거고, B는 선별 그룹에 남겨놓는 차이밖에 없다.

보통 이렇게 A/B Test를 하고 나면, A 그룹대비 B 그룹에서 20% ~ 50% 정도 높은 전환율을 보였다는 걸 확인할 수 있다. 그 20%의 추가 전환분이 진짜 ROAS 계산에 들어가야 정확한 계산이 될 것이다. (많은 DSP들이 “20% 추가분 / 광고비  = ROAS”라는 공식을 활용하지 않고, “120% 전체수익 / 광고비 = ROAS”라는 공식을 쓰면서 광고주들을 호도하고 있다는 사실을 인지하고 있지만 자세한 사례를 공개적으로 밝힐 수 없음을 양해해주셨으면 좋겠다.)

광고주 입장에서, 광고비를 더 써서 매출액이 더 나왔고, 그 증가분이 만족스럽다면 광고를 계속 집행하면 된다. A/B Test는 그런 측면에서 굉장히 간단하고 효과적인 테스트다. 어느 스타트업을 가봤더니, 새로운 DSP 서비스가 나올 때마다 모두 A/B Test를 해보더라. 실험적인 자세를 유지할 수 있을만큼 광고 예산이 많은 것도 있겠지만, CMO 분이 정말 논리적, 체계적으로 광고를 운영하고 있다는 느낌을 받았다.

 

Q. 모든 앱 이용자들에게 광고 메세지를 보내는 건 공짜인데, 타게팅은 돈이 들지 않나? 가성비 안 나오는거 아니냐?

A. 모든 광고 지면은 동일하지 않고, 막 뿌리면 유저 피로도가 증가해서 서비스를 떠나버린다.

위의 세 가지 설명을 하고 나면, 보통 마지막 질문을 받는다. 어차피 우리 앱 유저들한테 푸시 메세지를 보내면 광고 다 나가는데, 그렇게 모든 유저한테 다 보내버리면 되지 않냐고, 왜 굳이 골라서 보내줘야되냐고, 그렇게 골라서 보내주는거에 왜 돈을 써야하냐고들 하신다.

일단, 큰 대전제 하나를 짚고 넘어가자. 모든 광고 지면은 동일한 가치를 갖지 않는다.

시간 때우기용 유머 사이트에서 보는 광고지면 단가보다, 특정한 정보를 전달하는 페이지의 광고지면 단가가 훨씬 더 비싸다. 그냥 그 페이지에는 더 “돈을 많이 쓸 것 같은” 유저가 모이기 때문에? 같은 사람이 1초 전에 유머 페이지보다가 정보 전달 페이지로 넘어갔는데, 그래도 “돈을 많이 쓸 것 같은” 유저는 다르다고 주장하실텐가?

Do Publishers Matter? 라는, 광고에서 아주 오래된 근본적인 질문이 있다. 해당 페이지의 내용에 따라서 문맥이 달라지고, 다른 문맥 때문에 결국 지식을 소비하고 있는 유저의 반응도 달라질 수 밖에 없다. 요즘들어 경쟁적으로 Native Ad가 나오는 것도, 정말 광고 같은 느낌이 들지 않는 광고, 블로그 글 읽던 중에 정보 전달인 거 같은 느낌이 드는 광고여야 사람들의 거부감도 줄어들고 반응율이 높아진다는 걸 인지했기 때문이다. 쉽게 말해서, Publisher matters!

실제로 푸시 메세지를 보내고 나면 유저들의 (일시적인) 재유입이 폭증한다. 광고 효과를 “노출” & “재유입”으로 본다면 나쁘지 않은 선택인 건 사실이다. 근데, 일부 유저들이 그렇게 긍정적으로 반응했을 때, 다른 유저들은 어떤 생각을 했을까? 한번은 밀어서 지워버릴지 모르지만, 계속 그런 메세지가 주기적으로 온다면? 짜증이 치밀어 오른다의 광고적인 표현은 “유저 피로도”의 증가이다.

아마 게임회사 광고 담당자가 “우리가 하는것보다 잘 할 수 있냐”고 묻던 이유는 푸시 메세지 처럼 내부 보유한 채널로 충분히 해결될 것 같아 보이는 광고에 왜 돈을 쓰냐는 질문이었을텐데, 타게팅이 안 되면 안 될 수록 전체 유저의 피로도가 증가한다고 답을 할 수 있을 것이다.

겨우 피로도 조금 증가하는거 때문에 굳이 광고에 돈을 쓰고 싶지 않다고 결론 내릴 수도 있을텐데, 정말 당신네 타게팅 알고리즘이 DSP보다 더 좋다고 생각하는건 아니겠지? 그 “피로도”가 그렇게 중요한 정보가 아니라면, 제일 많이 깔린 앱에 그냥 광고를 부탁하면 된다. 어차피 노출되기만 하면 상관없다면, 한국에서 제일 많은 사람들이 쓰는 앱을 가진 회사가 푸시 메세지 광고를 독점해버리면 될 것이다. 그런데, 유저 피로도가 어느 수준을 넘으면 그 앱은 휴지통 행이 된다. 푸시 메세지 꺼주는 기능을 찾는 유저가 있으면 차라리 양반이라고 해야할 것이다.

웹사이트에 광고를 덕지덕지 붙이기 시작하면 유저들은 빠른 속도로 떨어져나간다. 앱이 푸시 메세지를 계속 보내면, 앱 사용 중에 계속 광고가 뜨면 유저들은 더더욱 빠른 속도로 떨어져나간다. 유저 피로도는 그렇게 무서운 것이다.

 

나가며 – 레벨의 차이

머신러닝 모델의 “성능”을 이야기할 때,

  • 1차원적인 사람들은 몇 % 맞췄냐만 묻는다.
  • 2차원인 분들은 Precision, Recall을 다 본다.
  • 3차원인 분들은 Overfitting의 가능성을 본다.
  • 4차원인 분들은 데이터 전처리 할만한 여지를 살펴본다.

데이터 사이언티스트의 퀄리티는 이런데서 결정이 된다.

광고 타게팅을 이야기할 때도 상황은 비슷하다.

  • 1차원적인 사람들은 어차피 노출만 되면 되는거 아니냐고, 왜 돈을 쓰냐고 묻는다.
  • 2차원적인 사람들은 지면마다 특성이 다르다는걸 인지하고 좋은 지면에 지갑을 연다.
  • 3차원적인 사람들은 투입 자금대비 효율을 따지며 (Incremental) ROAS 숫자를 본다.
  • 4차원인 분들은 광고 때문에 유저들에게 반감이 생기지는 않았는지, 유저 피로도가 올라가지는 않았는지 살펴볼 것이다.

타게팅 알고리즘의 퀄리티도 이런 부분에서 결정이 된다고 생각한다.

광고주 분들께 꼭 DSP를 써야한다고 이야기하고 싶지도 않고, 모든 DSP가 다 좋은 알고리즘을 갖고 있지 않다는 사실도 인지하고 있다. 아마 많은 회사들이 아직도 웹 Tracker기반, 앱 SDK 기반의 데이터로 세밀한 타게팅을 할 수 있다는 서비스 홍보를 열심히 하고 있을 것이다. 어느 서비스가 제일 좋냐고 물어보시던데, 그런 주장을 하는 회사에서 인정할 수 있을만한 Data Scientist를 아직까지 한 명도 만나보질 못했기 때문에 추천을 못하겠다고 말씀드렸다. 어차피 어느 회사건 고퀄리티의 알고리즘을 갖고 있으면 내부 기밀일텐데, 외부로 알려진 정보만 자꾸 찾으려고 하지말고, 어느 스타트업 CMO처럼 직접 테스트해보는게 제일 좋지 않을까? 농담이 아니라, 이런식으로 Noise 가득한 데이터들에서는 One-size-fits-all 모델이 없기 때문에, 남들한테 잘 되는 DSP가 꼭 우리 회사에 잘 되라는 법도 없다. 직접 테스트해보시는게 제일 좋을 것 같다.

부족한 지식으로 내린 결론이 국내외 DSP 회사들에서 영업을 뛰고 계신 분들께, 사내에서 DSP 광고를 해야할지 고민하는 마케터 분들께 조금이나마 도움이 되었으면 한다.