총선, 정치, 그리고 온라인 광고

0
1045

2020년 총선이 반년도 채 남지 않은 시점이다. 여의도에서 지인을 만나면 학부 시절 선배들, 친구들이 공천장을 받으려고 노력한다는 이야기도 들리고, 사실상 낙하산 배정이 끝난 지역구에서는 벌써부터 선거전략팀이 꾸려지고 있다는 이야기도 들린다.

늦어도 2월 중순이면 지역구별 후보가 확정되고, 본격적으로 선거전에 뛰어들 확률이 높다. 예년에 그랬듯이, 멋들어진 벽보 사진과 선거 공보물이 우리 주변을 뒤덮고, 유세차량의 소음공해가 우리 일상을 괴롭힐 것이다. 성폭행, 살인, 수백억 횡령 등등의 충격적인 네거티브가 나오지 않는 이상 지지하는 정당이 골라준 후보에게 표를 던지는게 우리같은 소시민들의 행동방식이라는 걸 알고 있을텐데, 그래도 한 표라도 더 받으려는 정치인들의 노력을 보면 안타까움 섞인 경외감을 느끼게 된다.

(Source: 대선 당시 N사 포털의 메인지면에서 캡쳐한 사진들)

그 분들께 그런 종이자원 낭비, 소음공해, 열정 낭비 하지말고, 온라인 광고 한번 써보면 어떻겠냐고 넌지시 운을 띄워봤다.

실제로 지난 대선에 N사 포털의 메인 페이지에는 하루 종일 각 당 후보의 사진 밖에 안 보일 정도로 광고지면을 도배하기도 했었으니까. (위의 사진 참조)

대선이니까 그럴 수 있었고, 총선은 각 지역구별로 나눠서 광고해야되는데, 어떻게 그게 가능하냐고 하면서 고개를 절래절래 젓더라.

근데, 이거 충분히 가능하다. 아니 별로 어렵지 않다.

 

지역구별 타게팅

당장 구글에서 검색 쿼리 하나를 날려보고 화면 제일 하단을 보시라.

(Source: 구글 검색)
(다 좋은데 파비 살충제는 뭐냐…..)

화면 하단에 서울, 강남구라고 찍혀있는걸 볼 수 있을 것이다. (참고로 우리 회사 주소지는 서초구인데, 서초구와 강남구의 경계에 있어서인지 주로 강남구로 뜨는 경우가 더 많더라. 정확도가 100%는 아닌듯.)

정확하게 강남 갑, 강남 을, 강남 병 등을 구분할 수 있는 법정동 정보는 없지만, 시군구 정보를 추가적인 유저동의없이 받을 수 있다. 위에서 보듯이 “From your internet address”라고 나와있지 않나.

 

연령대별, 성별 타게팅

다음 질문이, 자기네들의 주요 지지층이 아닌 분들, Swing Voter인 분들, 그 중에서도 연령과 성별을 골라서 돈을 쓰고 싶은데, 그걸 어떻게 아냐고 묻더라.

많은 방법이 있는데, 일단 파비캐시, 파비썸 같은 경우는 광고 봤다는 이유로 수익금의 일부를 돌려드리는 조건으로 가입정보를 암호화해서 쓸 수 있다. 근데, 이렇게 눈에 보이는 정보는 거짓일 수도 있고, 저 정보를 써서 광고를 하는게 자존심 상한다. 유저 입장에서 자기 정보를 도용한다고 오해할 소지도 있을 것 같고.

본 블로그에서 찾아보실 수 있듯이, 파비는 데이터 사이언스 회사다. 유저들의 로그 기록을 이용해 “Probabilistic measure”를 활용한다. 액션의 속도, 시간대, 종류 등의 정보를 이용하면 성별과 연령대를 꽤나 높은 정확도로 예측할 수 있다.

(Source: BioMed Central)

이런 확률적인 방법이 더 좋은 이유는, 40대이면서 20대 스타일인 분, 여자분이지만 다른 남자분들과 비슷한 행동패턴 (thus 컨텐츠 소비성향)을 보이는 분들의 경우는 연령, 성별로 타게팅을 할게 아니라, 본인 스타일에 맞춰서 타게팅을 해주는 편이 덜 불편할 것이기 때문이다.

파비캐시 가입시 입력 정보의 정확성을 담보할 수도 없고, 한국의 보통 회사들처럼 그런 입력 정보를 쓰기에는 Data Science 회사의 자존심에 상처도 생기고, 또 유저 정보 보호라는 측면에서 우리는 확률적인 방법에 의존한다. 좀 더 정확하게는 연령, 성별을 굳이 나누려고 하지 않는다. 눈에 보이는 정보가 지역, 연령, 성별이지 사실은 그 뒤에 고려해야할 수 많은 Latent Variables가 있기 때문이다. Latent Variable 또는 Neural Network에서 말하는 Hidden layer나 PCA 등등의 유사한 계산 접근법에 대해서는 본 블로그의 데이터 사이언스 섹션을 참고해주시기 바란다.

참고로, Cambridge Analytica라는 회사는 트럼프 대통령의 선거전에 유저별로 완전히 다른 광고를 뿌려주는 방식으로 선거 결과에 큰 영향을 줬다고 알려져있다. (수학자들 몇 명이 만든 회사다.) 페이스북에서 유저들이 Like, Comment 했던 정보들을 몰래 가져왔던 덕분에 반대 당 정치인들에게 고소크리를 맞고 파산했고, 페이스북 창업자 마크 주커버그가 페이스북이 뭘로 돈 버는지 (광고!!!)도 모르는 상원의원들의 한숨 나오는 질문에 하루종일 답변하도록 만들기는 했지만…

Cambridge Analytica 관련해서는 본 블로그의 다른 글을 참고해주시면 좋겠다.

파비는 남의 데이터를 이용하는 부분이 0이고, 철저하게 내부 데이터를 이용한다. 데이터를 이용하는게 불법이냐고? 데이터 이용으로 번 광고 수익금을 유저에게 보상으로 돌려주는 서비스다. 근데 어떻게 불법이 될까? 자세한 내용은 자사 홈페이지와 본 블로그의 파비캐시 관련글들에 상세하게 정리되어 있다.

(Source: SiteScout)

신종 광고 대행사? DSP?

그 다음 질문이, 자기네들은 광고하려면 네X버, 다X, 구X, 페X스북, 인XX그램, 유X브 등등 여러 군데에 광고를 나눠서 보내야하는데, 예산배정부터 이런저런 업무를 광고 대행사한테 시키는게 너무 번거로운 일이란다.

그래서 프로그래머틱 바잉 (Programmatic Buying) 시장에서 가장 많이 이용되고 있는 자동화 경매 (속칭 RTB, Real-Time-Bidding)에 대해서 설명을 해 줬다. 광고 목적에 가장 맞는, 광고 효율이 가장 높을 것 같은 유저들에게만 높은 경매가로 광고를 보여주고, 그렇지 않은 유저들은 경매에 입찰하지 않는 작업을 실시간으로 처리하는 구조가 외국에는 이미 오래전부터 정착되어있고, 국내에서도 네X버, 다X 같은 초대형 서비스들이 구X, 유X브 같은 해외 플랫폼에 검색쿼리도 다 빼앗기고 있는 실정이라, 굳이 국내 채널을 고집할 필요가 없다고.

참고로 구글의 Double Click이 관할하고 있는 광고 지면은 전 세계의 50%가 넘는다. 우리나라의 많은 커뮤니티들도 자기네들이 직접 광고를 수주하는게 아니라, 구글에게 광고 지면 판매를 대행시키고 있다. 구글 Double Click이 그 광고 지면들을 실시간 경매로 팔고 있기 때문에, 어느 커뮤니티와 직접 연락해서 7시-8시 사이에 배너 만 번 보여줘라는 식으로 광고할게 아니라, 구글 Double Click이 팔고 있는 지면을 살 수 있는 DSP 업체에게 광고 의뢰를 하면, 회사별로 자기네 알고리즘을 이용해서 낱개로 지면을 사서 광고를 보여준다. 회사 알고리즘이 효율적일수록 DSP도 돈을 아끼면서 광고할 수 있고, 광고지면 팔고 있는 구글 Double Click도 돈을 번다. 효율성 높은 광고로 광고주가 광고비를 효율적으로 쓸 수 있음은 물론이다.

그런 DSP로는 Google, Facebook, Criteo, The Trade Desk 등의 글로벌 회사와 더불어 국내에 몇 개의 스타트업이 있다. 국내 스타트업들 중에는 Moloco Ads 이외에 달리 언급할만한 가치를 가진 알고리즘을 가진 회사를 아직까지 본 적이 없다.

한참 설명을 듣고 반응이 좀 쌩뚱맞더라.

그런 신종 광고 대행사 업무가 있으면 그냥 알고리즘만 믿고 있으면 되겠네?

이게 광고 대행사 업무인지는 모르겠는데, 온라인 광고 시장의 진화를 전혀 체감하지 못하는 정치권 관계자의 눈에는 그렇게 보였나보다.

광고 대행사가 자기들 임의로 예산을 분배해서 여러개의 채널에 뿌리는게 맞는지 의구심이 들었는데, RTB 시스템 아래서는 모든 광고 지면을 동등하게 놓고, 광고 효율이 좋은 지면+유저 조합만 모을 수 있다는게 꽤나 신기하게 들렸나보다.

이 알고리즘이 유저들의 로그 데이터를 처리하는 통계학적 기법과, 그 아래에 수학 모델링이 깔려있다는 사실을 이해하더니, 그럼 그런 알고리즘을 개발할 줄 아는 한국 회사가 있냔다. 한국이 수학 모델링을 스스로의 힘으로 만들어내는 나라는 아니라는 편견이 있으니까 그런 질문이 나왔을 것이다.

(Source: Centro, Programmatic vs. RTB: A Common Misconception in Ad Tech)

타게팅 알고리즘

모델이 만들어지는 구조, 모델을 테스트하고 보정하는 방법들을 학부 1학년 때 함께 경제학 원론을 듣던 방식으로 차근차근 설명해주고, 미시, 거시경제학 모델이 같은 방식으로 만들어지는 설명을 덧붙이니까,

아, 이래서 경제학 박사한 애들이 뜬금없이 마케팅한다고 그러는구만! 왜 그러나 했네!

라고 Eureka! 같은 표정을 짓더라.

그렇다. 실제로 경제학 박사들이 2000년대에는 파이낸스(Finance)쪽에 발을 걸쳐서 몸 값을 올리려고 했는데, 요즘은 퀀트 마케팅(Quant Marketing)에 발을 걸쳐서 몸 값을 높이려고들 한다. 겉으로 보이는 내용은 다르지만, 뒤에서 쓰는 수학 모델링의 논리와 통계학적 내공이 거의 동일하기 때문이다. (거의 모든 Quantitative PhD들이 비슷한 상황이라고 봐도 된다.) 아마 Computational method를 약간 더 공부하는 쪽으로 방향을 잡는 정도로 각도기를 살짝 틀면 될 것이다.

정치권의 지인들 몇몇 덕분에 정부 예산과 관련된 일을 하는 사람들을 많이 만나는데, 그 분들 대다수가 여전히 “IT업 = 컴공과 출신 엔지니어의 업무 = 알고리즘 (= 인공지능)”이라는 선입견을 갖고 있는 경우가 많다. 공학도의 알고리즘과 경제학도의 거시경제 모델이 수학적으로는 비슷한 레벨이라는 점, 퀀트 마케팅 같은 사회과학 지식이 필수인 분야에 경제학 박사들이 열심히 뛰어들고 있다는 설명을 해주면 다들 충격을 먹은 표정이 된다. 그동안 예산 집행을 엉망으로 하고 있었다는 사실을 깨달으셨기 때문일 것이다. (AI대학원을 만들었는데… 교수가 없다? 글 참조)

(사실 경제학도들은 짝퉁 수학도라서 데이터 사이언스처럼 “Not-so-robust” (수학적이지 않은? 물렁물렁한?) 검증에도 OK가 떨어지는 필드에 발을 들이는걸 쪽팔려한다. 수학처럼 Robust한 학문이 아니라면 학문이 아니라고 비아냥거리는 학문적 유산을 그대로 갖고 있기 때문이다. 아래 Medium 글 참조. For the record, it’s not my posting.)

(Source: medium.com)
(포인트: Greatest sin of the profession. I switched sides. To machine learning and data science.)

나가며 – 정치와 데이터 사이언스

미국에서는 이미 정치인들이 우수한 데이터 사이언티스트를 잡고 타게팅된 광고 메세지를 뿌리는데 익숙해져 있다. 2016년 대선 직전, 미국의 데이터 사이언티스트 채용 공고들 중에 상당수는 워싱턴 DC에 있는 정치 컨설팅 회사들이었다. 더 이상 Cambridge Analytica처럼 외부 서비스의 데이터를 훔쳐(!)와서 타게팅하는 작업은 어려워졌지만, 데이터를 사고파는게 합법인 나라인 덕분에 여전히 다양한 종류의 타게팅 시도를 볼 수 있다.

한국은 당장 정치인들이 데이터 사이언스가 공학이라고 잘못된 선입견을 갖고 있는 상황이니 시간이 좀 더 걸릴 것이다. 그동안 RTB가 국내에서 큰 성공을 못 거뒀던 이유가 네X버, 다X 등의 대형사들이 (사실상) 독점에 가까운 유저 트래픽을 갖고 있었기 때문인데, RTB로 성장한 구글이 국내 시장의 (특히 젊은 층의) 검색 쿼리를 쓸어가는 덕에 RTB가 한국에서도 눈에띄는 성장세를 보여주고 있다. 정치인들이 잘못된 선입견을 버리게되면 지금보다 정치에 데이터 사이언스를 활용하려고 좀 더 적극적이 되지 않을까? 광고 관계자의 눈에 이 글 최상단에 스크린 샷을 넣은 어느 포털 첫 화면의 가로 배너 광고는 생각없이 돈을 쏟아붓는 단순무식한 광고 전략 중 하나에 불과하다.

이번 총선에 서울, 경기 지역 격전지 몇 곳을 골라 국회의원 후보 분들께 타게팅 광고 서비스를 해 드릴 생각이다. 파비 서비스 내의 광고지면에 타게팅은 무료로 제공한다. (외부지면은 돈 주고 사와야해서 무료는 힘들다..) 달리 혜택을 바라는 건 없고, 타게팅 광고의 효과를 체감하고, 혹시라도 푸른 돔의 건물에 들어가시면 좀 말이 되는 법안, 소시민들을 위한 법안들을 고민해주시면 좋겠다. 필자는 정치혐오 끝판왕인 아나키스트이기 때문에 지지 정당이 없고, 소속 정당에 관계없이 한국 IT업계와 온라인 광고 업계 진화에 관심있는 후보 분, 4차 산업 지원이라는 허울 좋은 겉멋 용어만 남발하지 않을 정도로 지식과 내공을 갖추신 분, 광고 서비스가 본인에게 도움이 될 것 같은 후보 분께 도움을 드리고 싶다.