데이터 사이언티스트가 할 수 있는 사업

1282

데이터 사이언티스트가 할 수 있는 사업은 뭐뭐가 있을까?

남들은 못 하는데 데이터 사이언티스트만 할 수 있는 사업, 그 중에서도 필자처럼 이미지 인식, 자연어 처리에 별로 관심이 없는, 수학 기반의 모델러가 할 수 있는 사업은 뭐가 있을까?

지난 몇 년간 실리콘 밸리의 흐름을 보면 필자와 비슷한 백그라운드인 사람들이 거의 대부분 온라인 광고 타게팅 쪽으로 흘러들어갔다. 요즘 경제학 박사들이 너도나도 퀀트 마케팅을 주제로 잡고 있고, 실리콘 밸리에서 그런 수리통계학 + 모델링 훈련을 받은 인력을 대규모로 채용하고 있는 것도 같은 이유다.

아마 “공대 > 개발자 > 데이터 사이언티스트” 같은 사고 방식을 가진 사람들은 여기에 왜 경제학 박사들이 뛰어드는지, 왜 필자처럼 Computational Statistics를 학문의 도구로 썼던 사람들이 뛰어들고 있는지 이해를 못 하겠지만.

 

온라인 타게팅 광고 시장

온라인 타게팅 광고 시장은 포화상태다. 웹-앱의 유저 데이터를 모아서 쇼핑몰, 게임사 등에 타게팅 광고를 뿌려주겠다는 서비스가 2010년대 초반부터 등장했고, 웹 페이지에는 Tracker, 앱에는 SDK를 심어서 데이터를 받아주는 DMP 서비스들도 허덕이고 있고, 광고 타게팅 알고리즘을 갖고 있는 회사들도 구글, 페이스북과 더불어 해외에도 이미 수십개의 회사들이 경쟁하고 있다.

그런 회사 중 한 곳에서 Senior Data Scientist로 있으며 가장 답답했던 부분은 내가 원하는 종류의 데이터가 없다는 거였다.

단순히 남들이 안 가진 데이터가 아니라, 있으면 분명히 유저들 성향을 파악하고 적절한 타게팅에 도움이 될 데이터, 위상기하학적인 관점에서 볼 때 지금까지 못 봤던 Axis를 뽑아낼 수 있을 것 같은 데이터가 눈에 보이는데, 그런 데이터는 회사들이 제 3의 기관에게 제공해주는게 불법인 경우가 많았다. (물론 이런 데이터가 주민등록번호 같은 개인정보보호법의 절대적인 적용을 받아야하는 데이터는 아니다.) 그런 데이터가 있어야 모델의 오차가 줄어든다는건 대학교 회귀분석 수업 하나만 들어도 알 수 있지 않나?

기업들이 자기 앱으로 받는 데이터 중 타게팅 광고 회사에 넘겨줄 수 있는 데이터는 정말 일부밖에 없다. 그리고 아무리 옆에서 봐도 기업들이 갖고 있는 데이터를 제대로 쓰는 것 같지 않더라. 뭔가 좀 가르쳐 주려고 몇 번 시도를 했었는데, 경영학과 아니면 공대 출신인지 A 넣으면 B 나오는 단순한 답만 찾아다니는 전형적인 한국 비지니스 맨들이어서 대화 자체가 불가능했었던 기억이 있다.

사업 모델

그래서 창업을 했다.

광고보면 돈 준다는 리워드 앱들을 사람들이 우르르 달려들어 쓰는 걸 보고, 돈 줄테니까 우리 앱 쓰고, 그 앱으로 우리한테 개인별 스마트폰 이용 데이터 넘겨주면, 우리는 그거 적절하게 가공해서 광고 타게팅을 해주겠다고. 우리가 무슨 데이터 팔아서 돈 벌려는 악당도 아니고, 나름대로 합리적인 (and 수학적인) 가공절차를 거쳐서 적절하게 타게팅을 해 주고 수익이 나면 일부를 유저들에게 돌려주려는, 어쩌면 매우 단순한 사업 모델이다.

파비 클래스를 거쳐간 분들은 한번쯤 들었던 기억이 나겠지만, 어떤 데이터 셋이건 결국은 몇 가지의 숨겨진 변수, Latent Variables, 들로 구성된 subspace에 지나지 않는다. 그 Latent variable들이 얼마나 다차원의 공간을 커버할 수 있는지에 따라 모델 정확도의 최대치가 갈리고, 그 안에서 내 모델이 Linear인지, Non-linear인지, 변수의 복잡성을 어떻게 활용하는지 등으로 최대치의 몇 %를 얼마만큼의 Computational Cost를 넣어서 뽑아내는지가 결정된다.

모델 만들고, 테스트하고, 고민하는게 일상이었던 Data Scientist 입장에서, 남들이 안 가진 데이터와 남들이 시도하지 않는 모델을 써서 가치를 창출하려는건 특별히 대단한 고민이 있어야 했던 사업 모델은 아니었을 것 같다. 이미 유저 데이터가 많은 회사에서 시도했었다는 조건을 건다면.

 

사업의 난관

고민은 사실 다른 곳에 있다.

파비가 가진 문제의 가장 핵심은, 온라인 타게팅 광고 업계에서 남들 다 하는 B2B (기업 대상 비지니스) 사업 대신 B2C (개인 대상 비지니스) 를 시도하고 있다는 점일 것이다.

보통은 사업이 돌아가는 와중에 Data Science 알고리즘이 필요하다는 식으로 접근할텐데, 나는 거꾸로 알고리즘을 쓰기 위한 사업을 찾아다녔기 때문에, 사업을 먼저 성공시켜야하는 무모한 도전을 시작해야만 했다.

사업은 힘들었다. (이 문장은 과거형이면서 현재 진행형이다. 아마 미래 진행형으로 써도 무방하지 않을까.)

일단, 돈 줄테니까 설치해라는 앱을 아무도 안 깔더라. 아니면 깔고 바로 지우고. 사실 앱 만들고 보니 종이 조각 몇 장 붙여놓은 것 같은 엉망진창인 UI가 나왔고, 도와준다면서 설치하는 친구들이 불편한 기색이 역력했다. 데이터 훔쳐가는거 아니냐면서 신고하겠다는 퐝당무게한 메일도 받은 적이 있고, 앱을 아예 켜본적도 없어 데이터 한번 안 쏜 유저가 왜 돈 안 주냐고 폭언을 쓴 앱 스토어 후기도 봤었다.

그동안 돈 준다는 리워드 앱들이 쌓아놓은 이미지가 있어서인지 그래봐야 1년에 5천원 모으기도 힘든거 아니냐고 백안시 하는 사람들도 수없이 만났고, 앱 설치하면 한 앱 당 천원씩 주는 그런 서비스인 줄 알았는데 어떻게 해야 돈 버는거냐고, 돈 버는거 없으면서 왜 만들었냐고 이해도 제로인 사람도 만났었다.

 

커뮤니티 게시판

사업하다보면 별의별 꼴을 다 볼텐데, 이정도면 약과겠지라고 생각하고 무덤덤해졌다가, 유저 불만과 이해도 부족을 그대로 놔둘게 아니라, 내가 바뀌어야겠다고 생각을 고쳐먹었다. 이건 데이터 사이언스처럼 지식의 우열로 승부나는 영역이 아니니까.

그래서

  • 1년에 5천원이 아니라 500만원을 모을 수 있다는 걸 보여줄 수 있고,
  • 돈 버는거 쉽게 볼 수 있어야 된다는 점을 만족시키고,
  • 유저의 장시간 활동 데이터를 얻을 수 있는
  • 결정적으로 구매 데이터와 묶을 수 있는

서비스를 고민해봤다.

그렇게 만든 앱이 지금의 파비캐시다. 동영상 스트리밍이 주력인 Youtube를 제외하고 사람들이 가장 많이 스마트폰으로 시간을 보내는 곳이 인터넷 커뮤니티와 쇼핑몰이던데, 그걸 묶어서 파비캐시에 파비Fun이라는 유머 게시판을 붙이고, 그렇게 받은 캐시를 쓸 수 있는 쇼핑몰을 제작중이다.

글 하나가 Hot 게시판에 올라가면 1,000캐시, Hot한 댓글에 500캐시, 그리고 평소 활동을 보고 맞춰서 푼돈 캐시를 주고 있는데, 서비스 3주일째에 벌써 10만 캐시 이상을 받아가신 분들이 은근히 된다.

(Note: 이틀차에 6천원이라고 놀라던 친구의 스샷 – 카드번호와 닉네임 변경함)

 

온라인 커뮤니티의 우버 (Uber)

이렇게 큰 돈을 줘도 상관없냐고? 망하는거 아니냐고? 묻는 친구들이 꽤 된다.

근데, 우리나라의 초특급 대형 커뮤니티들을 제외하고 나머지 커뮤니티들의 유지비용과 수익모델을 한번 생각해보자. 네이버, 다음 등의 카페 형태 게시판을 제외하고, DC인사이드, 인벤, 에프엠 코리아, 일베, 오유 등의 커뮤니티 들을 빼고나면 대부분의 커뮤니티는 꽤나 많은 알바들이 생산해내는 콘텐츠로 운영되고 있다는 생각이 들 수 밖에 없는 구조를 갖고 있다. 회사가 직접 고용한 알바가 아니더라도 회사 홍보를 위해 그런 커뮤니티에 상존하는 “바이럴 마케팅” 인력을 포함하면 온라인 커뮤니티는 사실상 “알바”들에 의해 운영된다고 해도 과언이 아닐 것이라고 꽤나 장담할 수 있다.

우리는 그런 알바를 안 쓰고, 유저들의 콘텐츠에 노동비를 지불하고 있을 뿐이다.

쉽게 생각하면 온라인 커뮤니티의 우버라고 보면 된다. 우버가 수십만명의 드라이버를 “고용”하고 있는 것과 마찬가지로, 파비캐시 유머 게시판 (내부 지칭 파비Fun)도 참여자들에게 콘텐츠 제공에 대한 최소한의 보상을 해주는 방식으로 수십, 수백명의 진성 유저를 끌어들이고 있는 구조다.

(Pabii의 ii는 Integrated Intelligence, “여러 사람의 기여분을 모은 통합지성”의 약자다. 용어가 궁금하신 분은 한 사람, 한 사람의 참여를 모아 가공한 정보가 서비스의 핵심이 되는 구조라는 회사 소개 글을 참조하시면 좋겠다.)

예를 들어, 하루에 10개 남짓의 유머 글과 10개 남짓의 유머 댓글을 남기는 유저는 1일 15,000원, 월 450,000원, 년 500만원 이상의 수익을 올릴 수 있게 된다.

언젠가 광고 단가가 올라가면 더 큰 이득을 돌려드릴 수 있겠지.

 

커뮤니티들이 돈 버는 구조

그런 커뮤니티들의 수익 구조는 어떨까?

모르긴 몰라도 게시판 상하좌우의 빈 공간 여러곳에 광고를 넣어서 돈을 벌고 있을 것이다.

Data Scientist가 광고할 수 있는 자리, 유저들 정보를 모아서 타게팅 고도화 할 수 있는 자리를 보고 그냥 지나가기는 너무 아깝지 않나?

참고로 국내 대부분의 커뮤니티들은 제로보드 기반의 글+그림 위주의 게시판으로 운영되고 있다. 이미 2017년부터 동영상 광고 수익이 일반 배너 수익을 따라잡았는데, 1개 광고 노출당 단가도 최소 3-4배인데, 동영상 광고가 붙은 커뮤니티가 거의 없더라.

참고로 Youtube 덕분에 2018년부터 미국에서는 TV보다 온라인이 더 광고비가 많이 쓰이는 채널이 됐고, 2019년에 한국에서도 공중파 TV들이 곧 망할지도 모른다는 이야기가 나오고 있는 실정이다. 온라인 광고비가 2010년부터 2017년까지 연간 1조에서 5조까지 나름대로 폭발적인 성장을 했는데, 2019년의 비공식적인 수치는 15조 이상이라는 이야기가 나온다. 방송사들이 고사직전이라는 이야기가 괜히 나오는게 아니다.

 

커뮤니티의 몰락과 Youtube의 성장

요즘 커뮤니티들이 다들 어렵다고들 한다. 예전엔 하루에 추천글이 천 개씩 올라오던 메이저 커뮤니티들이 하루 500개 남짓으로 추천글이 줄고, 컨텐츠의 퀄리티도 나빠졌다고 유저들이 불평하는 글들을 엄청나게 봤었다.

당연하다 싶은게, 커뮤니티에 글을 써 주면 커뮤니티만 돈을 번다. 나는 한 푼도 못 벌고, 기껏해야 그 게시판에서 네임드 유저가 될 뿐이다. 아예 독립해서 내 게시판을 차리지 않는 이상 돈을 벌 수 있는 방법은 사실상 없다.

파워 블로거라는 이야기가 나온 것도 구글링을 통한 검색 유입을 통해 컨텐츠 생산자들이 수익을 얻을 수 있는 길이 열렸기 때문일 것이다.

같은 논리로 많은 Youtuber들이 게시판에 글 올리는 대신 직접 컨텐츠 만들어서 Youtube와 함께 성장하는 길을 선택했다고 판단했다.

 

파비캐시에서 잡은 포커스

파비캐시에 온라인 커뮤니티 구조를 붙이면서 위의 요소들이 고려됐다.

  • 동영상 위주의 컨텐츠
  • 콘텐츠 생산자에게 적절한 수익
  • (사용자들에게 재미있다는 느낌)

광고 수익 금액이 커야 우리도 적절한 보상을 해주면서 수익을 낼 수 있을텐데, 또 적절한 보상이 돌아가야 양질의 컨텐츠가 유입될텐데라는 생각으로 기획을 잡았다.

위의 스크릿 샷에서 볼 수 있듯이, 실제 컨텐츠 같은 Native 광고도 있고, 동영상 광고도 Youtube의 그것처럼 동영상 감상 중에 나오는게 아니라 상/하단에 눈길을 덜 줘도 되는 자리에 배치했다. 그래도 충분히 광고 노출의 목적은 달성이 된다는걸 경험적으로도 느꼈고, 관련 리서치도 많이 봤으니까.

컨텐츠 제공자에게 보상을 돌려주는 조건이 Hot Post, comment인 이유는 유저가 즐겁다고 판단했다는데 근거한다. 재미없으면 아무도 안 들어오고, 들어왔다가 바로 튕겨나가겠지.

(Note: 펭수, 쿠마몬 각각 방송화면 캡쳐)

수익화를 위한 길

요즘 대세라는 펭수를 보면서 뭐 저런 허접한 인형탈이 대세가 됐나는 생각을 한다. 보자마자 일본 쿠마몬 베꼈다는 생각도 했고. 처음 저 인형탈이 나오고 몇 달 동안 EBS에서 어마어마한 돈을 쏟아부으며 다양한 기획을 하고 실패를 했었다고 들었다. 내가 재미없고 왜 보는지 모르겠는데, 다들 비슷한 감정으로 바라봤을 것이다. 일본에서도 2ch을 비롯한 음지의 커뮤니티들에서 일본의 어리석음을 보여주는거라고 자조 섞인 비판이 나오는 컨텐츠이기도 했다. 그렇게 소리소문없이 사라질뻔한 캐릭터였던 펭수가 아육대에 나오고부터 각종 커뮤니티에 바이럴을 타고 “대세” 모델이 됐다고 하던데, 아마 회사 내부에서는 그 바이럴을 타기 전까지 줄곧 실패한 기획들 때문에 스트레스가 어마어마했을 것이다.

그래도 아마 쿠마몬 성공한 사례를 보고 일본에서 통하면 한국에서도 통한다는 믿음을 갖고 조금만 더, 조금만 더를 외치지 않았을까 싶다. EBS가 오랫동안 캐릭터 위주의 컨텐츠를 만든 경험도 무시못할 것이다.

펭수가 쿠마몬을 벤치마킹했듯이, 우리도 잘 나가는 커뮤니티들 몇 개의 특성을 짜집기 해봤다. 거기다 우리나라 온라인 커뮤니티들이 자기네 뱃 속만 불리는 점을 착안해서 유저들에게 글, 댓글, 좋아요, 싫어요 등등의 모든 액션에 대해서 보상을 주는 구조를 갖춰봤다. 서비스 초기라 그런지, 컨텐츠가 아직 풍부하지 않아서인지, 사람들이 몰려들지 않아 콘텐츠 재생산이 안 되어서인지는 모르겠지만, 아직은 미진하다.

Data Scientist 입장에서 광고 타게팅으로 수익화 모델을 만들고 싶은데, B2C 사업모델을 잡은 탓인지 (B2B여도 별로 다르진 않았을듯) 사업 성장 속도도 더디고, 좌충우돌하다 실패한 기획도 많다. 내가 이렇게 이단아여서 사람들을 모르나 싶어 좀 연령대가 낮은 직원들의 제안 사항을 귀가 얇게 듣고는 시도했다가 몇 달의 시간을 버리기도 했고, 이건 되겠지라고 생각하고 시도해봤는데 전혀 무반응인 경우도 많더라.

실패한 시도를 하나 소개하면, 앱 설치 1회에 3천원 주는 서비스를 며칠간 써 봤는데, 아마 자기네들이 2천원을 챙기고, 앱 설치한 유저들에게 1천원을 주는 거 같더라. 그런데, 내일도 다시 설치하면 천원 더 받겠지라는 생각으로 유저 분들이 설치하자마자 탈퇴시켜달라고 메세지를 몇 십개나 보내놨던데, 그걸보고 굳게 결심했다. 다시는 그 광고 채널을 안 쓸 생각이다. 우리 앱 이름에 “캐시”가 들어갔다는 이유로 그런 광고 캠페인을 지원해주는 페이지를 탑재해라는 요청 메일을 주기적으로 받는데, 거들떠 보지도 않는다. 내 눈에 피눈물이 흐르도록 만드는 서비스로 남의 눈에도 피눈물이 흐르도록 만들고 싶지는 않다.

뭐가 답인지 모르겠는데, 펭수가 그랬듯이 우리도 열심히 실패한 시도들을 쌓아올려 보는 수 밖에 없을 것 같다. 누군가 왕도를 알면 절대 안 알려주겠지.

누가 그러던데, SNS에서 뜨고 있는 컨텐츠인 펭수, 양준일처럼 적당히 컨텐츠 만들어놓고는 그 다음부터 죽어라 바이럴만해서 하나 얻어걸리기만 바라는게 맞는 전략일까? 난 그런거 핵노잼이어서 쳐다보지도 않는데ㅋㅋ

 

파비캐시의 종착점

앱을 들어와 본 분들은 쉽게 인지하시겠지만, Feed 형태가 국내에서 흔히 보는 제목 중심의 게시판이 아니라, 페이스북, 인스타그램 등에서 익숙해졌을법한 컨텐츠 중심의 게시판이다. 여기에 해외 커뮤니티들에서 흔히 볼 수 있는 Native 컨텐츠 형태의 광고 지면도 만들 수 있고, 아예 자기네 상품 페이지를 연동할 수 있도록 링크를 걸어줄 수도 있다. 우리가 파비몰 (쇼핑몰 앱)을 만들고 있으니까, 조만간 상품 판매를 연결하는 채널을 만들어 줄 수 있을 것이다.

파비 사업 모델의 핵심은 광고비의 일부를 돌려줘서 다른 몰에서는 10,000원에 살 수 있는 제품을 쌓아놓은 파비캐시로 할인가에 살 수 있도록 해 주는거다. 많이 모아놓았으면 9,000원, 8,000원이 아니라 100원, 200원을 내고 살 수도 있고, 공짜로 구매할 수도 있다. 기존의 리워드 앱처럼 몇 백, 몇 천원 같은 “푼돈” 모으려고 각종 스트레스를 받아야하는게 아니라, 일상의 일부처럼 쓸 수 있는 기능들을 통해서 몇 만원, 몇 십만원, 몇 백만원을 되돌려 받을 수 있도록 해 주는게 이 사업의 목표다.

언젠가 이마트의 정용진 부회장 인터뷰를 봤는데, 스타필드의 목적이 쇼핑이라는 목표를 위해 빠른 속도로 업무 처리를 하는 공간이 아니라, 시간을 보내며 즐겁게 놀다가 자연스럽게 지갑을 열도록 만드는 것이라는걸 봤었다. 우리 서비스도 앱 내의 콘텐츠를 즐기다가, 자기도 모르게 이건 하나 사 놓고 싶다는 생각을 하면서 링크가 열리도록 만드는 걸 목표로 한다. 단순히 돈을 많이 줘서 우리 서비스를 쓰는게 아니라, 웃고 떠들다보면 돈이 쌓여 있고, 내가 즐기는 컨텐츠와 연관된 상품을 쉽고 편하게, 그렇지만 저렴하게 소비할 수 있는 구조를 만드는게 파비캐시의 종착점이다.

사업의 팽창을 위해 Data Science를 하는게 아니라, Data Science를 하기 위해서 사업을 하는 무모한 도전은 어디까지 갈 수 있을까?

상품을 팔려고 쇼핑몰을 만드는게 아니라, 유저 트래픽 데이터로 타게팅 광고 해보고 싶어서 커뮤니티와 쇼핑몰을 만드는 무모한 도전은 과연 맞는 도전일까?