로보 어드바이저가 실패할 수 밖에 없는 이유

1058

Nvidia에서 GTC에 200여개의 AI 스타트업을 초대했다는 기사를 보내주면서 어느 VC 지인이 묻더라. 여기 나온다는 어느 로보 어드바이저 스타트업 가치가 2천억원이 됐는데, 저렇게 몇몇 회사 가치가 폭등하는걸 보면 로보 어드바이저 정말 되는건데 너만 안 된다는거 아니냐고. “로보 어드바이저는 정말 사기일까” 참조

저 곳 중 어느 한 곳에서 일했다던 분이 파비클래스 수업에 찾아와서 했던 이야기를 일단 그대로 옮겨본다

강화학습으로 학습시키면 된다고 말만할 줄 알고, 모델 만드는 사람은 저였는데, 저는 아무것도 모르고 있고, 회사 대표가 언론 플레이만 열심히하는 사기꾼이라고 생각해서 그만두고 나올 생각입니다

이 분이 수업 끝나고 메일을 하나 보내주셨는데,

대표님 덕분에 여러모로 많은 것을 배우고 느꼈던 강의였습니다.
특히, 마지막 강의 쉬는 시간에 어떤 수강생의 강화학습 질문에 대해서 말도 안 된다며 조목조목 소신있으면서 자신감 넘치게 답변하시는 모습을 보면서, (중략)

그 수업 마지막날 받았던 질문이

인공지능으로 주식시장 예측이 가능하고, Investor’s alpha를 찾아낼 수 있는데, 못 찾는다고 하면 업계에 있는 사람들이 받아들이지 않을 것이다

는 말이었다.

 

업계에 있는 사람들에게

우선, 필자 역시 한 때 유명 외국계 증권사의 Analyst였음을 먼저 상기시켜 드리고 싶다. 지능보다 세일즈가 더 중요한 자리인 것 같아 미련없이 박사 공부하러 떠났기는 했지만. 거기다 박사 전공이 Mathematical Finance 였음도 상기시켜드린다. Data Scientist가 아니라 헤지펀드 커리어를 심각하게 고민했기도 하다. 당시 수학/통계학 훈련도가 비슷한 사람들 대다수가 비슷한 고민을 했었다.

그 질문한 분이 말한 업계에 있는 사람들이 어떤 수준의 사람들인지 모르겠는데, 그 분들에 대한 개인적인 판단은 철저히 배제한채, 일단 NYU의 AI대학원 교수, 현재 헤지펀드 운용사 대표인, 말 그대로 스펙만 놓고 봤을 때 업계에서 최고의 전문가라고 꼽힐 사람의 글을 링크로 걸어본다.

아무도 안 읽어볼거라고 생각하고 핵심 문구 중 몇 개를 골라봤는데, 자율주행차와 금융시장 데이터를 비교하는 부분이다.

With the car, there really is a code to be cracked. The problem largely involves geometry, immutable laws of motion and known roadways — all stationary items

자율주행차는 Stationary 데이터가 들어온다는 뜻인데

Financial markets are not stationary. They change all the time, driven by political, social, economic or natural events

금융시장 데이터는 Non-Stationary 데이터라고 지적한다.

시계열 통계학을 공부해보면 알겠지만, Non-Stationary 데이터는 통계학이 다룰 수 없는 데이터다. Non-Stationary의 가장 간단한 예시인 AR(1)에서 coefficient가 1인 케이스, 즉 Random walk과 비슷하게만 보여도 학자들은 그 데이터에서 손을 뗀다. 그걸 테스트로 구분할 수 있는 P-P test 같은 모델을 만들어낸 Perron 교수 같은 분은 경제학 교수가 Nature, Science 같은 과학계 최고 저널에 논문도 내고, 노벨상 후보라는 이야기까지 돌 정도다.

아예 통계학적 지식을 이용해 다루는건 불가능한 데이터고, 테스트로 랜덤이라는걸 구분하기만해도 Nature, Science 같은 최고급 저널 논문에, 노벨상 후보로 이름이 오르내리는 대접을 받는다는게 일반인에게 실감이 될까…

통계학이 아니라 딥러닝으로 하면 뭔가 달라지지 않을까요

라는 질문이 따라나올 것 같은데,

가장 간단한 Non-stationary 형태 중 하나인 Multiplicative seasonality 가 있는 데이터에 Recurrent Neural Network (RNN)을 적용했을 때 제대로 학습하게 하려면 Non-stationarity를 제거하기 위해서 Scaling을 해줘야한다는걸 보여주는 파비클래스 데이터 사이언스 강의 자료도 있다.

수업에서 눈으로 보면 이해되겠지만, Non-stationary 케이스에서는 계산비용도 어마어마하게 들어가는데, 정작 답은 엉망진창으로 나온다.

딥러닝을 더 복잡하게 만들면 되는거 아니냐고? 계산비용만 더 들어가겠지. 아니, Non-stationary 데이터니까 수학적인 용어를 쓰면 결국 “수렴”하지 않고 “발산”할 것이다. Convergence 없다고 빨간색 에러 메세지를 Console 창에서 보게 되겠지ㅋ

심지어 금융시장 데이터는 Multiplicative seasonality 수준의 기초적인 Non-stationarity를 가진 레벨이 아니어서, 단순 Scaling만으로는 Non-stationarity를 제거하는게 당연히 불가능한 데이터다.

딥러닝, 머신러닝, 인공지능이라고 불리는 지식이 결국은 통계학의 일부분이라는걸 인지할 수 있는 분이라면 딥러닝으로는 다르지 않냐는 질문조차 하지 않았겠지

(필자의 Favorite 키보드/마우스 세트가 있다….Source Link: MarketWatch)

 

Investor’s alpha

“남들보다 돈 잘버는 투자자의 능력”이라고 번역하면 될 것 같은데, 개별 회사 하나의 잠재력을 보고 투자하는 워렌 버핏 방식의 투자, 매일매일 거래 물량 기반으로 기술적 분석하는 사람들이 Investor’s alpha가 있다고 주장하면 나름대로의 근거가 있다고 생각한다. 그 능력으로 많은 돈을 번 사람들이 충분히 있을 수 있다는 것도 인지하고 있다.

그런데, 단순히 패턴 매칭 알고리즘을 이용해서 랜덤 데이터에서 랜덤이 아닌 부분을 찾아낸다는게 말이 되는 이야기인가?

주사위 던진 과거 자료를 보고

오늘 주사위를 600번 던지면 1이 100번 나올 것이다

라는걸 매우 비슷하게 맞췄다고 자랑하면 할 말이 없는데, 그건 굳이 과거 자료도 필요없고, 패턴 매칭 알고리즘이 필요없는 계산이잖아?

실제로 경제학, 금융 전공자는 절대 뽑지 않고, 오직 수학 실력만으로 사람을 뽑는, 오직 패턴 매칭 알고리즘 만으로만 돈을 번다고 알려진 르네상스 펀드는 몇 십년간 고수익을 내는 것처럼 홍보하지만 실상은 손실보는 순간 바로바로 해고되는 사람들 투성이인 회사다.

매칭 알고리즘을 벗어나서, 자산의 가치라는 관점으로 볼 때, 어떤 금융 자산에 투자해서 이득을 볼 수 있을지 없을지에 대한 논리는 공부하면 누구나 세울 수 있다.

그러나, 현재 가격이 그런 논리에 들어갔던 자료가 이미 반영된 상태고, 미래 가능성까지 다 포함된 상태라면 투자자가 더 할 수 있는 부분이 뭐가 있을까?

다만, 시장에는 수많은 Friction이 존재하고, 그래서 어딘가에는 Undervalued인 자산이 있다. (대표적으로 주식회사 파비가 있잖아? ㅋㅋ)

그런 Undervalue를 잘 알아보는 눈이 있는 분이 Investor’s alpha를 가진 분이라는 논리가 워렌 버핏 방식의 가치 투자 전략에 해당하고, 120일 이동평균선 같은 그래프만 보는 기술적 분석도 누군가는 무시하지만 결국 시장 가격은 수요-공급의 싸움이라는 걸 생각해보면 완전히 틀린 말도 아니다. 아무리 미래 가치가 뛰어나다고 해도 당장 팔아치우는 사람만 왕창 있으면 그 자산의 가격은 폭락할테니까.

이런 요소들을 결합해서 Trading algorithm을 만들었다고하면 차라리 믿는다. 말이 되니까. 전체적으로는 Random process, 즉 Non-stationary data지만, 금융시장에서 말하는 “재료”들을 이용해서 Random이 아닌 구간을 찾아내려고 하는거니까.

근데, 단순히 Random 데이터와 비슷한 패턴을 찾아내면 뭐가 나올까?

Random이 나오겠지ㅋ

 

시장 Depth의 문제

기적같이 저 랜덤 패턴을 다 잡아내는 알고리즘을 만들어서 미래 예측이 매우 높은 확률로 된다고 해 보자. 정말 기적이지만, 그런 일이 일어나는 확률은 수학적으로 무한대 분의 1이지만, 일단 있다고 해 보자.

그럼 엄청나게 많은 돈을 들여서 마구마구 모델을 이용하면 되겠네?

글쎄, 저 위에 언급한대로 시장 가격은 궁극적으로 수요-공급의 싸움이다. 자산은 10개고, 한 개당 1만원이면, 10만원치 밖에 구매할 수 없다.

더 살려고해도 살 수가 없어서, 결국 10개만 나중에 2만원에 팔아 10만원의 이득밖에 못 얻는다. 이렇게 시장 Depth가 얕으면, 더 사겠다고 달려드는 사람이 모이면 1만원짜리가 2만원으로 뛴다. 2만원으로 사서 2만원으로 팔면 무슨 이득이 남냐?

시장 Depth가 엄청나게 깊은 상품인 블루칩 주식, Index 관련 펀드, 파생상품 정도가 어느정도 가능한 자산이라고 보인다.

근데, 그런 상품만 사고 팔아서는 Investor’s alpha를 만들어내는게 거의 불가능할 것이다. 이미 정보가 다 공유되어 있고, 시장 가격에 (거의) 실시간으로 반영되거든.

특정 자산이 Undervalued인지 알아볼 수 있는 알고리즘, 근데 그 자산이 Deep market인 자산이 과연 얼마나 있을까?

 

나가며 – 바람따라 투자하는 VC

금융시장은 숫자가 바로바로 나오는 곳이니까 돈 벌었는지 아닌지 곧 정보가 알려지는 곳 아니냐고 하더라.

글쎄다. 돈을 엄청 벌었다는 숫자가 나오는건 복권 당첨급 이벤트고, 결국 고만고만한 Index 펀드 수준의 수익률 나오면서, 자동화 했으니까 인건비 줄일 수 있다는 과장법 좀 쓰고, 여느 증권사 펀드처럼 수익률이 더 잘 나온다는 마케팅으로, 다시 강조한다, 실제 수익률이 아니라 마케팅으로 고객을 끌어모아야하는 비지니스인 것 같다.

보통 일반인은 증권사 직원들은 오르는 주식을 다 알고 있어서 그걸로 돈 번다고 착각하겠지만, 증권사의 주력 비지니스는 금융시장에서 남들이 모르는 정보를 이용한 투자로 일확천금을 버는게 아니라, 적절한 금융상품금융서비스를 만들어 판매하고 얻은 마진들의 합이다. 주식을 상장시키기 위해 투자자들을 물색해주고, 주식을 (대량으로) 구매하려는 기관에게 해당 회사에 대한 자세한 분석 자료를 공유하고, 해외에서 들어오는 매출액으로 환차손이 발생하는걸 방지하기 위한 외환 헷징 상품을 제작, 판매한다. 이게 증권사의 주력 업무다.

로보 어드바이저는 그런 증권사를 이용해서 투자하는 헤지펀드가 하던 투자업을 자기네가 “인공지능” 알고리즘으로 할 수 있다고 주장하는건데, 헤지펀드도 단순 패턴 매칭 알고리즘으로 투자하는게 아니라, 나름대로 독특한 모델을 갖고 있다. 경제학의 산업조직론 이론 중 하나인 Cournot 모델에 따라 특정 산업의 시장점유율대로 비중을 맞춘 펀드도 있고, 기술발전이 예상되는 몇몇 Tech Growth 자산에만 투자하는 펀드도 있다. 종류는 다양하다. 그리고, 이미 다들 자동화 되어 있다. 무슨 펀드냐에 따라 새롭게 정하는 로직을 잡는게 투자 전문가의 일이다.

그럼 “딥러닝을 이용한 패턴 매칭 알고리즘으로 알파고처럼 인간 펀드 매니저보다 더 높은 수익률을 낸다“는건?

위에서 NYU 교수의 글까지 인용해가며 설명한대로, 수리통계학 모르는 사람들을 속이는 비지니스일 뿐이다. 알파고, 딥러닝 같은 단어가 등장할 이유가 없는 Non-stationary data이기 때문이다.

그럼 매출액 10억, 20억 남짓에 그 마저도 대부분은 증권사 펀드 운용 대행 수수료인 (즉, 인공지능 대신에 인간을 때려박아서 만든 매출액인) 로보 어드바이저들에게 1,000억, 2,000억씩의 가치가 부여된 건 왜 그러냐고?

속사정을 100% 모르니까 아래의 설명은 100% 완벽한 진실이 아닐 수 있다. 외부에 로보 어드바이저로 알려지지 않은 다른 사업을 하고 있다면 또 모르겠다. 제발 필자의 식견이 모자라서 제대로 된 평가를 못하고 있기를 빌겠다. 다만 알려진 수준의 로보 어드바이저 사업만 하고 있다는 전제아래, 시장에 대한 소소한 이해와 지난 3년간 한국 사회의 VC투자 행태를 봤을 때 높은 확률로 짐작되는 시나리오다.

이미 투자금을 쏜 VC는 다음 “호구”를 찾을 때까지 그 회사가 엄청나게 잘 나가는 회사라고 끊임없는 확대 부풀림 재생산을 하고 다닌다. 많은 VC들이 지식 수준이 얕다보니 그런 “바람따라 투자”하는데 휩쓸리더라. 주식 개미들만 신문 기사 읽고 바람에 투자했다가 돈을 버리는게 아니라, VC들도 지식없이 소문만 듣고, “잘 나온대?”, “엄청 잘 나온대, 어느 학교 교수도 붙었다더라” 같은 말이 돌면서 투자를 진행한다. 개미나 VC나 기술력에 대한 이해도 수준이 같기 때문이다. 값이 0인게 문제일뿐. (한국 땅에 공부하는 VC가 과연 몇 명이나 될까? 미팅 상대방에 대한 자료조사도 안 하는, 기본 비지니스 매너도 모르는 인간들이 대부분인 판국이건만)

문득, 그 교수들이 틀린 말 한걸 갖고와서 이 사람은 된다는데 너는 왜 안 된다고 하냐고 따지고 들던 어느 경영학과 출신 파비클래스 수강생 한 명이 기억난다. 그 교수 수업 듣는 KAIST 석사 학생들의 발표 주제 리스트였는데, 계산방법론과 실제 데이터간 매칭이 잘못된 경우는 말할 것도 없고, 금융시장의 기본 논리에 어긋나는 주제도 있었다. 학생들이 그런 주제를 갖고 왔으면 왜 안 되니까 어떻게 바꾸는게 좋겠다는 지적을 해야되는 사회적 위치에 있는 사람이, 그런 주제들을 당당하게 SNS에 올려놓는걸보고 가슴이 먹먹했었다.

ELS가격이나 수익률이 정규분포를 따른다는 가정이 말이되나? 정규분포를 따르면 딥러닝 같은 계산법을 쓸게 아니라, 다른 계산법을 써야지? ELS로 얻는 수익률 구조도 잘못 이해하고, 정규분포라는 황당한 가정이 잡혀있고, 거기다 계산법은 가정과 어긋나고… 한 달 강의 끝나고나니 좀 이해했는지 그 교수가 틀렸다는 사실을 바닥에 깔고 질문하더라. 그런 Sales + Professor 들에게 현혹되지 말았으면 한다.

근데 말야, 다 떠나서 대박 알고리즘 만들었는데 왜 남들이랑 공유하지? 시장 Depth 안 깊어서 큰 돈 못 굴리는거 뻔히 아는데, Investor’s alpha 있으면 왜 남한테 알려줌? 나 혼자 투자하지?ㅋ