파비뉴스 – 정치권의 AI전문가 검증 요청

1238

지난 주 파비뉴스 서비스가 공정선거보도 심의대상 인터넷언론사 신규 지정 소식을 받고 난 이후로 정치권에서 부쩍 AI빅데이터 전문가 관련 요청을 받고 있다.

그 중, 가까이 지내는 정치권의 어느 지인이 AI빅데이터 전문가를 외부 전문가로 초빙하려고 인물을 찾는다면서 몇 차례 질문이 오가던 중에 아래의 대화를 했다.

누군가는 기분이 나쁠 수도 있겠지만, 공유할만한 정보라고 판단되어서 명시적으로 타인을 지칭하는 부분을 삭제하고 공유한다.

예를 들어, 음성인식, 문장처리 등등의 Multi-patterned stationary data에서 N(>1)개 이상의 패턴을 찾아내는데 특화된 계산법인 RNN을 이용하면 Non-stationary data의 대표적인 사례인 주가 수익률을 예측할 수 있다고 주장하는 컴퓨터 공학 출신의 자칭 AI빅데이터 전문가들이 있다.

통계학 공부를 학부 레벨에서만이라도 제대로 했으면 절대로 할 수 없는 무모한 주장이다.

정말 간단한 사례들로도 충분히 Non-stationarity가 있는 데이터들에 RNN 모델을 돌렸을 때 계산비용이 어마어마하게 지불되고, Exploding gradient problem이 생기고, 결과값이 엉망으로 나오는걸 보여줄 수 있다.

파비클래스 강의 중에 그런 내용을 보여주면,

뭔가 새로운 변형 RNN이 나오면 그 문제를 해결할 수 있지 않을까요?

라는 질문하는 사람들은 여지껏 단 한 명의 예외도 없이 공대, 경영학과 같은 수학/통계학을 제대로 공부 안 하는 전공들 출신이었다.

혹시나 무슨 뜻인지 이해 못하는 분들을 위해 쉬운 풀이를 달면,

(내가 만들 능력은 없지만) 누군가 과학을 더 발전시켜주면 주사위 숫자가 랜덤이 아니라는 걸 알 수 있게 되지 않을까요?

같은 질문으로 바꿔 쓸 수 있다. 과학이 더 발전되는게 아니라, 바닥에 자석을 붙이는 것 같은 꼼수를 쓰면 랜덤이 아니겠지.

어느 명문대 통계학과 교수님 한 분이 ARMA 구조가 있는 데이터에 무턱대고 RNN으로 계산하면 모든 패턴을 다 잡아내는 것처럼 주장하는 “바보”들이 발산하는 (머신러닝 용어로 Exploding gradient problem) 경우를 설명하면서 그런 “바보”들에게 기업 프로젝트를 맡기는 “바보”들이 “바보”같은 결과물을 받고 있는게 “바보”같은 짓인지도 모르는 한심한 상황이라고 어이없어하던 걸 들은 적이 있다.

그 통계학과 교수님 주장에 Super Mega Ultra 동의한다. 틀린 건 틀린 거니까.

경영학과 애들이 여러 세부 전공 중, Finance로 박사가려면 수학과 복수전공은 거의 필수고, 그래도 어느 학교건 되기만하면 Lotto 당첨이라고 생각한다. 보통은 수학, 물리학, 통계학 같은 Hard Science 했던 사람들이나 Finance 박사에 진입할 수 있었기도 하다. 분명히 Finance라는 세부전공은 경영학과 소속임에도.

경제학과에서는 박사가려면 도전하는 세부전공에 관계없이 수학과 복수전공에 가까울만큼 수학적으로 충분히 훈련이 되어야한다는 사실을 정언명령 수준으로 받아들이고 산다. 그런 훈련을 받은 친구들이 Finance 교수가 되면 같은 학부에 있는 마케팅, 인사, 조직, 전략 같은 (전통적으로) 수학적 훈련 없이 말빨로 우기는 학문하는 사람들을 학자라고 생각해줄까? 사기꾼이라고 생각할까? (예의상 겉으로야 인정해주는 척 하겠지.)

귀국 후 국내 공학도들 대다수의 처참한 수학/통계학 실력을 보면서, 도대체 학부 교육이 어땠길래 저렇게 됐나 싶어서 여러 학교들의 공학 프로그램 교육을 여러 출처를 통해 확인해봤다.

우선, 공대의 경영학과라고 무시당한다던 산업공학과가 컴퓨터공학과보다 훨씬 더 수학 공부를 많이 하더라. 수학 하기 싫어서 컴퓨터 공학 고른다는 이야기까지 들었을 정도니까. 전자, 기계, 화학공학 등등의 다른 공학 전공들도 딱히 계산 말고 수학/통계학 공부를 깊게 하지는 않는다는 사실도 함께 알게 됐다. 대부분은 공학수학 수업 중 일부로 기초 통계학을 배운게 전부인 수준이더라. 심지어 박사과정까지.

요즘 학부에서 단순 코딩 수준을 넘어 속칭AI, 실제로는 계산통계학인 학문을 공부하려면, 경영학과 애들이 Finance 박사가려고 수학과 복수전공을 하는 것과 비슷한 맥락으로 수학/통계학 공부를 해야된다는 사실을 매일같이 깨닫고 있을 것이다. 시중의 3류 코딩 교재말고 영어권의 괜찮은 교재들이 모두 수학/통계학으로 쓰여져 있으니까.

경영학과의 Finance 박사 프로그램에 경영학과 출신이 들어가는게 기적같은 사건이 되어 버린 것처럼, 몇 년이 더 지나고 시장이 지금보다 좀 더 성숙되면, 컴퓨터공학과의 AI박사 프로그램에 컴퓨터공학과 출신이 들어가는게 기적같은 사건이 될 것이다. 그렇게 안 되면 AI라고 불리는 계산통계학은 발전이 정체되겠지. 요즘처럼 Non-linear non-parametric 계산법 (특히 다들 4차원의 지식인 줄 알고 있는 Neural Net) 아무거나 하나 붙여놓고 AI논문이라고 우기고 있거나.

Auto-encoder (라는 Neural Net 모델)을 설명하는 중에 Factor Analysis의 Graph model 버젼이라는 걸 비교하다가, 대전 K대학 AI대학원 졸업반 학생 하나가 정규분포의 합/차는 정규분포라는 수리통계학 기초 증명을 안 하고 지나가니까 왜 그런건지 납득을 못하던 기억이 난다.

본인은 Auto-encoder를 잘 알고 있다고 생각했겠지만, 각 Layer별로 Node가 몇 개씩 들어가는게 합리적인거라는 논리를 설명하기 위해 Factor Analysis 예제는 가장 기본형이기 때문에, 제대로 가르치는 곳이었다면 Factor Analysis가 기반하는 정규분포 합/차 가정은 무조건 나올 수 밖에 없다. 학부 2-3학년 수준의 기초 지식에 의문을 가졌다는건 결국 그런 훈련을 안 받았다는거고, 말을 바꾸면 피상적인 수준의 Auto-encoder 밖에 모르고 있었다는 뜻이다.

저런 훈련없이 Auto-encoder 모델은 어떻게 만들까? 논리가 없으니 결국엔 실험충(蟲)이 될 수 밖에 없다. 모든 경우의 수를 다 뒤져보겠지. 오늘 데이터에 맞던 Neural Network 모델이 내일 안 맞는 이유는 영원히 모르는채로.

이게 우리나라 최고 명문대의 AI대학원 최상위권 학생의 수리통계학 훈련도 수준, (결국엔) AI 이해도 수준이다. 저 상태로 졸업했는데 일 시켜놓으면 어떤 사태가 벌어질까?

왜 공대가 AI전문가라고 주장하면 비웃을 수 밖에 없는지 조금은 공감이 되시는가?

(Dunning-Kruger effect에 사로잡힌 공대 출신들이 동의할리 없겠지만) 2021년 현 시점에 인재채용 시장에서 AI라고 불리는 계산통계학 전문가와 가장 가까운 인재 집단은 코딩 공부 적당히 해 본 통계학과 대학원생이다. 계산통계학의 기초가 되는 수리통계학 훈련을 많이 한 산업공학, 경제학 같은 전공 대학원 출신이 차순위 후보 쯤 되는 것 같다. 수학 공부를 엄청나게 많이했을 수학, 물리학 대학원생들도 좋은 후보들이다.

컴퓨터공학과는 수학 얼마나 공부해봤는지 꼼꼼하게 확인해보고 뽑아야되는 차차차순위 인재 풀에 불과하다. 수학말고 코딩 잘하면 개발자를 시켜야지.

마치 Finance 박사과정에서 경영학과 학부 출신이라고하면 일단 거르고 보는데, 혹시 수학/수리통계학 엄청 공부했다고하면 면접 기회를 한번 주는 것처럼. 수학말고 회계 잘하면 Finance박사 대신 회계사를 시켜야지.

AI빅데이터 프로젝트 일을 부탁해서 결과물이 좋은 맞는 걸 기대하시면 공학도 출신말고 통계학과 교수들을 찾아가셔야 됩니다

만나는 스타트업 대표들의 공통된 분위기는, 이미 컴퓨터공학과를 코딩하는 경영학과라고 생각하고들 있고 (참고로 필자는 경영학과 졸업장을 대학 학부가 아니라 상업고등학교 졸업장이라고 생각한다. 학문을 배우지 않고, 기술도 아니고, 기능을 배웠으니까.), 요즘은 느려터졌다고 욕했던 대기업들의 인사정책도 많이 바뀌었더라.

정수론 같이 학문적으로 좀 거리가 있는 수학 전공한 박사 졸업반한테 대기업에서 AI팀 오퍼를 보냈다는걸 듣고 정말 놀랐다. 정수론 했으면 천재일테니 뭘 시켜도 잘 하긴 하겠지만, 당장은 업무에 필요한 지식이 없을텐데… 그냥 수학 박사라는거만 보고 연락한건가? 뭘 시켜야되는지, 뭘 시킬 수 있는지, 뭘 더 가르쳐야하는지 알고 뽑는건지 너무 궁금해서 입사하고 난 다음에 무슨 일 시키는지 꼭 좀 가르쳐 달라고 그랬다ㅋㅋ 우리나라 대기업 인사팀의 역량, 속칭 AI팀의 역량이 밝혀지는 계기가 될 것 같다.

(참고로, 보통 수학, 통계학 학부 졸업생들을 대기업 보험사들이 뽑아서 SQL 노예로 부리다가 3-4년 교육시켜놨더니 도망간다고 욕하는 경우가 많다. Data “Scientist” 꿈꾸는 애들을 Data “Analyst” 시켜놨으니 좋아할리가 있을까? 3-4년 버틴게 다행이지. 수학 “박사”에게는 어떤 일을 시킬지 너무 궁금하다.)

선거철이 가까워오다보니, 또 선거 보도 관련 인터넷 언론사 지정을 받고나니, 본의 아니게 정치권 관계자들을 많이 만나게 되는데, 글 첫머리에 스크린 샷 뜬 대화와 비슷한 내용들을 전달하고 있다. 답답한 소리하는 사람들이 아직도 많기는 하지만, 경제학과가 (학문적으로) 경영학과 무시하는 상황과 별 다를 바 없다는걸 알려주니 문과(충!)들이 학창시절 내내 줄곧 듣던 이야기라 그런지 똘똘한 분들은 빠르게 이해하더라.