경영학과의 데이터 사이언스 교육

1769

어느 경영학과 대학원생이 아래의 메일을 보내왔다.


학부에 2학기부터 ‘XX데이터분석’ 이라는 과목이 새로 열립니다. 제가 조교로 들어가게 되었습니다. 제 지도교수님을 이렇게 평가하고 싶지 않지만, 아무래도 데이터 분석이라는 부분에서는 엄밀한 통계적 접근보다는 블로그에서 많이 언급되는 전형적인 공대 출신의 접근 방법을 사용하십니다. 시중에 나와 있는 책을 하나 교재로 잡고 Python 스킬을 강조하시며 코드 구현 위주의 수업을 한다고 하십니다만, 저는 경영대학 학생들을 위한 수업에서는 자신의 도메인에 대한 깊은 이해를 바탕으로 Data를 Information으로 바꾸기 위한 통계지식과 엑셀 능력이 더 중요하지 않을까 생각합니다.

물론 뭔가를 시작해본다는 관점에서 Python을 배우고, 코드를 쳐보고 구현하는 것도 의미야 있겠지만, 저도 공부하면 할수록 이게 제대로 수학과 통계를 공부하지 않은 이상 쉽지 않은 일이라는 것을 느낍니다. 특히나 XX를 전공한 학부생은 취업해서 Python이나 R보다는 Excel을 더 많이 사용할텐데, 오히려 자기 전공에 대한 깊은 이해가 우선이고, 기초통계학 수준이라도 확실하게 알고 이를 Excel로 처리할 수 있는 그런 능력이 더 필요하다고 생각합니다. 수강생들에게 ‘가장 중요한건 전공지식이고, 더 나은 의사결정을 하는데 필요한 역량은 이 정도이다. 괜히 인공지능, 머신러닝, 딥러닝 이런 Buzzword에 현혹되지 마라. 만약 더 깊게 배우고 싶다면 통계학과로 가서 제대로 배워라’ 라고 말을 해 주고 싶습니다.


왜 경영학과와 공대를 문/이과에서 각각 같은 레벨의 지식을 배우는 전공이라고 폄하하는지 단적으로 보여주는 메일인 것 같다.

물론 경영학과 안에도 제대로 연구방법론을 배운 분들이 많이 있고, 공학에도 놀랄만한 수준의 수학적/통계학적 엄밀함을 바탕으로 연구하시는 분들이 있다는 걸 안다. 가까운 지인들도 여럿된다. 마음속 깊숙한 곳에서 우러나오는 존경심을 갖고 있다.

그런데, 그렇게 지식이 쌓인 분들은 선뜻 자기가 잘 모르는 Data Science 강의를 열지는 못하더라. 제대로 훈련받은 학자라면 학문적 훈련 과정 중에 모르는 걸 함부로 안다고 했을 때 부담해야하는 위험을 충분히 인지하게 된다.

반대로 MIT에서 박사했지만 정작 Eca.가 Econometrica라는 경제학/경영학 박사 전공자들에게 꿈의 저널의 약자라는 것도 모르고 베껴온 강의노트에 있는 논문을 소개하고 있는 경영학과 교수는 당당하게 모든 걸 알고 있다고 우기면서 수업을 한다. 이런 스타일의 경영학과 교수들 몇 명 있는데, 아는 사람들 눈엔 보이겠지.

저 메일 속의 지도교수는 그것도 귀찮아서 아예 시중에 나와있는 Python으로 머신러닝 1달만에 배우기 같은 책을 줄줄 읽으면서 수업하려는 모양이다. (그런 교수들이 매우 많다는 보고를 수강생들에게 이미 수십 차례 받았다. 교수들 학위가 모두 공학이라는건 안 비밀이다.)

이미지 인식, 자연어 처리 등등의 특수 분야는 석사 수준의 지식도 채 못 갖추고 있다고 꼬리를 내리는 필자의 입장에서 볼 때, 지금 Data Science라는 주제로 강의하고 있는 분들 중에 석사 수준은 커녕 학부 수준이라도 되는 사람이 몇 명이나 되는지 모르겠다. 이미지 인식으로 전문가라는 어느 교수와 잠깐 대화를 나눈 적이 있었는데, 포토샵 같은데서 쓰는 필터와 이미지 인식에서 쓰는 Sliding window가 같은 거라는 걸 모르더라. 참고로 이거 대학원 수준도 안 되도록 난이도 낮춘 파비클래스 강의 교재 중 한 페이지의 내용이다. 몇 년전이었으면 대충격이었을텐데, 워낙 그런 사기꾼 교수들을 많이봐서 그런지 무덤덤했다. 그 교수한테 억단위의 프로젝트 맡긴 어느 회사 경영진의 얼굴이 문득 스쳐지나간다. 우리회사 경영진이었으면 당연히 해고감이었겠지만, 다들 그렇게 속고 속이면서 살겠지.

MIT에 있는 디자인 전공 수업 놀러가서 필터라고 쓰고 3×3 행렬로 표현된 값들이 충족시켜야하는 필수조건들 수학적으로 증명하는 수업을 들었던 기억이 있는데, 한국서는 문과도 아니고 예체능계열이라고 무시당할 전공자들도 이미지 인식을 위해서 배웠던 내용을 모르는 사람이 이미지 인식 전문가라니… 아마 어디 이미지 인식 코드 구해와서 몇 번 적용시키는 프로젝트했다는 거겠지???


경영학과나 공대, 의대처럼 Math 기반의 학문적 기틀을 닦지 않는 전공들의 학문적 방법론은 모두 한계가 있을 수 밖에 없다. 실험으로 귀납적 추론을 하거나, 삼단논법을 세워보거나 같은 우회적인 지식의 체계화 방법론이 있기는 하겠지만, 그 밑바탕에 ‘모델’이라고 부르는 구조를 일반화된 형태로 표현할 수 없다는 치명적인 단점을 갖는다. 이게 경제학계에서 수학 중심적인 방법론이 스토리 중심적인 방법론을 캠브리지와 SOAS 같은 변방 학교로 몰아냈던 이유이기도 하고, 정치학, 사회학, 법학 같은 학문들에서도 경제학이 했던 연구방법론을 빠르게 수용하고 있는 이유이기도 하다. 수학과가 경제학과를 비웃듯이, 경제학과가 정치/사회/법학을 비웃고 있기는 하지만.

(영국 캠브리지 같은 명문 대학이 경제학계에서 변방학교 취급받는다는 사실이 외부인들에게는 충격이겠지만, 수학 중심이 아니라 스토리 텔링 방법론을 택한 이후로 학계 주류에서 완전히 밀려난 것은 엄연한 사실이다. 생각해보니 일반인들이 모르는 이런 진실들이 참 많네.)

같은 맥락에서 수학하던 사람이 공학, 경영학을 공부하기는 쉬워도, 공학, 경영학을 하던 사람이 수학 공부하기는 매우 어려울 것이다. 경제학 대학원에서만해도 학부 경영학과 출신이라고하면 보통 4년간 PPT 그리면서 놀았다고 생각하거든.

국제정치학 전공 학생 하나가 ‘Python을 배워 본 적 있어서 데이터 사이언스는 어렵지 않을 것 같아요’라고 그랬다가 수업 시작 2주만에 도망갔던 생각나네. Python 배우는 센스같은 지능은 Math 기반의 학문용 두뇌와는 작동방식이 다르다.

위의 경영학과 대학원생의 메일 속 소회는 자기들의 학문적 도구가 가진 한계를 인지하고, 합리적인 우회로를 찾는 최적선택이라고 생각한다.

수학 전공자가 아닌 필자가 Math Finance 박사 첫 학기 수업에 수학 매니악인 교수님이 어느 논문에 Functional Theory로 재밌는 증명해놨더라고 말씀하시는 걸 듣고 1주일동안 밤을 새고 코피를 쏟아가며 학부 수학과의 함수론을 날림으로 공부했던 적이 있다. 천재들이 몇 백년간 쌓아 올린 지식의 1%도 못 배웠지만, 천재가 아닌 평범한 인간이 수학을 단기간에 공부하는 것은 불가능하다는 깨달음은 얻었었다. 덕분에 공부하는 내내 선형대수, 게임이론, 네트워크 이론 같은 좀 쉬운(?) 수학 방법론만 쓰는 타협을 했었다.

안타깝게도 저 곳에서도 지도교수의 어리석음 때문에 대학원생이 고생하고 있는 것 같은데, 저런 경우를 너무 많이봐서, 아니 필자 자신도 어느 공학도 출신의 지도교수에게 겪었던 문제라서 이젠 그냥 무덤덤하다.

국내의 어느 카드 회사 하나가 회사 내의 모든 업무를 Python으로 하겠다는 병크짓을 한다고 하던데, 그런 회사 갈 생각이 없으면 경영학과 학부생들은 괜히 Python으로 머신러닝 배운다는 이상한 학원에 몇 백만원 퍼붓지 말고, 자기 도메인의 지식을 더 쌓는게 인생에 조금이라도 더 도움이 될 것이다. 어차피 당신들이 알고 있는 수학&통계학으로 할 수 있는 모든 일들은 이미 Tableau와 SPSS같은 프로그램들이 (거의) 완전하게 지원해준다.

그 레벨에서 벗어나고 싶다고? 더 높은 레벨의 지식으로 직관을 뽑아내고 싶다고? 세상의 모든 고급 지식이 영어로 되어 있기 때문에 영어 공부를 해야된다고 그러던데, 학문의 모든 고급 지식은 수학&통계학이라는 “언어”로 표현되어 있다.

생각해보니 1달 강의만 들으면 Python으로 머신러닝 전문가 된다고 우기던 그 사기꾼들은 왜 Tableau나 SPSS같은 통계 패키지 프로그램으로 머신러닝 할 수 있다는 강의는 안 만들었을까? 아마도 그런 통계 패키지 프로그램들이 라이센스 비용을 요구했을듯? or 그 패키지들이 갖고 있는 동영상 강의보다 더 좋은 강의는 못 만드니까? or Python 예제 코드가 인터넷 상에 너무 많으니까 강의 자료 만들기가 쉬웠는데, 정작 통계 패키지로 강의자료 만드는건 자기 두뇌를 써야되니까? 근데 자기도 잘 모르니까 함부로 만들지는 못했을라나?

한 마디 덧붙이면, Excel 무시하지마라. 학부 해석개론 수업의 모든 증명을 Excel 그래프로 풀어내시는 분도 있었다. 학문은 도구가 문제가 아니라 방법론에 대한 이해가 문제일 뿐이다.


내용 추가

Tableau, Microstrategy, SPSS 등의 프로그램의 한국 홍보 담당자 분들 보시면 연락바랍니다. (admin@pabii.co.kr) 곰곰히 생각해봤는데, Excel로 데이터 사이언스하는 강의도 좋지만, 그런 우수한 통계 패키지 프로그램을 제대로 활용할 수 있는 역량있는 Data Analyst (Not Data Scientist)들을 길러내는 것도 의미가 있겠다는 생각이 드네요.

제가 타 사 재직시절 들어봤던 Tableau 수업과 크게 다르지 않은 돈&시간 아까운 강의들만 돌리고 있으실텐데, 수학&통계학을 기초 수준으로라도 이해할 수 있는 강의를 제공해야 Data Analyst들의 역량이 올라가지 않을까 싶습니다.

모든 개발언어, 플랫폼이 그렇듯이, 사용자 층이 늘어나려면 이용방법에 대한 지식이 널리 퍼져있고, 실력있는 사용자 층이 두터워야할텐데, 글로벌 시장의 좋은 패키지들이 한국에서는 제대로 활용되지 않고 있는 현실이 안타까울 뿐입니다.