수학 베이스 전혀 없는 컴공 출신이 지금 머신러닝을 어떤 곳에서 배우는 중입니다

4142

아래의 메일이 왔습니다. 서XX님 마음을 담은 메일에 감사드리고, 파비블로그 방문자 분들께 조금이나마 도움이 되었으면 해서 메일의 일부와 제 답변, 그리고 메일 읽으며 생각했던 내용을 공유합니다.


반갑습니다. 그리고 이 한국 사회에서 홀로 대한민국의 미래를 위해 고군분투하시는 모습에 경의를 표합니다.

우선 저의 소개를 하자면 컴공과 나와서 C#프로그램 개발 조금하다가 그만두고, 코로나 땜시 놀고 있따가 우연히 인터넷 검색을 통해서 무려 우리나라의 과기부가 장작 6개월동안 천만원이 넘는 돈을 들여서 혁신 인재를 키우겠다는 야심찬 프로그램들중 하나인 빅데이터 교육 과정을 듣고 있는 수강생입니다.

누가 그랬던가요? 수학은 고등학교 때까지만 대학가기 위해 하는 공부고, 그 이후에는 평생 쓸 일 없다. 덧셈 뺄셈 곱셈만 할 줄 알면 된다ㅜㅜ 사회 나와보니 알겠더라구요. 온세상이 수학으로 뒤덮여 있는데…사교육 시장을 봐도 온갖 기상천외한 영어강의는 넘처나지만 수학은 찬밥입니다.(참고로 저는 자식 낳으면 영어 때려치우고 수학 몰빵 시킬겁니다..)

사람들은 왜 우리나라는 노벨상 하나 못받냐고 하는데…글쎄요… 너무 당연한 것 아닌지 모르겠습니다.

뭐 어쨋든 잡설이 길었는데 다시 본론으로 들어와서 수학의 중요성을 알기에 빅데이터? 머신러닝? 이거 6개월 과정으로 되나? 여기저기 알아보니(근데 솔찍히 구글링 해봐도 한글로된 Website에서는 정확한 정보를 얻기 힘들더군요) 통계학 기초 정도 지식만 있으면 IT계열 개발자가 배우기에 무리가 없다는 소리에 낚여서 덜컥 수업을 듣게 되었고

지금 1달이 지났네요…

처음 시작하고 1달동안 수업들으면서 혼란스러웠던 것이 이게 도대체가…뭘 하자는 건지 갈피를 못잡겠더군요…빅데이터의 구성요소 = 3V 볼륨 어쩌고 저쩌고 부터 시작해서 파이썬이랑 R이랑 해야 한다고, 통계적 분석을 해야 한다고, 애기 걸음마 수준의 데이터 프레임 하나가지고, summary()함수 한번 써보세요. 평균값 메디안 값 나오져? 사분위수가 어쩌구 저쩌구~이번엔 박스플롯 한번 그려보시구요, 결측치라고 있는데 이거는 변수의 평균값 넣어 주시면되여. 아참 평균값 구하는 함수 mean()인거 아시져?

이런거 하다가 이제 머신러닝이랍시고 배우는데 그냥 함수한줄 짜리에 input데이터 넣어서 정확도 나오면 그거 가지고 아쉽게 70프로가 나왔네요. 데이터 전처리에 조금 더 공을 들이면 80은 나올 수 있습니다. 이러고 그냥 넘어가고 있습니다. 머신러닝 라이브러리에 input데이터를 파라미터로 넘겨서 이 결과를 들고, 장님 코끼리 다리 더듬듯이 아무런 원칙도 없이 이것저것 데이터를 만지는…이게 정말 머신러닝인가? 이정도 수준을 가지고 온 세상이 그렇게 호들갑을 떨고 있나? 싶었습니다.

너무 회의감이 들어서 틈만 나면 구글에 머신러닝이 뭔지 ‘머신러닝 현실‘,’ 머신러닝 미래‘ 이런 키워드로 검색을 하다가 우연히 파비클래스 싸이트에서 작금의 우리나라 현실에 대해서 엄청난 비판을 하고 계시는 모습을 보고 저도 극히 공감하여 이렇게 메일을 쓰게 되었습니다.

저는 수학적 기반도 전무하고, 머신러닝 지식도 없지만, 파비블로그에 올리신 글을 읽어보니 비로소 데이터든 머신러닝이든 이쪽을 업으로 하는 사람이 나아가야 할 방향성이 보였습니다. 아주 수학적으로 똘똘 뭉친 모델들이 우리의 삶에 많이 녹아 있어, 이런 모델들을 꿰뚫어 볼 수 있는 통찰력이 있어야 하고, 어떤 문제가 주어졌을 때는 그에 맞는 적합한 모델을 만들어 낼 수 있는 사람이어야 겠더군요.

여기서 제가 여쭙고 싶은 것이 하나 있습니다. 네, 저는 컴공 공대생입니다. 미분이라하면 ‘잘게 쪼갠다’ ‘함수의 기울기다’ ‘x^2미분하면 2x다’ 이정도 밖에 모르고 선형대수 통계학 모릅니다. 이런 저 같은 사람일지라도 누군가 만들어 놓은 머신러닝 라이브러리를 가지고(이런 경우에는 이런 머신러닝 함수를 쓰면 좋다정도의 지식만 가지고 있는)밥벌이 할만한 가치 있는 일자리가 있을까요?

즉, 이정도 수준으로 머신러닝을 다루는 사람도 필요한 일자리가 있을까요?

긴 글 읽어주셔서 너무 감사하고, 많은 인재들이 Keith Lee님의 글을 읽고, 우리나라도 소프트웨어 강국이 되었으면 좋겠습니다.


좋은 글 감사합니다

비슷한 개발자들이 시장에 많은데, 저희 회사에는 필요가 없는 인력입니다. 차라리 아무것도 모른다는 걸 인정하고, 억지쓰며 월급 더 달라고 우기지 않고, 시키는대로 프로그래밍하는 분이 더 낫습니다. Neural Net이 더 좋다고 바득바득 우기는 사람을 깨우치는데는 상당한 정신력이 소모됩니다. 보통은 교육이 제대로 안 될 확률이 높습니다. 억지로라도 교육을 시켜서 바로잡아놔봐야 어차피 결과물은 동일하고, 업무 지시사항 전달하는데 걸리는 시간도 동일합니다. 교육 비용이 더 들었을 뿐이죠. 서버 개발자로 뽑았는데 자기는 인공지능 개발자라고 연봉 더 달라고 징징대는데 정작 Regression 하나 제대로 이해 못하면서 DNN 노래만 부르던 분께 한번 당해보고는 다시는 겉 멋 잔뜩 들어간 개발자 안 뽑습니다. 개발자 이력서에 머신러닝, 인공지능 같은 단어 적혀 있으면 서류 전형 탈락입니다. 기본기 안 쌓고 남의 코드 베껴만든게 자기 성과물인줄 아는 겉멋만 들었거나, 기본기가 중요하다는 걸 인지 못하는 개발자일 확률이 매우 높다는 걸 경험적으로 깨달았기 때문입니다.

차라리 프로그래머로 더 성장하시는 방향을 잡는걸 권유드립니다. 예를 들면 저희는 내년 여름쯤에 C로 저희 백만 트래픽 감당 서버 (RTB)를 다시 만드는 계획을 짜놨습니다. 지금 짜놓은 서버에 앞으로 1년간의 경험치를 더해서 하드웨어를 직접 컨트롤 할 수 있는 언어로 가장 효율적인 시스템을 만들어 보려고 합니다. 앞으로 1년간 어떤 커리어를 쌓으시느냐에 따라 1년 후에 저희 회사에서 꼭 필요한 엔지니어가 되실 수도 있습니다. 사이언티스트가 아니라요. Data Science 하시기에는 너무 먼 길을 돌아가셔야 됩니다. 짝퉁 Data Science 하실게 아니라면요.

여담으로.. 석박이라는 사람들까지 포함해서 3년 정도 데이터 사이언스 강의해보니 우리나라는 수학을 못해서 (산수만 잘해서) 소프트웨어 강국이 되기는 힘들 것 같습니다. 교육을 다 뜯어고쳐도 앞으로 20년은 더 걸릴 것 같구요.


요즈마 그룹이라는 이스라엘계 VC업체 하나가 한국에 진출하면서 언론 플레이를 한 기사 하나를 봤다.

요즈마 그룹에서 한국 회사들의 기업가치가 지나치게 저평가 되어 있다고 언론 플레이 하는데에 현혹되지 말라고, 사실은 우리가 능력이 부족한거라고 지적해주려고 한 적이 있었는데, 저 위의 어느 개발자 분의 하소연(?)이 딱 정답이 될 것 같다.

아마 요즈마 그룹 본사의 이스라엘 분들은 한국의 개발팀이 뭔가 만들어내면 그걸 Library를 써서 갖다 붙였다고 생각하지 않고, 자기들 머리로 수학적인 알고리즘을 만들어 냈을 것이라고 생각할 것이다. 그 나라는 그렇게 수학 교육을 엄청시킨 엘리트들을 양성해내는 나라니까. 심지어 팔레스타인과의 협상을 풀기 위해서 게임이론 전문가인 NYU 교수에게 자문을 구하고 (그걸 이해해서) 그 논리대로 협상을 진척시키는 인재가 외교팀에 있는 나라다. LSE시절 경제학 석사 같이 했던 친구가 딱 그 자리에서 일하고 있다. 참고로, 그 친구는 우리 스터디 그룹에서 미시경제학 (게임이론이 핵심인 가장 수학적인 경제학 과목) 솔루션 만드는 책임자였다. (필자는 계량경제학 책임자였다…)

한국처럼 국제정치학 교과서 달달외우고 외무고시 합격해서, 영어 잘해서 뽑아주는게 아니더라ㅋㅋ (범생이 샌님들…)

유학 중 만났던 이스라엘 출신들은 하나같이 천재들이었다. 한국은 산수만 잘하고 백인 애들은 수학 논리만 좋다고 폄하할 수 있는데, 이스라엘 애들은 두 인종의 장점이 결합된 애들 투성이더라. 중국의 15억 인구에서 뽑혀온 10명보다 인구 9백만도 안 되는 작은 나라에서 뽑혀온 3명의 성과가 훨씬 더 나았다.

근데, 그런 애들이 거기선 대부분 엔지니어가 된다. iBanker라는 최고액 연봉 직장을 그만두고 유학가서 받았던 연봉을 불러주니 이스라엘 애들이 그러더라. 이스라엘에선 탑스쿨 졸업한 엔지니어들이 그정도 받는거 같다고.

한국은? 우리 개발팀장님께서 3D개발자라고 부르는 분들이 대다수인 시장이 개발자 인력시장이다. 물론 실력 뛰어나신 개발자 분들이 곳곳에 숨어있지만, 한국에서 뭔가 개발됐다고 했을 때, 이걸 Library 갖다 붙여서 만든거라고 생각해야지, 그 밑바탕에 깔려있는 수학을 이해해서 만들었다고 생각하면 안 되는 Lemon Market이다.

한국사회에서 경제학은 문과충이라고 무시당하겠지만, 경제학 석박 과정은 사실상 응용수학 프로그램이고, 그런 수학적 직관이 엄청난 게임이론 전공자를 외교팀 협상 담당자로 배정할 수 있을만큼 사회 시스템 전체가 수학의 응용에 대한 이해가 탄탄한 이스라엘과 한국을 비교하려니 참 부끄럽다. 우리나라는 수학은 고등학교 때까지만 공부하면 되는 과목이지만, 저런 나라들은 수학을 못하면 엘리트 사회에서 살아남기는 커녕 진입 자체가 불가능하다.

지난 몇 년 사이에 한국 기술(기능말고 기술)을 팔아 글로벌 시장에서 돈벌이를 한 회사 이름을 하나만 들어봐라.

안랩? 한컴? 미안하지만 정부가 공식적으로 지원하지 않으면 기술력으로는 글로벌 시장 경쟁력이 없는 회사다. 아니 이만큼이라도 경쟁해주시는데 되려 감사하고 싶다. 다른 회사들은 이름 올릴 생각조차 안 드니까.

그럼 코로나 진단 킷 팔았지 않냐고? 업계 사람들은 알겠지만 그런 리트머스 시험지 같은 진단 킷은 기술력이 아니라 기능력의 결과물이다.

기능력도 없는 나라가 압도적인 다수니까 한국인이라는 ‘국뽕’ 맞고 살기는 하지만, 그래도 항상 아쉽다. 저런 교육에 1인당 6개월 천만원 쓰지말고, 차라리 수학과, 통계학과, 물리학과 대학원에 조금만 더 지원금을 줘도 지금보다 훨씬 더 기술경쟁력이 있는 나라가 될텐데. 그저 눈 앞의 취업률만 생각하는 민주주의 정부 시스템이란…

이런 시장임에도 데이터 사이언스 제대로 배우겠다는 일념으로 광고비 한 푼 안 쓰는 파비클래스 강의 찾아와주시는 분께 존경심을 표하고 싶다.


이 글이 크롬 추천 글로 떠 있다는 지인 제보를 받았습니다. 아마 크롬 컨텐츠 담당자 분이 저희 파비블로그를 자주 염탐(?)하시니까 생긴 일일것 같은데, 꾸준히 찾아와서 눈팅하고 글 골라주셔서 감사드리고, 글 읽으시는 분들은 제목만보고 수학 못해도 머신러닝 할 수 있다고 착각하지는 말았으면 합니다.

그나저나 1boon, Yahoo, CNN, Fox Business 같은 컨텐츠들이랑 같은 레벨로 실리니까 괜히 우쭐해지네요. 하나도 아니고 두개씩이나 한꺼번에ㅋㅋㅋ 좌측 글 링크 공유합니다

AI스타트업의 흔한 테크트리