한국에서 본 데이터 사이언티스트 채용 공고

0
988

얼마전에 우연히 국내 유명 IT회사의 데이터 사이언티스트 채용 공고를 봤다.

 

위의 내용은 어디서나 다 찾을 수 있을지 모르겠지만, 다음 중 하나의 논문을 읽고 설명할 수 있는 능력을 요구하는 부분에서 요구 수준이 얼마나 높은지 쉽게 확인할 수 있겠더라.

링크: 논문1, 논문2, 논문3, 논문4, 논문5, 논문6

참고로 위의 6개 논문 중 4번째 논문은 필자의 데이터 사이언스 기본 강좌 마지막 부분에서 짧게 다루고 있고, 모델링 강좌에서는 그 논문에서 쓰는 모델의 배경지식까지 두루두루 훑어본다. (논문에 대한 기본적인 설명은 논문 리뷰 포스팅 참조) 기본 강좌 중에는 저 논문의 모든 내용을 다 볼 수는 없고, Display advertising에서 최상위 IT 회사들이 쓰는 모델이 사실은 Logit이라는 점, 그 앞 수업까지 고생하면서 배운 개념들을 모두 저 논문에서 활용하고 있다는 점을 꼭꼭 짚어내면서 이런 방식의 모델링으로 활용된다는 점을 강조한다. 보통 머신러닝을 배운다, 딥러닝을 배운다고 하는 사람들이 Neural network를 무겁게 돌리기만하면 다 되는 것처럼 착각하는 경우가 많고, 수업에 오신 분들도 “나는 Neural net만 배우고 싶은데 왜 Logit, SVM, Ensemble, PCA 같은 모델을 다 배워야하냐”고 의문점을 가지는 경우가 많다. 그런 의문이 수업 후반부에 Neural net 배우는 시점에 많이 풀릴 것이고, 마지막 날 저 논문을 살펴보는 시점에 데이터를 어떻게 처리해서 어떤 방식으로 모델을 만든다는 큰 그림이 같이 그려질 것이라고 생각하고 수업을 했는데, 많이들 공감해주셨을까?

그동안 코더 위주의 시장 구성, 코딩으로 이걸 해결할 수 있는 것처럼 홍보하는 IT학원들의 강의에 대한 강한 불만을 계속 표현했었는데, 이런 포스팅이 올라오는걸 보면 이제 코더 수준인 개발자들이 포기하고 나가떨어지지 않을까 싶다. 논문4를 일부만이라도 리뷰하는 수업을 들은 수강생 분들 상당수가 공감하시겠지만, 어지간한 학부 전공 수준으로는 저 논문들을 따라가기가 쉽지 않기 때문이다. 필자가 비슷한 채용을 진행한다면, 저 위에 있는 논문 2개 정도를 PPT로 정리해서 발표하게 하고, 1개 정도는 직접 코드로 쳐서 reproduce할 수 있는 능력이 있는지 테스트해볼텐데, 그게 박사시절 평소에 했던 공부와 크게 다르지 않다. 실용 논문이니 약간 관점이 달라서 수학적으로 어떤 부분이 부족하고, 어떤 Challenge를 회피하려는 꼼수를 썼고… 같은 부분을 지적하는 스텝만 빼면 충분히 괜찮은 면접이 될 것 같다.

그동안 계속 개발자들이 Python만 잘하면 데이터 사이언티스트 되는거냐, 코딩 경력이 10년이 넘어서 어떤 플랫폼도 쉽게 적응할 수 있다는 어조로 데이터 사이언티스트가 되고 싶다는 메일을 보낼 때마다 길게 설명해주는 답변하기 불편했는데, 앞으로는 딱 이 포스팅 링크를 보내고 끝내려고 한다. 왜 TensorFlow로 이미지 인식하는 코드 예제만 몇 십개씩 보여주는 수업은 안 하냐, 그런 예제 위주의 수업을 듣고 싶다고 하는 몇몇 분들께도 같은 대답을 드릴까 한다. TensorFlow 같은 오픈소스용 코딩 라이브러리가 Data Scientist용 지식이 아니라, 저런 추천 알고리즘을 연구/개발하는 자리가 딱 Data Scientist가 갈 자리고, 그런 자리를 가고 싶으시다면 수학, 통계학으로 탄탄한 실력을 쌓으셔야한다고.

저 위의 구인 공고는 수학 & 통계학 수업부터 데이터 사이언스 기본 강좌모델링 강좌로 이어지는 필자의 수업이 제대로 된 궤도로 가고 있다는 증거물임과 동시에, 한국 시장이 지난 몇 년 사이에 엄청나게 많이 성숙했다는 뜻이기도 할 것이다. 그동안 코더들이 이걸 할 수 있는 것처럼 믿고 있는 답답한 분들 때문에 기업 미팅이 힘들었던 적이 많았는데, 저 잡 포스팅을 보니 속이 시원해지더라.

다음달인 11월부터 내년 3월까지 매달 남은 논문 5개를 하나씩 블로그에 리뷰해본다. 블로그에서 수학과 통계학을 다룰 수 있는 깊이에 한계가 있기 때문에 제대로 배우고 싶으시다면 데이터 사이언스 기본강좌를 거쳐 모델링 강좌에 오시면 될 것 같다.