구글 SEO 최적화가 중요한 이유 (2)

1859

지난 글이 공개되고 다양한 종류의 질문/코멘트를 받았다.

  • 어떻게 글을 대충 썼는데도 구글 SEO를 잡느냐?
  • 너무 독점하는거 아니냐?
  • 구글 1등을 기계적으로 먹기 시작하면 트래픽 어마어마하게 늘겠네
  • 그 방법 알려지면 마케터들 줄줄이 직장 잃겠네
  • Eigen-centrality라는건 뭔가?

등등

일단 몇 가지 오해를 불식시키자면, 무조건 기계적으로 구글 검색 최상단 노출이 되는건 아니다. 단지 그렇게 될 확률이 굉장히 높고, 다른 커뮤니티들보다 압도적으로 더 높을 뿐이다.

프론트엔드 개발자들 사이에 알려진 SEO 최적화를 위한 여러가지 라이브러리들이 있을 것이다. 그걸 잘 쓰면 구글에서 자기 웹사이트를 잘 잡아간다고들 하는데, 그동안 만나봤던 프론트엔드 개발자들 중에 구글 SEO의 핵심 기술인 Eigen-centrality의 개념을 아는 사람을 본 적이 없다. (그러면서 자기들은 SEO전문 개발자다. 음…)

한국에서 기술이라고 하면 알려진 개발 라이브러리 베껴서 그럴싸한 응용 프로그램 하나 만드는걸 이야기하는거 같은데, 진짜로 기술이라고 부를려면 라이브러리 안에 있는 수학 모델을 뜯어 고치는 수준은 되어야하지 않을까? (그래서 파비 블로그에서 자칭 머신러닝 전문가라는 개발자들 99%를 기술직이 아니라 기능직이라고 부르는거다. 우리 개발팀장님은 그런 개발자들을 3D개발자라고 부르신다.)

웹사이트의 검색 순위

검색 엔진의 역할이 뭘까? 마케터들이 주장하는것처럼 웹사이트 순위를 조절해주는 서비스?

아니다. 검색 엔진은 정보를 찾는 사람에게 최대한 도움이 될 정보를 최상단에 노출시켜주는 서비스다.

네이버는 그 본질을 완전히 망치고 검색 결과물을 광고판으로 만들어놨기 때문에 한국의 광고쟁이라는 사람들이 네이버가 망해야 한국 온라인 광고 시장이 살아난다고 폭언을 하는 것이다.

 

그럼 구글은 어떻게 하는데?

우리나라 웹사이트들은 기본적으로 “조회수”라는 값에 굉장히 목을 멘다. 어느 블로그 조회수가 10만을 찍었다고하면 우와~ 라고 하는데, 정작 그 조회수 10만을 만들어낸 유저가 누군지, 어디에서 왔는지에 큰 관심이 없다.

아니, 유저가 누군지 따지는 곳도 많은데요? 인스타에 광고 하나 실었더니 Like가 3,000개쯤 달려서 기분이 흡족한데, 알고보니 전부 다 동남아 사람들이 Like 누른거라면?

조회수, 유저 같은 눈에 보이는 값이 아니면 도대체 구글은 어떤 액션을 취하는가?

일단 지난 글에서 살짝 언급했던 마케터 사이의 “공식”이라는 페북에 퍼날라라, 트위터에 퍼날라라 같은 “꼼수”가 완전히 틀린 말은 아니라는걸 미리 깔아놓고 간다.

 

도대체 구글은 SEO를 어떻게 작업하는건가?

위의 네트워크 그래프를 하나 보자.

각각의 점들은 유저로 볼 수도 있고, 웹페이지로 볼 수도 있다. 그렇게 주체를 정하면 위의 네트워크는 유저간 관계도, 웹페이지간 관계도를 도식화한 그림으로 바꿔서 이해할 수 있게 된다.

그 중 다른 네트워크와 연결점이 있는 중요 포인트들은 짙은 색깔로 크게 확대가 되었고, 나머지 포인트들은 Center와의 근사치에 따라 색상이 들어가거나, 아예 회색으로 빠지거나, 회색도 큰 점이거나 작은 점이거나 등등으로 구분이 되었다.

구글SEO는 웹사이트를 저런식의 관계도 중심으로 순위를 정한다. 특정 키워드 검색어에 최우선으로 노출되고 싶으면 단순히 노출도를 높여야되는 것도 아니고, 또 우리 웹사이트 방문하는 유저 숫자를 일률적으로 늘려서 되는 것도 아니다.

우리 웹사이트를 찍고 가는 유저들이 다른 웹사이트도 방문하는데, 그 웹사이트들 간 연계관계가 지속적으로 잡혀야된다. 말을 바꾸면, 같은 정보군의 웹사이트로 인식이 되어야한다.

그렇게 네트워크의 1-2개 선상에 진입하고 난 다음에는 우리가 중간점이 될 수 있도록 해야되는데

  • 많은 정보를 갖고 있어서 웹 사이트가 중심축으로 성장하거나
  • 다른 웹사이트로 연결시켜주는 방식으로 중심축으로 성장하거나

의 선택지가 있다.

구글이 2019년 여름부터 검색어 입력시 1개 웹사이트 정보가 도배하는걸 막기 위해서 웹사이트 별 대표 페이지 하나만 보여주는걸로 정책을 바꿔서 많은 정보를 이용해서 중심축으로 성장하기도 힘들고, 무조건 베끼기만 하는 웹사이트는 처벌 대상이기 때문에 다른 웹사이트 링크만 걸어줘서도 안 된다.

한국에서 대기업들이 이런저런 목적으로 강의해달라고해서 찾아가보면 A입력하면 B된다는 케이스 스터디 보여주고 우리가 적용할 수 있는지만 가르쳐달라는 초특급 단순 솔루션을 찾는 사람들이 부지기수던데, 구글이 그런 어뷰징을 차단하기 위해 만들어 놓은 구조다.

 

Eigen-centrality란

이런 복잡한 알고리즘을 어떻게 만들었냐고?

믿을 수 없겠지만 저 로직 자체는 굉장히 간단하다.

네트워크를 행렬로 표현한다음, Eigen decomposition을 해서 Eigen value 절대값 크기에 따라 Eigen vector를 순서대로 배열하는 학부 1학년 선형대수학 작업에서 출발한다. 같은 로직을 2차 Moment 데이터 전처리에 쓰는 “주성분 분석”(PCA)이라는 걸 공부해본 자칭 “데이터 사이언티스트”도 파비 블로그에 많이 찾아올 것이다.

그렇게 재배열한 Eigen vector가 의미하는 바가 뭘까? PCA에서는 데이터가 만들어낸 N차원 공간에서 중요한 차원(?)을 잡아내주는 작업이었기 때문에 주성분(?) 분석이라고 불렸던 것이다. 웹사이트 트래픽간 연결관계를 모아놓은 네트워크에서는 어떻게 될까? 당연히 웹사이트별 트래픽 숫자 뒤에 숨어있는 주성분 or 검색어 뒤에 숨어있는 핵심적인 정보들로 구성된 Nth 축이 Eigen vector가 된다.

Eigenvector 개념에서 한발자국 더 나아가면, 내 웹사이트가 Eigen-space 안에서 얼마나 중요한지 아닌지를 뽑아낼 수 있을텐데, 그게 바로 Eigen-centrality라는 개념으로 정리된다. (정확하게는 네트워크 상에서 중심성에 대한 1개의 계산값인데, Eigen vector들을 정보성 factor 1, 2, 3… 같은 개념으로 잡아놓고나면 얼마나 정보성이 높은 vector들과 많이 overlap이 있는지에 대한 값을 수학적으로 계산할 수 있는것이다.)

학부 1학년 수학 용어가 잘 기억 안 나는 분들을 위해 풀어쓰면, 정보성이 얼마나 뛰어난지에 따라 웹사이트 노출 순위를 결정하는데, 그 값을 결정하는데 쓰는 근거 자료가 단순히 자기 웹페이지의 조회수가 아니라 검색 결과값 페이지에서 다른 웹사이트와의 관계가 긴밀한가, 복잡다난하게 얽혀있는가 등등으로 결정된다는 것이다. 파비에서는? 지금 보고 계신 블로그가 지난 3년간 구글 트래픽으로 쌓아온 값을 그 네트워크 진입에 활용했다. 블로그가 그동안 쌓아온 값들을 앵커로 삼아 파비캐시 커뮤니티 페이지같은 우리회사 다른 웹페이지들의 SEO 순위를 끌어올리는데 활용하고 있다. (어뷰징 하는거 아니니까 오해 ㄴㄴ)

 

마케터들 사이에 알려진

  • 트렌드 키워드 넣어서 글 써라,
  • 글 쓰자마자 최대한 많은 곳에 퍼뜨려라,
  • 내용을 꾸준히 더 추가해라

등등이 그런 논리와 맞물려 있기 때문에 틀린 접근법은 아니라고 했던 이 글 첫머리를 다시 상기해보자.

트렌드 키워드를 넣어서 글을 쓰면 다른 사람들이 찾아와서 볼 확률이 높아지는데 그 분들이 검색어로 찾았던 페이지들과 같은 Line에 진입하게 된다. 네트워크에 진입이다. 글 쓰자마자 최대한 많은 곳에 퍼뜨리면 우리 웹페이지 들어오는 사람들이 다른 곳도 찍고 있었으니까 복잡다난하게 얽히는 네트워크 속에서 트래픽이 몰리는 웹사이트로 인식 된다. 중심성이 팍~ 올라간다. 그런데 이슈성이 빠지면 트래픽이 팍~ 줄어들테니까 조금씩 트렌드에 맞는 키워드로 변경해서 계속해서 사람들이 들어오도록 만들어라는거다.

 

파비캐시에서는 어떻게 했냐?

당연하지만 기업비밀이다. 저런 정보들을 잘 알고 그에 맞춰 시스템을 만들어 놨을뿐이다. Eigen-centrality를 이해했다면 파비 블로그가 앵커가 됐다는 정보만으로도 충분히 어떤 작업을 했을지 감을 잡으실거라고 믿는다.

(구글 SEO에서 1등할 수 있도록 자기네 웹사이트 만들어주면 몇 천만원 주겠다는 연락 좀 받았는데, 날 단순히 웹페이지 만들어주는 IT기술자기능인 취급하는 것 같아서 기분이 좀 나빴다.)

바이럴 마케터 한 분이 회사 면접을 보던 중에

파비캐시에서 무조건 1등 노출되면 구글 노출 담당하는 바이럴 마케터는 더더욱 없어지겠습니다.

라고 하시더라. (글쎄? 큰 효과가 있을지 잘 모르겠는데?? ㅋㅋㅋ)

그렇게 생각하지말고 다른 웹페이지들도 Eigen-centrality 공부해서 자기네 웹페이지를 구글SEO에 맞춰 고치면 안 될까?

 


2020년 4월 25일 추가

응원해주시는 분들 덕분에 저희 파비캐시가 구글 플레이 스토어에서 캐시 검색어 기준 20위 안에 들어가게 되었습니다. (제보해주신 김X재님 감사드립니다)

많은 성원에 감사드리고, 더 나은 서비스를 제공해 드릴 수 있도록 고민하고 노력하겠습니다.