본문 바로가기
블로그 이야기

네이버가 생각하는 유사문서의 기준은 무엇일까

by 멜로디박스 2013. 7. 7.


음악 블로그 개설해놓고
본의아니게 포털의 블로그 검색에 대한
관찰을 하게 되네요. 제가 블로그를 개설한 지 얼마 되지도 않아서
아마도 남들이 이야기하는 저품질 블로그가 되어버린 건 아닌가 하는 생각에
이것저것 블로그 검색에 대한 분석을 나름 하게 됩니다 ㅎㅎ

조금 전에 또 네이버에 들어가서
블로그 영역이 어떤 식으로 노출이 되고 있는지 보았는데
재밌는 사실을 또 하나 발견했습니다.



지금 시각 기준으로...
네이버에 무언가를 검색하고 나면 오른쪽 사이드바에 뜨는
핫토픽 키워드 중에 하나를 골라서 검색해보았는데요, 검색결과가 많지 않은 키워드를 고르다보니
4위에 랭크되어 있는 "정형돈 수술 묘사" 에 대한 키워드가 있더군요.
검색 후 블로그 영역을 들어가보니 총 28건의 포스트가 검색되었습니다.



맨 위에 1등으로 올라가 있는 포스트를 제외하고는
2위 부터는 키워드 매칭이 제대로 되지 않는 포스트들이 상위에 랭크되어 있습니다.
2등으로 올라있는 건 그나마 관련된 글이긴 하지만 3등부터는 완전 다른 내용의 글들이
올라와 있습니다. 그리고 검색결과를 2페이지로 넘어가보면....



그제서야 키워드 매칭이 제대로 되는 글들이 올라오기 시작합니다.
이 검색결과들은 유사문서를 제외한 상태에서 검색되는 결과들인데요
이 상태에서 유사문서 포함 기능을 켜고 보니까...



조금 전에는 2페이지로 밀려나있던 글이
3위까지 올라갔습니다. 이건 뭐 유사문서를 포함하든 하지 않든
검색 순위만 바뀌었지, 같은 글이 검색이 되고 있는데 이걸 어떻게 이해해야 할 지 모르겠네요.
유사문서라는 이름 대신에 검색순서 바꾸기 라고 대신해도 될 듯합니다.

댓글