네이버 서치어드바이저

네이버 서치어드바이저 제대로 알기

검색엔진 최적화의 목적

네이버 웹마스터도구

웹 상에는 수 많은 웹사이트가 존재하며, 모든 검색엔진은 이 웹사이트 정보를 수집하고 검색에 노출해주는 수집 로봇을 가지고 있다. 그리고 한국의 공룡 포털인 네이버에는 예티(Yeti)라는 검색 로봇이 있다. 웹 표준을 준수해 제작된 사이트로 신뢰할 수 있고, 많은 사람이 방문하는 곳이거나 많은 사람이 인용한다면 예티가 더 빨리 알아차릴수 있다. 하지만, 신규 사이트는 활성화되지 않았기 때문에 찾아내기까지 많은 시간이 필요하다. 그럼, 알려주면 되지 않을까? 예티가 찾아내길 기다리지 않고, 알려줘보자. 이 검색엔진 최적화 작업은 사이트 내 콘텐츠 정보를 검색엔진이 잘 이해할 수 있도록 정리하는 작업으로 콘텐츠의 내용을 명확하게 네이버 검색엔진에게 전달해 내 콘텐츠가 네이버의 검색 결과에 누락되지 않도록 한다. 아래는 네이버에서 볼 수 있는 가이드 중 내가 기억해야할 일부를 정리한다. 원본은 네이버 서치어드바이저 사이트에서 볼 수 있다.

1. 웹마스터도구에 내 사이트를 등록하고 소유 확인

사이트 등록은 호스트 단위만 지원하며, 소유 확인은 HTML의 meta 태그를 활용하는 방법 혹은 HTML 파일 업로드를 통해서 진행할 수 있다. 나는 head에 메타태그 삽입하는 방법으로 진행했다.

사이트소유확인

2. 네이버 검색로봇이 사이트에 접근할 수 있도록 허용

사이트의 문서에 네이버 검색로봇의 접근이 가능하게 하려면 robots.txt를 아래처럼 설정해야한다. 이 블로그는 지킬을 이용했다. 그래서 내 블로그 폴더 안에 robots.txt 파일을 생성하고 아래 내용을 입력하고 저장한다. robots.txt에 대한 자세한 설명은 robots.txt 설정하기를 참고하면 된다.

검색로봇예티

(예) 모든 검색엔진의 로봇에 대하여 접근 가능하게 설정

User-agent: Yeti
Allow: /

Sitemap: https://thisisthereason.com/sitemap.xml

(예) 네이버 검색로봇만 접근 가능하게 설정

User-agent: Yeti
Allow: /

3. 중복된 콘텐츠가 있는지 확인

검색 노출량을 늘이기 위하여 동일한 콘텐츠로 구성된 여러 개의 사이트를 개설하는 경우 검색 노출에 불이익을 받을 수 있다. 무료 이미지 공유 사이트인 픽사베이의 이미지보다 내가 폰 카메라로 대충 찍은 사진이 더 좋은 콘텐츠로 분류된다. 유일한 콘텐츠고, 중복이 아니기 때문이다. 또, 모든 페이지의 제목을 동일하게 쓰지 말라고 권고한다. 페이지의 제목은 콘텐츠 주제를 정확하게 설명할 수 있는 문구로 써야하며, 더 자세한 내용은 HTML 마크업 가이드를 참고하면 된다.

4. 웹마스터도구에 사이트맵 및 RSS

사이트맵은 사이트 내의 수집 대상 URL 목록을 담은 XML 형식의 파일로 웹마스터도구의 “요청-사이트맵 제출” 메뉴에서 XML 형식의 사이트맵을 제출할 수 있다. 사이트 내의 최신글은 본문 전체를 포함하여 RSS 피드에 담아야 하며, 웹마스터도구의 “요청-RSS 제출” 메뉴에서 RSS 피드를 제출하면 된다. RSS 피드와 사이트 맵을 아톰에서 추가했고, 네이버에는 URL로 제출했다.

5. 웹마스터도구에 채널 등록 - 연관채널

채널은 네이버 블로그, 카페, 페이스북, 인스타그램 등 운영하고 있는 소셜 미디어의 계정으로 일반적으로 쇼핑몰 등의 사이트를 검색했을 때 하단에 연관채널이라고 나와 있는 부분이다. Microdata 형식과 JSON-LD 형식으로 구현할 수 있다. <head>…</head>에 넣어주면 된다. 아래는 내가 잘 이용하는 쿠팡 JSON-LD 예시.

쿠팡연관채널

<script type="application/ld+json">
{
 "@context": "http://schema.org",
 "@type": "Person",
 "name": "쿠팡",
 "url": "https://www.coupang.com",
 "sameAs": [
   "https://tv.naver.com/coupangtv",
   "https://www.instagram.com/coupang",
   "https://www.facebook.com/Coupang.korea"
   "https://story.kakao.com/ch/coupang"
 ]
}

6. 네이버 검색 결과 확인

네이버의 검색로봇이 방문한 뒤 최대 1주일 이내에 사이트의 콘텐츠가 검색에 반영되며, 네이버 검색창에 사이트명을 입력해 확인할 수 있다. 추가로 웹마스터도구에서 제공하는 콘텐츠 노출 및 클릭 리포트를 활용하여 본인이 등록한 웹사이트가 네이버 검색 결과에 얼마나 노출되고 클릭 되었는지 성과를 확인해보자. 사이트의 메인 페이지가 검색 노출이 안되는 경우에는 내 사이트가 네이버 검색로봇의 접근을 허용하고 있는지 robots.txt 와 방화벽 설정을 다시 한번 확인하자. 메인 페이지의 meta 태그에 noindex 처리가 되어있다면 해제해야한다. noindex가 표기된 페이지는 검색 반영에서 제외된다.

<meta name="robots" content="noindex">

사이트 제목과 설명은 검색엔진에서 엄격하게 관리하고 있으므로 정책에 위반되는 항목이 없는지 HTML 마크업 가이드를 다시한번 참고하고, 사이트 메인 페이지의 정보를 HTML frame 태그로 감싸고 있는지 체크해보자. frame 태그가 일으키는 문제로 인하여 사이트 메인 페이지와 같은 중요한 페이지에는 frame 태그 대신 일반 HTML 태그를 사용하는 것을 권장한다.

7. 사이트의 콘텐츠가 검색에 반영이 안된다면

페이지의 meta 태그에 noindex 처리가 되어있다면 해제. noindex가 표기된 페이지는 검색 반영에서 제외된다. 페이지 내의 모든 콘텐츠가 자바스크립트로 로딩되는 구조인지 확인해야한다. 대부분의 검색엔진은 표준 HTML 마크업을 사용하여 콘텐츠를 제공하는 것을 권장한다. 페이지 내의 모든 콘텐츠를 HTML frame 태그로 감싸고 있는지 확인하자. 페이지의 중요한 콘텐츠는 frame 태그 대신 일반 HTML 태그를 사용하는 것을 권장한다. 페이지 로딩 시 자바스크립트 사용하여 redirect 되는지 확인하자. 가급적 HTTP redirect 또는 HTML의 head 태그 내 meta refresh를 활용하는 것을 권장한다.

8. 네이버 검색 결과에 반영되는 문서 수가 적다면 페이지 내 링크 확인

웹마스터도구에 제출된 사이트맵 및 RSS 가 올바르게 표기되었는지 확인하자. 특히, 제출된 사이트맵 및 RSS 내의 링크가 상대 경로로 지정되어 있는 경우, 링크의 호스트가 등록된 사이트와 일치하지 않는 경우 수집을 진행하지 않는다. 페이지의 meta 태그에 nofollow 처리가 되어있다면 해제해야한다. nofollow가 표기된 페이지의 경우 페이지 내 링크 수집을 진행하지 않는다.

<meta name="robots" content="nofollow">

페이지들의 링크 처리 시 자바스크립트만을 사용하면, 검색로봇이 어떤 URL 인지 정확하게 파악할 수 없어서 이후의 다른 좋은 정보들을 찾아갈 수 없는 문제가 있다. 네이버의 예티에게 내 사이트 내부 페이지를 잘 알려주기 위해서는 표준에 맞는 링크 URL정보를 제공하는 것을 권장한다.

<a href="http://www.A.com">Link</a>

해당 링크가 어떤 URL 인지 정확하게 확인할 수 있음

<span onClick="javascript:goto(A)">Link</span>

대상 링크가 자바스크립트 함수로만 표현되어 있어서 검색로봇은 해당 링크의 정확한 URL을 파악할 수 없음

네이버가 권장하는 좋은 콘텐츠

네이버 검색에서는 어떤 글이 잘 노출되고 어떤 글은 잘 노출되지 않는다. 네이버 카페나 블로그에 떠돌아 다니는 다양한 글들과 바이럴 업체에게 들었던 이야기는 지금 사용하지 않더라도 몇 년 전에 만든 블로그가 훨씬 더 가치가 있고, 신규 블로그보다 상위노출이 쉽다는 이야기를 들었다. (진짜인지는 모르겠다.) 네이버가 생각하는 블로그의 좋은 문서와 나쁜 문서는 어떤 기준으로 분류되고 있는지 정확하게 알아두자. 그리고 검색어를 고려한 글쓰기를 시작해보자.

네이버 검색이 생각하는 좋은 블로그 콘텐츠

신뢰할 수 있는 정보를 기반으로 작성한 글
물품이나 장소 등에 대해 본인이 직접 경험하여 작성한 후기
다른 문서를 복사하거나 짜깁기 하지 않고 독자적인 정보로서의 가치를 지닌 글
해당주제에 대해 도움이 될 만한 충분하 길이의 정보와 분석내용을 포함한 글
읽는 사람이 북마크하거나 친구에게 공유/추천하고 싶은 글
네이버 랭킹 로직을 생각하면서 작성한 것이 아닌 글을 읽는 사람을 생각하며 작성한 문서
글을 읽는 사용자가 쉽게 읽고 이해할 수 있게 작성한 문서

옛날에는 블로그와 같이 자신의 글을 공유하는 것은 해당 분야의 전문가가 남기는 글이 대부분이어서 읽는 재미도 있었고, 신뢰할 수 있었는데 블로그가 돈이 되면서, 또 내 지식이 아니어도 쉽게 복사하고 공유할 수 있는 디지털 세상이다보니 많은 사람이 콘텐츠생산자로 변했다. 누구나 쉽게 자신의 생각을 공유할 수 있다보니 가짜 정보가 늘어나고, 교묘하게 사실을 기반으로 약간의 거짓을 섞어 알아보지 못하는 경우도 많다. 네이버는 이러한 정보를 꾸준히 걸러내려고 노력하고 있는 것 같지만, 아직까지는 네이버 바이럴 업체가 상위노출을 할 수 있는 마케팅 담당자 입장에서는 좋은(?) 포털이기도 하다. 내가 마케팅한 제품명이 제목과 썸네일에 버젓이 들어가 있는데 클릭해서 들어가보면 다른 제품인 경우도 있었다. 한 줄 정리를 해보자면 네이버 블로그에 원하는 콘텐츠는 사진과 글 모두 내가 생산해 냈고, 신뢰할 수 있는 출처를 기반으로 한 정보성 글이어서 보는이에게 도움된다면 최고라는 이야기다.

네이버 검색이 생각하는 나쁜 콘텐츠

음란성, 반사회성, 자살, 도박 등 불법적인 내용을 다루거나 불법 사이트로 접근을 유도하는 문서
피싱이나 악성 소프트웨어가 깔리는 등 사용자에게 피해를 줄 수 있는 문서/사이트
기존 문서 짜깁기하거나 의도적으로 키워드를 추가
사람의 개입 없이 번역기를 사용하여 생성한 문서
검색 엔진의 내용과 실제 방문이 전혀 다른 클로킹 문서/사이트
폰트 크기를 0으로 하거나 색을 흰색으로 하거나 글 접기 기능으로 키워드를 숨겨놓은 문서
위젯이나 스크립트를 사용해 사용자를 강제로 이동시키는 강제 리다이렉트
사용자의 검색의도에 반하는 낚시성 문서
블로그/뉴스/게시판/트위터 기타 웹페이지 내용을 단순 복사한 문서
동일한 내용을 여러 블로그에 중복해서 생성하는 문서
여러 ID를 사용하여 댓글을 작성해 인기가 높은 것처럼 보이도록 조작하는 경우
검색 상위 노출을 위해 제목이나 본문에 의도적으로 키워드를 반복하여 작성한 문서
상품이나 서비스에 대한 거짓 경험담으로 사용자를 속이는 문서

네이버 검색이 생각하는 유해문서가 어떤 건지에 대한 정리가 매우 잘 되어 있다. 하지만 위에 있는 나쁜 콘텐츠가 그래서 노출이 안되냐고 한다면, 그건 아니다. 네이버 블로그에 잘못들어갔다가 컴퓨터가 악성코드가 설치되는 바람에 아주 귀찮아 진 적이 있어서 한동안은 모르는 블로그는 접속조차 하지 않았던 때가 있었다. 지금은 그런 곳은 거의 없어진 걸 보면 네이버도 열일하고 있는 것 같긴 하지만. 그 외에 비즈니스를 위한 블로그의 경우 네이버가 발견하지 못하게 교모하게 활동하는 바이럴 업체들은 더욱 늘었고, 여전히 성업중이다.

검색어를 고려한 블로그 글쓰기

블로그글쓰기

검색 결과에 나오려면 검색 사용자가 입력한 검색어가 문서의 제목이나 본문에 포함되어야 하니, 의도적으로 특정 검색어를 제목이나 본문에 삽입하는 경우를 흔히 볼 수 있다. 하지만 단순히 검색어를 글에 넣는다고 검색 결과에 잘 나오는 것은 아니다.

동일한 단어를 포함한 수천, 수만 개의 문서 중에서 어떤 문서는 먼저 검색되고, 또 어떤 문서는 나중에 검색된다. “네이버는 검색 사용자의 선호도를 기반으로 한 랭킹 알고리즘을 사용하여 검색 사용자의 의도를 가장 잘 반영한 문서가 먼저 검색되게 하고 있다.”고 하지만, 아직까지는 제대로 걸러지지 않으니까 노력하는 중 이라고 할까. 점점 더 좋아지고 있는 것은 사실이니까. 예전에는 네이버에 검색하면 딱 봐도 노출하고 싶어서 발악한 흔적으로 제목에 같은 단어가 여러번 반복되었는데, 이제는 아래와 같은 게시물이 상위에 뜨지 않는다.

수분크림

아마도 ‘수분크림추천’이나 ‘수분크림후기’를 검색했을 때 검색 결과에 나오게 하려고 이렇게 제목과 내용에 관련 검색어를 반복 사용한 것이겠지만, 인위적인 검색어를 넣어 작성된 문서는 검색 사용자의 클릭이 떨어지기 마련이고, 검색 랭킹 로직에 의해서 검색 결과에서도 자연스럽게 후순위로 밀려난다. 제목은 글의 내용을 대표할 수 있는 명확하고 간결한 것이 좋다. 내 생각이지만, 부동산과 인테리어와 같이 온라인으로 끝나지 않고, 오프라인과 연결되는 업종인 경우 제목에 지역을 넣는 게시물이 많다. 아무래도 지역을 넣어서 검색하는 경우가 많기 때문이고, 제목에 길~게 들어가 있어도 지역기반인 경우 선택권 없이 클릭하게 되는 그런 게시물이니까. “유리문 전용 번호키 설치 광장동 열시 성수동 열쇠 광진구 열쇠 자양동 열쇠 구의동 열쇠 출장 수리” 이런식으로. 이제는 출장 가능지역으로 구분해 놓긴했지만, 생각보다 사람들은 텍스트를 꼼꼼히 읽지 않아서 문의를 받는 경우도 많겠다는 생각이든다.

블로그 포스트 제목은 분명 ‘인천 어린이 박물관’과 ‘인천 아이와 갈만한 곳’이고, 실제 내용도 박물관 정보지만, 글의 내용과 상관없는 미용실 업체명이 제목에 포함되어 있다는 점이고, 보통은 직접 찍은 사진은 없고, 박물관 홈페이지 내용을 편집해서 올리는 경우가 꽤 많다. 일종의 낚시성 포스팅이다. 이 글을 올린 분이 미용실에서 홍보 포스팅 비용을 받은거겠지.

검색 결과 내에서 다른 문서에 나쁜 영향을 주거나 정보 탐색에 불편을 주는 제목 역시 제재 사유가 될 수 있다. 바로 제목에 의미 없는 특수문자를 삽입한 경우가 그 중 하나로 단순히 특수문자를 제목에 사용했다는 것만으로 정상적인 블로그 포스트가 제재를 받는 것은 아니다.

첫 번째 예시와 같이 제목에 의미 없는 특수문자를 과도하게 사용하는 경우 검색 결과의 가독성을 해칠수 있다. 또 두 번째 예시처럼 유니코드 문자를 제목에 삽입하는 경우 사용자의 시스템 환경에 따라 일관되지 않는 특수문자로 변환된다. 다른 글에 비해 일시적으로 주목도를 높일 수는 있겠지만, 검색 결과에서 정보가 아닌 다른 요소를 사용해 시각적인 주목도를 높여 다른 문서의 가독성을 저해하는 문서는 어뷰징 문서로 규정하고 있으니 주의해야한다.