티스토리 뷰
목차
색인의 정의
책 속의 낱말이나 구절 등을 찾아보기 쉽도록 일정한 순서로 나열한 목록을 가리킨다. 영어로는 인덱스(index)라고 한다.
즉, 색인이란 것은 알아보기 쉽도록 표시해둔 목록이다. 국어사전을 찾아 때 맨 앞에 나열해 논 단어 목록을 지칭할 때도 사용된다.
인터넷에선 어떤 용도로 색인이라는 단어가 사용될까?
웹(인터넷)에서의 색인은 데이터를 기록할 때 데이터의 이름이나 크기 등의 데이토를 보여주는 속성과 이러한 데이터를 기록한 장소 등을 보기 쉽게 표시한 것이다. 즉 데이터에 대한 참조용 데이터를 색인이라고 하는 것이다.
검색엔진에서 색인이 중요한이유
우리가 책에서 낱말을 찾을 때 빠르게 찾을 수 있게 하는 것처럼 검색엔진에서도 색인은 검색을 더욱 빠르게 하게 한다.
알아보기 쉽도록 표시해둔 목록이 색인이기 때문에, 색인이 없다면 어떠한 단어를 검색했을 때 모든 문서를 찾아야 할 수도 있지만. 색인이 있다면 이런 복잡한 과정 없이 바로 표시한 목록을 찾아갈 수 있어 불필요한 에너지와 시간을 절약할 수 있다..
구글 검색의 원리
색인이 검색엔진에서 중요한 이유를 더 잘 이해하기 위해 구글 검색의 원리를 알아두면 편리하다. 구글은 ‘웹 크롤러’로 알려진 소프트웨어를 사용하는 완전히 자동화된 검색엔진을 사용한다. 웹 크롤러는 정기적으로 웹을 탐색하여 색인에 추가할 사이트를 찾는다. 구글 검색은 기본적으로 다음 세 단계로 작동한다.
1. 크롤링: 크롤러라는 자동화된 프로그램으로 웹을 검색하여 신규 또는 업데이트된 페이지를 찾는다. 그런 다음 나중에 볼 수 있도록 발견된 페이지의 주소(또는 페이지 URL)를 큰 목록에 저장한다.
2. 색인 생성 : 크롤링을 통해 파악한 페이지를 방문하여 각 페이지에 대한 정보를 분석한 뒤 거대한 데이터베이스인 구글 색인에 저장된다.
3. 검색 결과 게재: 사용자가 검색할 때 구글에서는 가장 높은 품질의 검색 결과를 결정하기 위해 검색자의 여러 정보를 수집한 뒤 이에 맞는 정보를 색인을 통해 찾아 상위에 노출시키는 것이다. 결국 검색엔진에서 상위에 노출되고, SEO가 최적화되기 위해서는 ‘색인’이라는 것을 잘 설정해 두어야 우리의 페이지를 잘 가져가서 검색엔진에 노출시키기 좋다는 뜻이다.