개발 slecs

사이트맵 통합으로 검색 엔진 크롤링 효율 높이기

목차

검색 엔진 최적화(SEO) 관점에서 크롤러가 우리 사이트를 얼마나 효율적으로 발견하는지는 매우 중요하다. 최근에 sitemap.xml을 중앙집중식 인덱스로 통합하고, robots.txt에 명시적으로 선언하는 작업을 했다. 단순해 보이지만 이 변경이 왜 필요했고, 어떤 영향을 미치는지 풀어본다.

배경: 분산된 사이트맵의 문제점

처음부터 상황을 정리하면, 우리 서비스는 여러 콘텐츠 영역으로 나뉘어 있었다. 각 영역마다 독립적인 사이트맵을 운영하는 방식은 한두 개 정도는 괜찮지만, 검색 엔진 입장에서는 이들을 모두 발견하고 주기적으로 크롤링해야 한다. 특히 robots.txt에서 명시하지 않으면, 크롤러는 경험에만 의존해 사이트맵들을 찾아야 한다.

이런 상황에서 다음과 같은 문제가 발생할 수 있다:
- 크롤러가 모든 사이트맵을 발견하지 못할 수 있음
- 사이트맵 업데이트 감지 지연
- robots.txt 설정 불완전으로 인한 SEO 점수 감점
- 신규 콘텐츠 인덱싱 속도 저하

팀 관점에서도 "현재 우리가 운영 중인 사이트맵이 정확히 몇 개인가?"라는 질문에 명확하게 답하기 어려웠다.

변경 사항

이번 작업에서 두 가지를 진행했다:

항목 변경 전 변경 후
사이트맵 구조 각 영역별 분산 (예: /sitemap-1.xml, /sitemap-2.xml...) 통합 인덱스 (/sitemap.xml) + 개별 사이트맵 참조
robots.txt Sitemap 선언 없음 Sitemap: 위치 명시
크롤러 발견 수동 탐색 의존 자동 발견

src/pages/sitemap.xml.ts: 통합 인덱스로 기능하도록 개선했다. 모든 개별 사이트맵을 참조하는 메인 인덱스 역할을 한다. 검색 엔진이 이 하나의 엔드포인트만 확인하면 우리가 게시한 모든 페이지의 사이트맵을 파악할 수 있다.

public/robots.txt: 다음 한 줄을 추가했다:

Sitemap: https://example.com/sitemap.xml

이 선언이 들어가면 Googlebot, Bingbot 등이 robots.txt를 읽는 즉시 우리 사이트맵의 위치를 알 수 있다. 검색 엔진 웹마스터 도구에서 수동으로 등록할 필요도 있지만, robots.txt 선언은 자동 발견의 표준이다.

일반적인 사이트맵 관리 패턴

이런 작업을 하면서 느낀 건, 사이트맵 관리는 사이트 규모에 따라 전략이 달라진다는 점이다.

소규모 (페이지 수백 개)
- 하나의 sitemap.xml로 충분
- robots.txt 선언만 있어도 OK

중규모 (페이지 수천~수만 개)
- 우리처럼 통합 인덱스 + 개별 사이트맵 구조
- sitemap-index.xml 표준 활용
- robots.txt 선언은 필수

대규모 (페이지 수십만 개 이상)
- 동적 생성 사이트맵 (날짜/카테고리별)
- CDN 캐싱 전략
- 크롤링 예산 최적화

우리는 중규모에서 벗어나는 순간을 대비해 지금부터 구조를 제대로 다져두려고 한 것이다. "나중에 커질 때 정리하지" 하면 결국 더 큰 비용이 든다.

의사결정 포인트

이 작업을 진행하면서 팀과 나눈 고민들:

  • robots.txt 변경이 안전한가? → 기존 사이트맵들은 그대로 두고 상위 인덱스만 추가하는 방식이므로 역호환성 100%
  • 크롤러 트래픽이 증가하지 않나? → 오히려 효율적으로 집중되어 불필요한 재크롤링이 줄어듦
  • 언제 효과를 볼 수 있나? → Googlebot 재크롤링 주기(보통 1주~1개월)를 기다려야 함. 우리는 Google Search Console에 수동 요청도 함께 진행

회고: 작은 변화가 모이는 과정

이 fix는 코드량으로는 작지만, 검색 엔진과의 상호작용 이라는 관점에서는 꽤 중요한 신호를 보내는 작업이었다. "우리는 크롤러 친화적이다"는 것을 명시적으로 선언하는 것.

팀원들과 얘기하면서 깨달은 건, SEO는 한두 번의 큰 작업으로 끝나는 게 아니라 이런 작은 결정들의 누적이라는 점이다. robots.txt, sitemap, canonical 태그, 메타 데이터... 이 모든 것이 맞물려야 검색 엔진이 우리 콘텐츠를 제대로 평가한다.

앞으로 새로운 콘텐츠 타입이 추가되면, 이 통합 인덱스 구조에 자동으로 포함될 수 있도록 만들어두었다. 누군가 나중에 "이 사이트맵도 크롤러가 발견하지 못하는 건가?"라고 물을 일은 없을 것 같다.


🛒 이 글과 어울리는 추천 상품

*위 링크는 쿠팡파트너스 활동의 일환이며, 일정액의 수수료를 제공받을 수 있습니다.

댓글 0

첫 댓글 달아줘.