사이트맵의 404 페이지 제거로 SEO 신뢰도 복구
목차
사이트맵에 포함된 존재하지 않는 페이지를 제거했다. 작은 변경처럼 보이지만, 검색 엔진 크롤러가 계속 접근해서 404를 받는 악순환을 끊는 중요한 정리 작업이다.
문제: 사이트맵의 데드링크
sitemap.xml 은 검색 엔진이 사이트의 모든 페이지를 효율적으로 발견하고 색인하도록 돕는 명시적인 "여기 봐야 할 페이지들 목록"이다. 구글, 네이버 등 크롤러는 이 파일을 정기적으로 방문해서 나열된 URL을 순회한다.
문제는 이 목록에 이미 삭제되거나 이동된 페이지의 경로가 남아 있었다는 점이다. privacy.html 이 그런 페이지였다. 존재하지 않는데도 사이트맵에 계속 등록되어 있으니, 크롤러가 방문할 때마다 404를 받는다.
이게 반복되면:
- 크롤러가 불필요한 리소스를 낭비 (우리 서버 입장에서도, 검색 엔진 입장에서도)
- 사이트의 크롤 예산(Crawl Budget) 을 낭비하게 됨. 크롤러는 한정된 요청만 하므로, 404 페이지에 시간을 쓰면 정상 페이지 수집은 더뎌짐
- 검색 엔진에 사이트맵의 신뢰도가 떨어짐 ("이 사이트 사이트맵이 정확하지 않네" 라고 평가)
작업 내용
sitemap.xml 에서 404 상태를 반환하는 URL 하나를 제거했다. 간단한 수정이지만 충분히 중요한 유지보수다.
| 항목 | 설명 |
|---|---|
| 파일 | sitemap.xml |
| 변경 사항 | privacy.html URL 항목 제거 |
| 효과 | 검색 엔진 크롤러가 존재하지 않는 페이지에 접근하지 않음 |
| SEO 영향 | 크롤 예산 절감, 사이트맵 신뢰도 향상 |
왜 이런 일이 발생했을까
페이지를 삭제하거나 이동할 때:
- 코드에서는 완전히 제거했지만
- 사이트맵 파일은 자동 갱신되지 않거나, 수작업 갱신 시 빠진 경우
- 또는 배포 시점에 동기화 실패
보통은 사이트맵을 프로그래매틱하게 생성하는 방식(라우트 자동 스캔, 런타임 생성 등)이 더 안전하지만, 수작업 관리 시에는 이런 게 자주 발생한다.
회고: 사이트맵 관리 체계의 중요성
이번 작업으로 몇 가지를 되짚었다:
1. SEO는 엔지니어의 책임
팀에서 "SEO 담당자" 가 있다 해도, 404 같은 기술적 신호는 개발 단계에서 캐치해야 한다. 페이지 삭제 PR 에서 체크리스트에 "사이트맵 확인" 을 넣으면 좋다.
2. 자동화 vs 수작업
- 사이트맵을 자동 생성 (프레임워크 플러그인, 정적 빌드 단계)하면 이런 불일치가 원천 차단됨
- 수작업이면, 정기적인 검증(예: 매달 1회 사이트맵 URL 을 크롤링해서 200/404 상태 확인)을 자동화하는 게 좋음
3. 검색 엔진 도구의 활용
서치 콘솔(Google Search Console, 네이버 웹마스터 도구)은 사이트맵 오류를 명시적으로 보여준다. 정기적으로 확인하면 이런 문제를 빨리 발견할 수 있다.
작은 수정이지만, 사이트 전체의 크롤 효율과 검색 엔진과의 신뢰 관계를 다시 정상화하는 작업이었다. 특히 팀이 성장하면서 페이지 추가/삭제가 빈번해질수록, 이런 체계적인 점검 루틴이 빛난다.
🛒 이 글과 어울리는 추천 상품
*위 링크는 쿠팡파트너스 활동의 일환이며, 일정액의 수수료를 제공받을 수 있습니다.
댓글 0
첫 댓글 달아줘.