개발 slecs

사이트맵의 404 페이지 제거로 SEO 신뢰도 복구

목차

사이트맵에 포함된 존재하지 않는 페이지를 제거했다. 작은 변경처럼 보이지만, 검색 엔진 크롤러가 계속 접근해서 404를 받는 악순환을 끊는 중요한 정리 작업이다.

문제: 사이트맵의 데드링크

sitemap.xml 은 검색 엔진이 사이트의 모든 페이지를 효율적으로 발견하고 색인하도록 돕는 명시적인 "여기 봐야 할 페이지들 목록"이다. 구글, 네이버 등 크롤러는 이 파일을 정기적으로 방문해서 나열된 URL을 순회한다.

문제는 이 목록에 이미 삭제되거나 이동된 페이지의 경로가 남아 있었다는 점이다. privacy.html 이 그런 페이지였다. 존재하지 않는데도 사이트맵에 계속 등록되어 있으니, 크롤러가 방문할 때마다 404를 받는다.

이게 반복되면:
- 크롤러가 불필요한 리소스를 낭비 (우리 서버 입장에서도, 검색 엔진 입장에서도)
- 사이트의 크롤 예산(Crawl Budget) 을 낭비하게 됨. 크롤러는 한정된 요청만 하므로, 404 페이지에 시간을 쓰면 정상 페이지 수집은 더뎌짐
- 검색 엔진에 사이트맵의 신뢰도가 떨어짐 ("이 사이트 사이트맵이 정확하지 않네" 라고 평가)

작업 내용

sitemap.xml 에서 404 상태를 반환하는 URL 하나를 제거했다. 간단한 수정이지만 충분히 중요한 유지보수다.

항목 설명
파일 sitemap.xml
변경 사항 privacy.html URL 항목 제거
효과 검색 엔진 크롤러가 존재하지 않는 페이지에 접근하지 않음
SEO 영향 크롤 예산 절감, 사이트맵 신뢰도 향상

왜 이런 일이 발생했을까

페이지를 삭제하거나 이동할 때:
- 코드에서는 완전히 제거했지만
- 사이트맵 파일은 자동 갱신되지 않거나, 수작업 갱신 시 빠진 경우
- 또는 배포 시점에 동기화 실패

보통은 사이트맵을 프로그래매틱하게 생성하는 방식(라우트 자동 스캔, 런타임 생성 등)이 더 안전하지만, 수작업 관리 시에는 이런 게 자주 발생한다.

회고: 사이트맵 관리 체계의 중요성

이번 작업으로 몇 가지를 되짚었다:

1. SEO는 엔지니어의 책임
팀에서 "SEO 담당자" 가 있다 해도, 404 같은 기술적 신호는 개발 단계에서 캐치해야 한다. 페이지 삭제 PR 에서 체크리스트에 "사이트맵 확인" 을 넣으면 좋다.

2. 자동화 vs 수작업
- 사이트맵을 자동 생성 (프레임워크 플러그인, 정적 빌드 단계)하면 이런 불일치가 원천 차단됨
- 수작업이면, 정기적인 검증(예: 매달 1회 사이트맵 URL 을 크롤링해서 200/404 상태 확인)을 자동화하는 게 좋음

3. 검색 엔진 도구의 활용
서치 콘솔(Google Search Console, 네이버 웹마스터 도구)은 사이트맵 오류를 명시적으로 보여준다. 정기적으로 확인하면 이런 문제를 빨리 발견할 수 있다.


작은 수정이지만, 사이트 전체의 크롤 효율과 검색 엔진과의 신뢰 관계를 다시 정상화하는 작업이었다. 특히 팀이 성장하면서 페이지 추가/삭제가 빈번해질수록, 이런 체계적인 점검 루틴이 빛난다.


🛒 이 글과 어울리는 추천 상품

*위 링크는 쿠팡파트너스 활동의 일환이며, 일정액의 수수료를 제공받을 수 있습니다.

댓글 0

첫 댓글 달아줘.