개발 slecs

메타 설명 자동화에서 사실 기반만 유지하도록 제한

목차

골든 메타 최적화 스크립트를 고쳤다. 기존 페이지 표현들을 조합하고 재배열하는 방식으로만 제한하고, 새로운 숫자나 사실을 생성하는 것을 차단했다.

뭐가 문제였나

처음 골든 메타 최적화 시스템을 만들 때는 SEO 점수를 최대화하는 데 초점을 맞췄다. 메타 디스크립션을 더 매력적으로, 더 긴 키워드를 담아서, 검색 결과에서 눈에 띄도록 개선하려는 의도였다. 하지만 이 과정에서 크리티컬한 실수가 생겼다: 시스템이 페이지 컨텐츠에 없는 정보를 자의로 추가하기 시작했다는 것.

예를 들어 상품 페이지의 원문에 "20% 할인"이라는 정보가 없는데도, 최적화 스크립트가 "지금 최대 30% 할인 중"이라는 메타 설명을 생성했다. 가격 정보도 실제 페이지엔 없는데 메타에만 있었다. 상품 재고나 배송일도 마찬가지. 이건 단순한 SEO 과도 최적화를 넘어서 거짓 정보를 의도적으로 제공하는 것과 다를 바 없었다.

왜 이게 문제인가

SEO 입장에서는 메타 설명이 얼마나 좋은지가 중요하지만, 사용자 관점에선 다르다. 검색 결과에서 본 메타 설명과 실제 들어가본 페이지의 내용이 다르면 신뢰도가 급락한다. "이 사이트 정보가 진짜 겨?" 하는 의심이 생기고, 그게 쌓이면 전환율도 떨어지고 이탈률도 오른다. 게다가 규정상 문제가 있다. FTC 같은 기구나 소비자 보호 관련 규정들은 메타 설명이 실제 컨텐츠를 정확히 반영하도록 요구한다. 거짓 정보를 담아서 클릭을 유도하는 건 광고 관련 법을 어기는 셈이다.

해결: 재배열만 허용하기

그래서 스크립트의 로직을 바꿨다. 이제는 페이지에 이미 존재하는 표현, 숫자, 문장들을 조합하고 재배열하는 방식으로만 메타를 생성한다. 새로운 정보는 추가하지 않는다.

구체적으로는:

  • 추출 단계: 페이지 HTML에서 모든 텍스트, 숫자, 엔티티를 먼저 추출
  • 조합 단계: 그 추출된 요소들만 가지고 메타 설명 생성 (단어 순서 변경, 문장 다시 쓰기 OK)
  • 검증 단계: 생성된 메타에 사용된 모든 정보가 원문에 존재하는지 다시 확인

이렇게 하면 SEO 최적화 범위는 좁아지지만, 신뢰성은 크게 올라간다.

배운 점과 앞으로

이 작업을 하면서 느낀 게 있다. 자동화 시스템은 "더 많이, 더 빨리"를 지향하지만, 때론 "덜하되 정확히"가 더 가치 있다는 것. 특히 사용자가 직접 보는 정보라면 더욱 그렇다.

팀원들과 이 변경을 논의할 때도 같은 맥락이었다. 처음엔 메타 생성 품질 수치가 떨어질까 걱정했지만, 사실 기반의 메타가 생성되지 않는 페이지는 아예 메타를 만들지 않는 게 낫다는 결론에 도달했다. 빈 메타보다는 거짓 메타가 낫다는 발상은 이제 없다.

데이터 품질과 신뢰성이 중요한 시스템일수록, 자동화의 한계를 명확히 그어두는 게 핵심이다. 알고리즘이 할 수 있는 범위를 처음부터 제한하는 게, 나중에 문제가 터지고 나서 허리 굽히는 것보다 훨씬 낫다.


🛒 이 글과 어울리는 추천 상품

*위 링크는 쿠팡파트너스 활동의 일환이며, 일정액의 수수료를 제공받을 수 있습니다.

댓글 0

첫 댓글 달아줘.