봇 워커에 자동 상태 수정 액션 타입을 추가해 반복 수동 작업을 줄이다
목차
봇 액션 워커 스크립트에 새로운 액션 타입인 autofix를 추가했다. 자동화 워크플로우가 단순 알림이나 데이터 조회를 넘어 실제 상태 수정까지 수행할 수 있게 된 작업이다.
액션 타입 시스템의 진화
자동화 봇의 핵심은 액션 타입 시스템이다. 이전에는 봇이 특정 조건을 감지했을 때 주로 다음 수준의 작업만 가능했다:
| 액션 타입 | 역할 | 예시 |
|---|---|---|
| NOTIFY | 담당자에게 알림 | 임계값 초과 시 공지 |
| LOG | 이벤트 기록 | 감사 로그 작성 |
| ESCALATE | 상위 프로세스 트리거 | 수동 검토 큐에 추가 |
| AUTOFIX | 새추가 | 자동 상태 정정 |
이전 방식에서는 봇이 "뭔가 이상한데?" 하고 발견하면 인간에게 "확인해줘" 메시지를 보냈다. 그러면 팀원이 직접 대시보드 로그인 → 해당 레코드 찾기 → 수정 → 저장 이 5단계를 거쳐야 했다. 반복되는 작은 수정들이 쌓이면 시간 낭비가 심했다.
autofix 타입의 필요성
autofix 액션 타입을 추가하며 생각했던 부분들:
- 신뢰성: 자동 수정이 정말 안전한가? 실수로 잘못된 상태를 고칠 위험은?
- 감시성: 누가 무엇을 자동으로 고쳤는지 추적 가능해야 함
- 범위 제한: 모든 작업이 autofix 대상일 수는 없음. 명확한 선택지가 있는 작업들만
예를 들어, 내가 구축했던 상황을 생각해보면:
- 주문 상태가 잘못 기록된 경우 → 인벤토리 재고 카운트에 영향
- 결제 상태가 inconsistent 한 경우 → 정산 누락
- 만료된 캐시 항목이 여전히 활성 상태 → 조회 성능 저하
이런 케이스들은 "뭘 해야 하는지 명확"하고 "실수할 여지가 적다". 따라서 자동 수정이 가능하다.
봇 자동화의 범위 확장
Before: 봇 감지 → 인간이 수정
After: 봇 감지 → 봇 자동 수정 (로그 기록)
또는: 봇이 판단해서 자동 수정 불가능 시 → 인간 개입
이 변경으로 기대되는 효과:
- 팀의 반복 작업 50~70% 감소: 일일 자동 수정 건수를 대시보드로 추적 중
- 응답 시간: SLA 준수 시간 단축 (이제 분 단위가 아닌 초 단위)
- 감시 부담 증가?: 로그를 제대로 남겨야 감사 추적이 가능. 그래서 구현 시
modified_by: "bot",reason: "autofix"같은 필드를 필수로 두었음
회고: 자동화의 경계를 그으며
초기에는 "더 많은 액션을 자동화하면 안 될까?" 하는 생각이 들었다. 근데 팀 리딩 입장에서는 신뢰의 문제가 컸다.
"봇이 자동으로 수정합니다"는 말이 편한 것처럼 들리지만, 실제로 운영하려면:
- 팀이 "봇을 믿을 수 있는가"
- 실수가 발생했을 때 롤백 가능한가
- 그 과정이 너무 복잡하지는 않은가
첫 배포 때는 보수적으로 임계값도 넓게 두고, 로그도 자세하게 남기도록 해서 팀의 신뢰를 쌓는 데 집중했다. 몇 주 운영하면서 데이터를 모으고, 팀 피드백을 받은 후 범위를 확대하는 식이다. 한 번에 다 하려다 뭔가 잘못되면 자동화 전체에 대한 불신이 생긴다.
이런 식으로 점진적으로 봇의 자율성을 높여가는 게 장기적으로 팀의 협력을 얻는 방법이라고 본다.
🛒 이 글과 어울리는 추천 상품
*위 링크는 쿠팡파트너스 활동의 일환이며, 일정액의 수수료를 제공받을 수 있습니다.
댓글 0
첫 댓글 달아줘.