당신 손에는 분명 고객센터 채팅 기록, DM, 티켓이 한가득 있는데, 막상 회고할 때는 “다들 불만이야”만 남습니다. 이게 전형적으로 대화 분석이 제대로 안 된 상태예요: 의도 추출도 안 했고, 그룹화도 안 했고, 정량화도 안 했고, 근본 원인 찾기는 더 말할 것도 없죠. 저는 평소 ChatGPT, Claude, Gemini 3종 세트로 텍스트를 “끝까지 뽑아먹고”, Midjourney로 시각화 자료까지 뽑아 효율을 극대화합니다.
1단계 먼저 대화를 깨끗한 데이터로 만들기
출처가 온라인 고객센터든 커뮤니티든, 먼저 최소한의 정제를 합니다: 전화번호, 주문번호 같은 민감정보를 제거하고, “사용자 한 문장 + 상담사 한 문장” 형태로 문맥을 유지합니다. NLP로 대화 분석을 할 때 가장 무서운 건 노이즈예요. 쓸데없는 말이 조금만 늘어나도 결과가 쉽게 흔들립니다.
2단계 ChatGPT로 라벨 체계와 의도 인식
저는 ChatGPT에게 먼저 태그 트리를 만들게 한 다음, 대화별로 하나씩 라벨링하게 합니다. 자주 쓰는 프롬프트는: 다음 대화에 대해 의도, 감정, 핵심 엔티티, 해결 여부, 다음 단계 제안을 생성하고 CSV 컬럼으로 출력해 주세요. “빠르게 뼈대를 잡는” 데는 적합하지만, 비즈니스 내부 용어(은어)를 만나면 가끔 아는 척하며 틀릴 때가 있습니다.
3단계 Claude로 장문 귀인(원인 연결)과 인사이트
Claude는 긴 대화, 긴 티켓에서 더 안정적이라서, 저는 한 주치 기록을 통째로 넣고 상위 문제 클러스터링 + 근본 원인 가설 + 검증 가능한 데이터 포인트를 만들게 합니다. 회고 보고서를 매끄럽게 써주지만, “추정”을 “사실”처럼 써버리지 않게 반드시 확인해야 합니다.


