이번 업데이트는 음성, 이미지, 기억 기능을 GPT-4o를 중심으로 연결하여 ChatGPT를 '단순한 채팅 도구'에서 '손쉽게 활용하는 즉시 도구'로 변화시켰습니다. 가장 많이 사용되는 실용적인 시나리오별로 ChatGPT의 새로운 기능을 정리해 보겠습니다.
GPT-4o가 텍스트, 이미지, 오디오를 하나의 대화로 통합
GPT-4o의 포지션은 '올라운더(Omni)'입니다. ChatGPT 사용자에게 가장 눈에 띄는 변화는 멀티모달 기능의 원활한 구현입니다. 같은 대화 스레드 안에서 텍스트를 입력하는 동시에 이미지나 파일을 업로드할 수 있으며, ChatGPT는 표면적인 설명을 넘어 콘텐츠를 직접 읽고 분석하여 추론합니다.
ChatGPT로 자료 정리를 하는 경우, 이러한 통합 기능은 단계를 확실히 줄여줍니다. 스크린샷, 표, PDF 파일을 먼저 텍스트로 변환할 필요 없이 바로 ChatGPT에 제공하여 핵심 요점 추출, 차이점 비교, 리스트 생성 등을 할 수 있어 의사소통 비용이 훨씬 낮아집니다.
고급 음성 기능과 실시간 번역: ChatGPT를 휴대용 통역사로
ChatGPT의 음성 상호작용은 이제 더 자연스러운 대화에 가까워졌습니다. 말하면서 요구사항을 수정할 수 있고, ChatGPT도 더 빠르게 응답하여 매번 '생각을 마칠 때까지' 기다릴 필요가 없습니다. 대화 중 다른 언어를 섞어 사용할 때, ChatGPT는 신속한 전환을 지원하며 거의 실시간에 가까운 통역 수준의 번역을 제공합니다.
국제 회의가 잦은 사용자에게는 ChatGPT가 같은 문장을 다른 어조로 다시 표현하거나 구어체를 더 격식 있는 이메일 버전으로 번역해 주는 기능이 유용합니다. 언어 학습자에게는 발음 교정, 유의어 및 예문 제공을 요청하여 더 유창한 연습을 도울 수 있습니다.


