이번 ChatGPT 업데이트의 핵심은 명확합니다: 대화를 '사람과의 소통'처럼 만드는 것입니다. GPT-4o는 텍스트, 음성, 이미지를 하나의 경험으로 통합하고, 여기에 ChatGPT 기억 기능과 제어 가능한 스위치를 더해 ChatGPT는 더 잘 대화할 뿐만 아니라 사용자의 선호도와 맥락을 더 잘 이해합니다.
GPT-4o 등장: 텍스트, 음성, 영상을 한번에 통합
GPT-4o는 ChatGPT의 멀티모달 능력을 핵심적으로 업그레이드한 것으로, 텍스트 입력, 음성 교류, 이미지 이해를 모두 하나의 대화에서 완료할 수 있습니다. 스크린샷, 사진 또는 차트를 ChatGPT에 제공하면 직접 내용을 설명하고 세부 사항을 계속 질문할 수 있습니다. 대부분의 일상 시나리오에서 ChatGPT의 '정보 수신 방식'은 인간에 더 가까워지고, 커뮤니케이션 비용이 현저히 낮아집니다.
고급 음성 모드: 더 부드럽고, 실시간 시나리오에 더 적합
많은 사람들이 ChatGPT에 대한 인식을 바꾼 것은 음성 대화가 더 자연스러워지고, 멈춤과 대화 이어가기가 실제 교류와 더 비슷해졌기 때문입니다. GPT-4o의 능력과 결합하여, ChatGPT는 실시간 번역, 구어 연습, 회의 요점 구술 정리와 같은 '말하면서 처리하는' 작업에 더 적합해졌습니다. 모바일 사용자에게는 이런 업데이트가 단순한 모델 매개변수 향상보다 더 체감됩니다.
ChatGPT 기억 기능: 기억하지만, 당신이 결정합니다
ChatGPT 기억 기능은 사용자가 명확히 표현한 장기 선호도, 예를 들어 자주 사용하는 어조, 작업 배경 또는 고정 형식을 저장하여 이후 대화에서 매번 처음부터 설명할 필요가 없게 합니다. OpenAI의 설명에 따르면, ChatGPT는 기억 업데이트 시 사용자에게 알리고, 관리 및 제어 옵션을 제공합니다. 특정 기억을 확인하거나 삭제할 수 있으며, 기억 기능을 끄는 것도 가능해 ChatGPT가 지속적으로 개인 선호도를 축적하는 것을 방지할 수 있습니다.
이미지 및 파일 이해: '이해'를 실행 가능한 작업으로 전환
ChatGPT가 이미지와 파일을 읽을 수 있을 때, 가치는 '인식' 자체가 아니라 내용을 다음 단계 행동으로 변환할 수 있다는 점에 있습니다. 예를 들어 한 페이지 보고서를 ChatGPT에 주어 결론을 도출하고, 위험 점을 나열한 후 사용자의 형식으로 요약 또는 이메일 초안을 생성할 수 있습니다. GPT-4o는 ChatGPT가 같은 대화에서 '내용 보기-핵심 질문하기-출력 제공하기'를 완료할 수 있게 하여 흐름이 더 연속적입니다.
더 편하게 사용하는 방법: 두 가지 설정 제안
ChatGPT가 개인 습관에 더 잘 맞기를 원한다면, 먼저 한두 문장으로 고정 선호도를 알려주고, ChatGPT가 기억 알림을 트리거하는지 관찰하고 내용을 확인하세요. 반대로, 개인정보 보호 또는 임시 프로젝트와 관련될 때는 ChatGPT 기억 기능을 끄거나, 종료 후 관련 기억을 정리하는 것이 좋습니다. 이렇게 하면 GPT-4o가 가져온 자연스러운 상호 작용을 즐기면서도 ChatGPT의 '당신을 이해함'을 수용 가능한 범위 내로 통제할 수 있습니다.