ChatGPT에 최근 대규모 업데이트가 적용되었습니다. 일반 사용자든 AI에 의존하는 크리에이터든 이 새로운 기능들을 꼭 알아두세요. 더 자연스러운 음성 대화부터 멀티모달 이해까지, OpenAI는 ChatGPT를 더 유연하고 똑똑하게 만들고 있습니다. 이 글에서 가장 주목할 만한 새로운 기능들을 소개합니다.
GPT-4o: 올인원 멀티모달 모델
GPT-4o의 출시는 ChatGPT의 획기적인 업그레이드입니다. 텍스트뿐만 아니라 이미지, 오디오, 영상 콘텐츠를 직접 이해할 수 있습니다. 예를 들어 디자인 스케치를 업로드해 최적화 제안을 받거나, 회의 녹음을 업로드해 자동으로 요약을 생성할 수 있습니다. GPT-4o의 응답 속도도 크게 개선되어 거의 실시간 대화에 가깝습니다. 전작 GPT-4와 비교해 추론 및 창의적 작업에서 더 안정적인 성능을 보여줍니다.
참고로 Plus 사용자는 더 높은 지능 수준의 서비스를 이용할 수 있으며, 무료 사용자도 표준 지능 모드에서 GPT-5를 횟수 제한 없이 사용할 수 있습니다(남용 방지 메커니즘에 유의하세요). 아직 GPT-4o의 멀티모달 기능을 경험하지 못했다면 ChatGPT 설정에서 수동으로 모델을 전환해 보시기 바랍니다.
음성 엔진: 15초면 당신의 목소리를 복제합니다
OpenAI가 출시한 음성 엔진(Voice Engine)은 음성 복제를 매우 간단하게 만들어 줍니다. 15초 분량의 오디오 샘플만 제공하면 시스템이 해당 목소리와 매우 유사한 음성 출력을 생성할 수 있습니다. 이 기능은 개인 음성 비서뿐만 아니라 언어 학습자의 발음 교정, 오디오 콘텐츠 제작자의 편리한 더빙 솔루션에도 활용될 수 있습니다. 현재 일부 지역에서 테스트 중이지만 이미 큰 잠재력을 보여주고 있습니다.
개선된 음성 모드와 함께 자연스러운 음성으로 ChatGPT와 직접 대화할 수 있습니다. 타이핑 없이 질문하고, 말투를 조정하고, 여러 차례 대화를 이어갈 수 있습니다. Altman은 새 버전의 음성 품질이 크게 향상될 것이라고 약속했으며, 실제 경험해 보면 확실히 더 부드럽고 자연스럽습니다.


