ChatGPT가 최근 여러 업데이트를 통해 음성 대화 모드가 완전히 개선되었고, GPT-4o 모델의 멀티모달 기능도 사용자 경험을 더욱 업그레이드했습니다. 차가운 텍스트 대화에서 벗어나, 이제 ChatGPT는 어조를 이해하고 화면을 볼 수 있는 스마트 파트너처럼 느껴집니다. 주목할 만한 새로운 변화를 정리해 보았습니다.
음성 모드 더 자연스러워졌다: 속도와 억양이 실제 사람처럼
새로운 고급 음성 기능은 억양과 리듬에서 큰 조정이 이루어져, 이전의 어색한 기계음이 사라졌습니다. 이제 대화 중에 언어를 즉시 전환할 수 있어, 예를 들어 중국어와 영어 간 상호 번역이 가능해져 크로스랭귀지 커뮤니케이션이 매우 매끄러워졌습니다. 이는 해외 동료와 회의를 하거나 외국어를 공부하는 사용자에게 언제든지 통역사가 옆에 있는 것과 같은 경험을 제공합니다.
향후 이 음성 모드는 'Projects' 모드에 통합되어 더욱 몰입감 있는 워크플로를 만들 예정입니다. 상상해 보세요. 말만 하면 ChatGPT가 프로젝트 진행 상황을 정리하고, 음성으로 보고서 초안을 생성해 주며, 타이핑 없이 모든 작업을 처리할 수 있습니다.
GPT-4o, 새로운 상호작용 방식 도입: 화면 공유와 실시간 분석
GPT-4o의 출시는 이번 업데이트의 핵심입니다. 더 이상 텍스트 입력에 국한되지 않고 오디오, 비디오, 텍스트를 종합적으로 처리할 수 있습니다. 이제 ChatGPT에 컴퓨터나 스마트폰 화면을 직접 공유하면, 화면을 보면서 조언을 제공합니다. 예를 들어 코딩 중 막혔을 때, ChatGPT가 화면의 코드 조각을 직접 분석하고 음성으로 어디가 잘못되었는지 알려줍니다.

