GPT-4o 올인원 모델이 출시되면서 ChatGPT는 음성 대화, 시각 이해, 실시간 상호작용 측면에서 비약적인 발전을 이루었습니다. 즉석 통역에서 화면 공유를 통한 프로그래밍 지원, Apple 생태계와의 긴밀한 통합에 이르기까지, 이러한 새로운 기능들은 AI와 인간의 협업 방식을 새롭게 바꾸고 있습니다.
자연스러운 음성 대화와 실시간 번역
GPT-4o의 가장 눈에 띄는 변화는 음성 인터랙션입니다. 더 이상 단순한 텍스트 채팅이 아니라, 말투와 감정을 이해하고 이에 걸맞은 감정이 담긴 음성으로 응답할 수 있습니다. 50개 언어 지원과 결합해 ChatGPT는 대화 중 실시간 통역을 수행하며 언어 장벽을 허물어 줍니다. 이 기능은 국제 회의나 언어 학습 등 다양한 상황에서 특히 유용합니다.
화면 공유와 AI 튜터
화면 공유를 통해 ChatGPT는 사용자가 보여주는 코드, 차트, 디자인 시안을 실시간으로 읽고, 커서 위치의 문제에 대해 음성으로 답변을 제공합니다. 마치 슈퍼 튜터처럼 사용자가 직접 스크린샷을 찍거나 긴 문제 설명을 입력할 필요 없이 프로그래밍, 영상 편집, 데이터 분석 중 발생하는 어려움을 효과적으로 해결할 수 있습니다. 이 기능은 교육 및 기술 지원 분야에서 큰 잠재력을 지니고 있습니다.
메모리 도구와 맞춤형 창의성
GPT-4o에 새롭게 추가된 메모리 기능은 AI가 사용자의 선호도를 장기적으로 기억할 수 있게 해줍니다. 예를 들어 사용자가 선호하는 글쓰기 스타일이나 학습 계획을 저장해 두는 식입니다. 또한 사용자의 요청에 따라 취침 이야기, 창의적인 기획 등 개인화된 콘텐츠를 생성하고, 지정된 음성 톤이나 감정에 맞춰 전달할 수 있습니다. 아울러 ChatGPT Plus 사용자는 맞춤형 GPTs를 직접 구축할 수 있어 맞춤 경험을 더욱 강화할 수 있습니다.
Mac 데스크톱 앱과 Apple 통합
ChatGPT for Mac 데스크톱 앱은 Option + Space 단축키로 바로 호출할 수 있어 브라우저 없이도 언제든지 사용할 수 있습니다. 더 주목할 점은 Apple이 WWDC에서 ChatGPT를 Siri 및 iOS 18, iPadOS 18, macOS Sequoia에 통합한다고 발표한 것입니다. 이후 사용자는 Apple 기기에서 별도로 OpenAI 계정을 등록하지 않고도 GPT-4o의 기능을 바로 호출할 수 있습니다.
고급 음성 모드 곧 대중화
OpenAI는 일부 ChatGPT Plus 사용자에게 고급 음성 모드의 Alpha 버전을 출시했습니다. 이 모드는 사실적인 억양을 모방하고 사용자의 숨소리나 웃음소리를 포착해 대화의 몰입감을 높여줍니다. 해당 기능은 가을에 모든 Plus 사용자에게 점차적으로 공개될 예정입니다. 이전 음성 논란으로 인해 다소 지연되었지만, 최종 버전은 안전성과 표현력을 모두 갖추도록 설계되었습니다. 이러한 새로운 기능들은 ChatGPT를 단순한 도구에서 진정한 지능형 파트너로 진화시키고 있습니다.