OpenAI가 ChatGPT에 두 가지 대규모 업데이트를 가져왔습니다: GPT-4o 올인원 모델과 Canvas 캔버스 협업 인터페이스. 전자는 AI가 진정으로 세상을 '보고' '듣게' 하며, 후자는 창작과 코딩을 마치 파트너와 함께 글을 쓰는 것처럼 매끄럽게 만듭니다. 이 글에서는 이 새로운 기능들을 분석하고 일상 사용 경험을 어떻게 바꾸는지 살펴봅니다.
GPT-4o의 멀티모달 상호작용 능력
GPT-4o의 'o'는 올인원(omni)을 의미하며 더 이상 텍스트에 국한되지 않습니다. 실시간 음성 대화를 지원하고 어조와 감정을 감지하며 즉석 번역까지 가능합니다. 50개 언어를 지원하여 사용자가 중국어로 말하면 AI가 직접 영어 통역을 출력합니다. 더욱 실용적인 것은 화면 공유 기능입니다. 프로그램 버그나 편집 문제가 발생하면 화면을 공유하기만 하면 GPT-4o가 사용자의 작업을 '보면서' 음성 지침을 제공하여 실시간 온라인 슈퍼 튜터처럼 행동합니다.
또한 GPT-4o는 시각 이해 능력을 갖추고 있어 카메라를 통해 장면을 인식하고 시각 장애인이 주변 환경을 '들을' 수 있도록 도와줍니다. 이러한 능력은 ChatGPT를 채팅 도구에서 보고, 듣고, 가르칠 수 있는 AI 파트너로 변화시킵니다.
Canvas 캔버스: 코치처럼 함께 창작하기
Canvas는 독립적으로 열리는 협업 창으로 기존의 대화형 인터페이스를 완전히 탈피했습니다. 긴 글을 작성하거나 코드를 짤 때 Canvas는 인라인 주석, 수정 제안 및 직접 편집 기능을 제공합니다. 예를 들어 글을 쓸 때 특정 텍스트를 선택하여 AI가 다듬거나 어조를 조정하게 하거나 한 번에 표나 시로 변환할 수 있습니다. 코드를 작성할 때 Canvas는 코드 리뷰, 오류 수정 및 언어 변환(예: Python을 JavaScript로)을 지원합니다. 모든 수정 사항은 버전 기록에 보관되며 언제든지 되돌릴 수 있습니다.


