이 글은 ChatGPT의 몇 가지 핵심 신규 기능에 초점을 맞춘다. 멀티모달 모델이 가져온 음성·이미지 이해, 클라우드 파일 가져오기, 데스크톱 환경, 그리고 더 투명한 메모리 제어다. 이런 변화는 ChatGPT를 “대화만 하는” 수준에서 한 단계 더 나아가, 더 손에 익는 업무 보조 도구로 만들어준다. 아래에서는 사용 시나리오별로 나눠서 설명한다.
GPT-4o 멀티모달: 텍스트·음성·이미지 상호작용이 더 매끄럽게
GPT-4o가 ChatGPT의 핵심 모델 중 하나가 되면서, ChatGPT가 한 대화 안에서 텍스트·음성·이미지를 동시에 처리하는 경험이 더 완성도 높아졌다. ChatGPT에게 이미지 내용을 이해하게 한 뒤 텍스트로 세부 사항을 추가 질문할 수도 있고, 요구사항을 말로 설명해 소통할 수도 있다. 일상적인 글쓰기, 표 이해, 이미지 정보 추출 측면에서 가장 큰 변화는 “오가며 설명하는 비용”이 눈에 띄게 줄었다는 점이다.
고급 음성 모드: 원고를 읽는 것이 아니라 대화에 더 가까움
ChatGPT의 고급 음성 모드가 사용자에게 순차적으로 제공되기 시작하면서, 음성 대화의 자연스러움·응답 속도·안정성이 핵심 개선 방향이 되었다. 이는 단순히 텍스트 답변을 읽어주는 것이 아니라, 실시간 소통의 리듬에 더 가까워 회의 전에 빠르게 아웃라인을 훑거나, 걸으면서 떠오른 생각을 구술한 뒤 ChatGPT가 정리하게 하는 데 적합하다. 다만 이 기능은 보통 단계적으로 공개되므로, 사용 가능 여부는 계정 화면에서 보이는지를 기준으로 확인해야 한다.
Google Drive / OneDrive에서 직접 가져오기: 데이터 분석이 한 단계 더 간편
리포트 작성이나 데이터 분석을 할 때, ChatGPT는 Google Drive와 Microsoft OneDrive에서 파일을 직접 선택해 업로드할 수 있어 반복적으로 다운로드하고 로컬에서 파일을 찾는 과정을 줄여준다. 표를 ChatGPT에 전달한 뒤 “차트를 더 명확하게 그리려면 어떻게 해야 하는지”, “산정 기준이 일관적인지”를 이어서 물어보고, 맞춤형 차트를 내보내 발표에 활용할 수도 있다. 업로드 전에는 파일에 민감한 필드가 없는지 먼저 확인해, 공유하면 안 되는 데이터가 대화에 들어가지 않도록 하는 것을 권한다.
메모리 기능과 새로운 제어: 개인화는 더 강해지고, 통제도 더 쉬워짐
ChatGPT의 메모리 기능이 더 많은 버전의 사용자에게 개방되었고, 더 명확한 안내와 제어 방식도 추가되었다. ChatGPT가 메모리를 업데이트할 때 어떤 일이 일어났는지 더 적극적으로 알려준다. 이를 “켜고 끌 수 있는 선호 기록”으로 이해하면 되는데, 예를 들어 자주 쓰는 말투나 업무 배경 같은 것들이다. 다만 비밀번호나 신분증 번호 같은 정보는 저장하기에 적합하지 않다. 더 안전한 방법은 ChatGPT가 “글쓰기 스타일/형식 선호”만 기억하게 하고, 구체적인 개인정보는 남기지 않는 것이다.
데스크톱 앱과 계정 없이 사용: 진입장벽은 낮지만 경험에는 차이가 있음
ChatGPT의 macOS 앱은 더 빠르게 호출하는 방식(예: Option + Space)을 제공하고, 데스크톱에서 파일·사진 업로드 및 음성 대화도 지원해 ChatGPT를 호출 즉시 쓰는 툴바처럼 활용하기 좋다. 동시에 ChatGPT는 “계정 없이 사용”하는 입구도 제공하지만, 대화 저장·공유·개인화 기능에서는 제한이 있다. 연속적인 작업 흐름과 기록을 더 중시한다면, 로그인 후의 완전한 경험을 사용하는 것을 여전히 권한다.