GPT-4o: OpenAI, 사용자에게 무료로 제공되는 최신 언어 모델 공개

소셜 미디어와 기타 포럼에서 OpenAI가 우리를 위해 무엇을 준비했는지에 대한 수많은 추측이 난무한 가운데, 어제 OpenAI는 마침내 지금까지 가장 강력한 최신 LLM인 GPT-4o(‘옴니’의 ‘o’는 옴니)를 공개했습니다. GPT-4o의 출시 이벤트를 놓치신 분들을 위해 GPT-4o의 기능과 제공되는 기능에 대해 살펴보겠습니다.

향상된 오디오, 텍스트 및 시각 기능

GPT-4 Turbo는 강력한 모델이지만 지연 시간이라는 한 가지 단점이 있습니다. GPT-3.5 터보와 비교했을 때 GPT-4 터보는 여전히 상당히 느립니다. GPT-4o는 이러한 단점을 해결하고 GPT-4 터보보다 2배 더 빠릅니다. 이를 통해 음성, 텍스트, 시각의 데이터를 통합하여 멀티 모달에서 옴니 모달로 한 단계 더 나아가는 광범위한 사용 사례가 가능해집니다. 멀티모달과 옴니모달의 주요 차이점은 옴니모달에서는 세 가지 소스를 모두 병렬로 원활하게 실행할 수 있다는 점입니다.

이러한 향상된 기능을 통해 모델은 향상된 음성 변조, 풍자를 이해하는 기능, 향상된 자연스러운 대화 능력을 갖춘 음성을 생성할 수 있습니다.

가격 인하 및 ChatGPT 사용자에게 무료 제공

GPT-4o는 기존 GPT-4 터보에 비해 더 효율적이고 빠르지만, GPT-4 터보의 절반 가격(API)으로, 입력 토큰은 5.00달러/1백만 개, 출력 토큰은 15.00달러/1백만 개에 불과합니다. 더 나은 가격 책정으로 이제 컨텍스트 창은 128만 토큰이며, 지식 마감일은 2023년 10월입니다.

또한, 모든 ChatGPT 사용자는 GPT-4o를 무료로 사용할 수 있습니다(ChatGPT 플러스 사용자는 GPT-4o의 5배 한도가 적용됩니다). 이와 함께 OpenAI는 사용자가 화면에 표시되는 콘텐츠를 읽고 이해하기 위해 GPT-4o의 비전 기능을 활용할 수 있는 ChatGPT 데스크톱 앱도 공개했습니다. 사용자는 데스크톱 앱을 사용하여 ChatGPT와 대화할 수도 있습니다.

GPT-4o 데모

OpenAI는 향후 몇 주에 걸쳐 단계적으로 GPT-4o에 대한 액세스를 출시할 예정이며, ChatGPT Plus 사용자는 우선적으로 이 모델에 조기 액세스 할 수 있다고 밝혔습니다. 앞으로 몇 주 안에 이 모델을 사용해봐야 이 모델의 진정한 잠재력을 파악할 수 있을 것입니다. 앞으로의 흥미로운 시간!

GPT-4o: OpenAI, 사용자에게 무료로 제공되는 최신 언어 모델 공개

향상된 오디오, 텍스트 및 시각 기능

가격 인하 및 ChatGPT 사용자에게 무료 제공

GPT-4o 데모

More From Our Blog

Gemini 임베딩 2: 구글 최초의 멀티모달 임베딩 모델

Gemini 2.5 Pro와 GPT-4.5: 누가 AI 혁명을 주도할까요?

Build Your Own Business AI