ChatGPT 킬러? 제미니 1.5가 구글의 AI 미래에 주는 의미

구글과 OpenAI: 구글이 이기는가?

AI 과대 광고에서 Bard를 놓친 Google은 최근 최신 AI 제품인 Gemini를 공개했습니다. 이번 출시의 일환으로 Bard는 Gemini로 브랜드가 변경되었으며 이제 새로운 Gemini Pro LLM을 통합했습니다. 이러한 변화의 정도를 파악하기 위해 더 자세히 살펴보겠습니다.

제미니 AI란 무엇인가요?

Gemini는 LaMDA와 PaLM의 출시에 이은 Google의 최신 대규모 언어 모델(LLM)입니다. 이전 버전과 달리 Gemini는 기본적으로 텍스트, 이미지, 음성 및 코드를 이해할 수 있는 멀티 모달을 지원하며, 향상된 이해력과 추론 능력을 자랑합니다.

제미니 AI의 변형

Gemini AI는 세 가지 대형 언어 모델로 구성되어 있습니다:

  1. 제미니 나노: 온디바이스 효율성에 최적화되어 개인 디바이스에서 직접 신속한 AI 솔루션을 제공합니다.
  2. 제미니 프로: 강력한 성능으로 다양한 작업을 처리하는 데 능숙한 다목적 확장형 모델입니다. Gemini 채팅 인터페이스의 무료 버전에서 액세스할 수 있습니다.
  3. Gemini Ultra: Gemini 시리즈의 정점으로, 복잡한 문제 해결을 지원하고 AI 기능의 한계를 발전시키는 제품입니다. Google One AI 프리미엄 요금제 가입자에게만 제공됩니다.

제미니 모델은 크기와 구성에 따라 TPUv5e 및 TPUv4를 사용하여 학습했습니다. Gemini Ultra 교육에는 여러 데이터 센터에 걸쳐 Google이 소유한 대규모 TPUv4 가속기를 사용했습니다. 이는 새로운 인프라 문제를 야기했던 이전 플래그십 모델인 PaLM-2에 비해 규모가 크게 증가한 것입니다.

Gemini와 다른 LLM 비교

텍스트 이해

Gemini와 다른 LLM의 비교

출처: 구글 딥마인드

이미지 이해

Gemini와 다른 LLM의 비교

출처: 구글 딥마인드

여기에서 자세히 알아보세요.

쌍둥이 자리의 장점

1. 모든 Google 앱과 원활하게 통합

이제 Gemini는 지도, YouTube, Gmail 등을 포함한 모든 Google 앱과 원활하게 통합됩니다. 특정 앱을 쿼리하려면 앱 이름 앞에 ‘@’를 붙인 다음 쿼리어를 입력하면 됩니다. GPT 및 플러그인을 사용하여 ChatGPT에서도 유사한 통합을 달성할 수 있지만, Gemini의 기본 통합과 같은 수준의 매끄러움을 제공하지는 못할 수도 있습니다.

제미니 통합

검색 엔진 기술에 대한 Google의 유명한 전문성은 의심할 여지없이 Gemini의 웹 브라우징 기능을 향상시키는 데까지 확장됩니다. 검색 알고리즘과 인덱싱의 기본 강점을 활용하는 Gemini는 사용자에게 원활하고 효율적인 브라우징 환경을 제공합니다.

2. 멀티모달 기능

이제 Gemini 채팅 인터페이스에서 이미지 이해를 포함한 멀티모달 기능을 추가 비용 없이 제공합니다. 테스트 중 성능은 괜찮았지만 GPT-4V의 정확도에는 미치지 못할 수 있습니다. 그럼에도 불구하고 무료 서비스라는 점을 감안하면 불평할 수는 없겠죠? 😉 지표에 따라 Gemini Ultra가 GPT-4V를 능가할 가능성이 있습니다.

제미니 멀티모달

3. 취미 활동가 및 학생 무료 액세스

이 분야에 뛰어들고 싶지만 비용 때문에 GPT API에 액세스하는 데 제약이 있는 야심 찬 LLM 개발자를 위해 Google은 Gemini Pro 1.0 API에 대한 무료 액세스를 제공합니다. 이를 통해 무료 웹 기반 개발자 도구인 Google AI Studio에서 분당 최대 60개의 쿼리를 수행할 수 있습니다. Google AI Studio를 사용하면 신속하게 프롬프트를 개발하고 앱 개발을 위한 API 키를 얻을 수 있습니다. Google 계정으로 Google AI 스튜디오에 로그인하면 이 무료 할당량을 활용할 수 있습니다. LLM 여정을 시작하고 임베딩, 벡터 데이터베이스, 시맨틱 검색 등을 살펴볼 수 있는 좋은 기회입니다.

Google AI 스튜디오

4. 가격 대비 가치

한 달에 20달러만 내면 ChatGPT Plus를 통해 GPT-4에 액세스할 수 있습니다. 또는 같은 가격으로 2TB의 클라우드 저장 공간과 Gmail 및 문서 등의 Google 앱과의 통합 등의 추가 혜택이 포함된 Gemini Ultra 1.0과 함께 Gemini Advanced를 이용할 수 있습니다. 하지만 Gemini Advanced에 액세스하려면 Google One AI 프리미엄 요금제에 가입해야 합니다. 이러한 요구 사항에도 불구하고 비용 대비 더 큰 가치를 제공합니다.

Google 원 요금제

스탠다드 요금제와 프리미엄 요금제 사이에 500GB의 저장 용량과 Gemini Advanced에 액세스할 수 있는 중간 요금제를 도입하면 특히 학생과 중간 정도의 저장 용량 요구 사항을 가진 사용자의 Gemini 접근성이 크게 향상될 것입니다. 구글, 듣고 계신다면 이 제안을 고려해 주세요.

제미니의 다음 계획은 무엇인가요?

구글의 딥마인드는 최근 일주일 전에 Gemini Pro 1.5를 출시하는 등 Gemini 모델을 지속적으로 발전시키고 있습니다. 이 업데이트된 버전에서는 컨텍스트 창이 128,000 토큰으로 확장되었습니다. 또한, 일부 개발자 및 기업 고객 그룹은 이제 AI Studio 및 Vertex AI의 비공개 미리보기를 통해 최대 100만 토큰의 훨씬 더 큰 컨텍스트 창을 실험할 수 있습니다. 일반적인 논픽션 책에는 약 30만 개의 토큰이 포함되어 있습니다. Gemini Pro 1.5의 100만 토큰 컨텍스트 창을 통해 사용자는 이제 쿼리 요청 시 전체 장부를 업로드할 수 있으며, 이는 GPT-4의 128,000 토큰 컨텍스트 창에 비해 괄목할 만한 발전입니다.

AI 업계에서 LLM이 포화 상태인 가운데 구글은 이번에 향상된 아키텍처, 신속한 대응, 구글 생태계 내 원활한 통합을 통해 금빛 성공을 거둔 것으로 보입니다. 이는 실제로 올바른 방향으로 나아가는 한 걸음이 될 수 있으며, OpenAI와 다른 경쟁자들을 긴장하게 만들 수 있습니다.

AI 시대에 기업은 잘 훈련된 직원을 확보하는 것이 매우 중요하며, 직원 교육에 AI를 도입하는 것은 상당한 투자가 될 수 있습니다. 직원 교육을 위한 AI 솔루션을 찾고 있다면 Cody가 적합한 도구입니다. ChatGPT 및 Gemini와 마찬가지로 Cody는 고유한 지식 기반을 사용하여 비즈니스 데이터, 팀, 프로세스 및 고객에 대해 학습할 수 있습니다. Cody는 모델에 구애받지 않으므로 요구 사항에 따라 모델을 쉽게 전환할 수 있습니다.

코디를 통해 기업은 AI의 힘을 활용하여 각자의 필요에 맞는 개인화된 지능형 비서를 만들 수 있으며, 이는 AI 기반 비즈니스 솔루션의 세계를 더욱 확장할 수 있는 유망한 솔루션이 될 것입니다.

More From Our Blog

그루크와 라마 3: 판도를 바꾸는 듀오

그루크와 라마 3: 판도를 바꾸는 듀오

몇 달 전, ‘Groq’이라는 새로운 회사가 갑자기 등장해 AI 업계에 혁신을 일으켰습니다. 이들은 개발자들이 LLM, 특히 라마, 믹스트랄, 젬마와 같은 오픈 소스 엔진의 추론 엔진으로서 LP...

Read More
2024년 무료 오픈 소스 LLM 상위 5가지

2024년 무료 오픈 소스 LLM 상위 5가지

LLM은 이제 소개할 필요가 없을 정도로 보편화되어 있습니다. 기술 업계에 종사하든 그렇지 않든, 매일 어떤 형태의 LLM을 접했거나 현재 사용하고 있을 가능성이 높습니다. 현재 가장 눈에 �...

Read More

Build Your Own Business AI

Get Started Free
Top