ChatGPTキラー? ジェミニ1.5がグーグルのAIの未来に意味するもの
グーグル対オープンAI:グーグルの勝利か?
AIハイプ・トレインのバルドで的外れな成功を収めたグーグルは、最近、最新のAI製品ジェミニを発表した。 この立ち上げの一環として、バードはジェミニに改名し、新たにジェミニ・プロLLMを組み込んだ。 この変化の程度を把握するために、さらに掘り下げてみよう。
ジェミニAIとは?
Geminiは、LaMDAとPaLMに続くGoogleの最新の大規模言語モデル(LLM)である。 ジェミニは前モデルとは異なり、テキスト、画像、音声、コードを理解できるマルチモーダル対応で、理解力と推論能力が強化されている。
ジェミニAIのバリエーション
ジェミニAIは、3つのラージ言語モデルで構成されている:
- Gemini Nano:オンデバイスの効率性を高めるために最適化され、個人のデバイスに直接、迅速なAIソリューションを提供します。
- ジェミニ・プロ多用途でスケーラブルなモデルで、堅牢なパフォーマンスで多様なタスクに取り組むことができる。 Geminiチャットインターフェイスの無料版でご利用いただけます。
- ジェミニ・ウルトラ:ジェミニ・シリーズの最高峰で、複雑な問題解決を支援し、AI能力の最前線を進化させる。 Google One AI プレミアムプラン加入者限定。
Geminiモデルは、そのサイズと構成に応じて、TPUv5eとTPUv4を使ってトレーニングされた。 トレーニング・ジェミニ・ウルトラは、グーグルが複数のデータセンターに所有する大規模なTPUv4アクセラレータ群を使用した。 これは、インフラストラクチャーに新たな課題を突きつけていた以前のフラッグシップモデルPaLM-2よりも規模が大幅に拡大したことを意味する。
ジェミニと他のLLMとの比較
テキストの理解
イメージ理解
詳しくはこちら
双子座のメリット
1.すべてのGoogle Appsとのシームレスな統合
Geminiは現在、マップ、YouTube、Gmailなどを含むすべてのGoogle Appsとシームレスに統合されています。 特定のアプリに問い合わせるには、アプリ名の前に’@’を付け、その後に問い合わせを続けるだけです。 ChatGPTでもGPTやプラグインを使って同様の統合が可能ですが、Geminiのネイティブ統合と同じレベルのシームレスさは提供できないかもしれません。
検索エンジン技術におけるグーグルの有名な専門知識は、間違いなくジェミニのウェブブラウジング能力を向上させる。 検索アルゴリズムとインデックス作成における基礎的な強みを活用し、Geminiはユーザーにシームレスで効率的なブラウジング体験を提供する。
2.マルチモーダル機能
Geminiは現在、画像理解を含むマルチモーダル機能をGeminiチャットインターフェースに追加料金なしで提供しています。 テスト時の性能はまずまずだったが、GPT-4Vの精度には及ばないかもしれない。 とはいえ、無料なのだから文句は言えないだろう。 ;)ジェミニ・ウルトラがGPT-4Vを上回る可能性がある。
3.趣味と学生への無料アクセス
この分野に飛び込もうとしているが、コスト面でGPT APIへのアクセスに制約があるLLM開発者のために、GoogleはGemini Pro 1.0 APIへの無料アクセスを提供している。 これを使えば、無料のウェブベースの開発者ツールであるGoogle AI Studioで、1分間に最大60回のクエリーを行うことができる。 Google AI Studioでは、プロンプトを素早く開発し、アプリ開発のためのAPIキーを取得することができる。 GoogleアカウントでGoogle AI Studioにサインインすることで、この無料枠を利用することができます。 LLMの旅をスタートさせ、エンベッディング、ベクターデータベース、セマンティック検索などを探求する絶好の機会だ。
4.バリュー・フォー・マネー
月額20ドルで、ChatGPT Plus経由でGPT-4にアクセスできます。 また、同じ料金で、2TBのクラウドストレージやGmailやDocsなどのGoogle Appsとの統合などの追加特典が含まれるGemini Ultra 1.0を使ってGemini Advancedにアクセスすることもできる。 ただし、Gemini Advancedにアクセスするには、Google One AIプレミアムプランに加入する必要がある。 この条件にもかかわらず、より大きな価値を提供する。
スタンダードプランとプレミアムプランの間に、500GBのストレージとGemini Advancedへのアクセスを持つミッドティアプランを導入することで、特に学生や中程度のストレージを必要とするユーザーにとって、Geminiのアクセシビリティが大幅に向上するでしょう。 グーグル、もし聞いているなら、この提案を検討してほしい。
双子座の次なる目標は?
グーグルのディープマインドはジェミニ・モデルを継続的に進化させており、つい1週間前にはジェミニ・プロ1.5を発表したばかりだ。 この改訂版では、コンテキスト・ウィンドウが128,000トークンに拡張された。 さらに、一部の開発者と企業顧客は、AI StudioとVertex AIのプライベート・プレビューを通じて、最大100万トークンというさらに大きなコンテキスト・ウィンドウで実験できるようになった。 これを踏まえて考えると、一般的なノンフィクション本には約30万トークンが含まれている。 Gemini Pro 1.5の100万トークンコンテキストウィンドウにより、ユーザーはクエリーリクエストでブック全体をアップロードできるようになりました。
AI業界においてLLMが飽和状態にあるなか、グーグルは今回、その強化されたアーキテクチャ、迅速な対応、そしてグーグルのエコシステム内でのシームレスな統合によって、金字塔を打ち立てたようだ。 OpenAIや他の競合他社を油断させない、正しい方向への一歩となるかもしれない。
このAI時代において、企業にとって十分な訓練を受けた従業員を確保することは極めて重要であり、従業員教育のためにAIを取り入れることは大きな投資となり得る。 従業員を訓練するためのAIソリューションをお探しなら、Codyは最適なツールです。 ChatGPTやGeminiと同様に、Codyはあなたのビジネスデータ、チーム、プロセス、顧客について、あなた独自のナレッジベースを使ってトレーニングすることができます。 Codyは機種を問わないので、要求に応じて簡単に機種を変更することができる。
Codyを利用することで、企業はAIの力を活用し、ニーズに特化したパーソナライズされたインテリジェントなアシスタントを作成することができる。