{"id":70683,"date":"2026-03-24T03:02:17","date_gmt":"2026-03-24T03:02:17","guid":{"rendered":"https:\/\/meetcody.ai\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/"},"modified":"2026-03-26T18:07:32","modified_gmt":"2026-03-26T18:07:32","slug":"gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google","status":"publish","type":"post","link":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/","title":{"rendered":"Gemini Embedding 2: pierwszy multimodalny model osadzania Google"},"content":{"rendered":"<p style=\"text-align: center;\"><em>Gemini Embedding 2: funkcje, testy por\u00f3wnawcze, ceny i spos\u00f3b rozpocz\u0119cia pracy<\/em><!-- notionvc: c383b1b6-2ff8-40bd-8227-0a70d481c796 --><\/p>\n<p>W zesz\u0142ym tygodniu Google opublikowa\u0142o  <a href=\"https:\/\/meetcody.ai\/blog\/google-introduces-the-multimodal-gemini-ultra-pro-nano-models\/\">Gemini<\/a>  Embedding 2, pierwszy natywnie multimodalny model osadzania zbudowany na architekturze Gemini. Je\u015bli pracujesz z osadzeniami w jakimkolwiek charakterze, zas\u0142uguje to na twoj\u0105 uwag\u0119. Ma potencja\u0142, aby znacz\u0105co zak\u0142\u00f3ci\u0107 potoki osadzania wielu modeli, na kt\u00f3rych polega obecnie wi\u0119kszo\u015b\u0107 zespo\u0142\u00f3w.  <\/p>\n<p>Do tej pory flagowe modele osadzania OpenAI, Cohere i Voyage by\u0142y oparte g\u0142\u00f3wnie na tek\u015bcie. Istnia\u0142o kilka opcji multimodalnych &#8211; <a href=\"https:\/\/openai.com\/index\/clip\/\">CLIP<\/a> dla wyr\u00f3wnania obrazu i tekstu, <a href=\"https:\/\/blog.voyageai.com\/2026\/01\/15\/voyage-multimodal-3-5\/\">Voyage Multimodal 3.5<\/a> dla obraz\u00f3w i wideo &#8211; ale \u017cadna nie obejmowa\u0142a pe\u0142nego spektrum modalno\u015bci w jednej, ujednoliconej przestrzeni wektorowej. D\u017awi\u0119k zazwyczaj musia\u0142 by\u0107 transkrybowany przed osadzeniem. Wideo wymaga\u0142o ekstrakcji klatek w po\u0142\u0105czeniu z oddzielnym osadzaniem transkrypcji. Obrazy \u017cy\u0142y ca\u0142kowicie we w\u0142asnej przestrzeni wektorowej.    <\/p>\n<p>Gemini Embedding 2 zmienia to r\u00f3wnanie. Jeden model, jedno wywo\u0142anie API, jedna przestrze\u0144 wektorowa. <\/p>\n<p>Przyjrzyjmy si\u0119 nowo\u015bciom.<\/p>\n<h2>Czym jest Gemini Embedding 2?<\/h2>\n<p><a href=\"https:\/\/blog.google\/innovation-and-ai\/models-and-research\/gemini-models\/gemini-embedding-2\/\">Gemini Embedding 2<\/a> (<code>gemini-embedding-2-preview<\/code>) to pierwszy w pe\u0142ni multimodalny <a href=\"https:\/\/meetcody.ai\/blog\/text-embedding-models\/\">model osadzania<\/a> Google DeepMind. Bierze tekst, obrazy, klipy wideo, nagrania audio i dokumenty PDF i konwertuje je wszystkie na wektory, kt\u00f3re \u017cyj\u0105 w tej samej wsp\u00f3lnej przestrzeni semantycznej. <\/p>\n<p>W przeciwie\u0144stwie do wcze\u015bniejszych podej\u015b\u0107 multimodalnych, takich jak CLIP, kt\u00f3re \u0142\u0105cz\u0105 koder wizyjny z koderem tekstowym i dostosowuj\u0105 je do kontrastowego uczenia si\u0119 na ko\u0144cu, Gemini Embedding 2 jest zbudowany na samym modelu Gemini. Oznacza to, \u017ce od podstaw dziedziczy g\u0142\u0119bokie zrozumienie intermodalne. <\/p>\n<div id=\"attachment_70663\" style=\"width: 1034px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-70663\" class=\"wp-image-70663 size-full\" src=\"https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding.png\" alt=\"Osadzanie multimodalne\" width=\"1024\" height=\"587\" srcset=\"https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding.png 1024w, https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding-300x172.png 300w, https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding-768x440.png 768w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><p id=\"caption-attachment-70663\" class=\"wp-caption-text\">Obraz wygenerowany przy u\u017cyciu Nano Banana<\/p><\/div>\n<p><strong>Praktyczny przyk\u0142ad:<\/strong> Wyobra\u017a sobie, \u017ce tworzysz system zarz\u0105dzania nauczaniem (LMS) z samouczkami wideo, wyk\u0142adami audio i pisemnymi przewodnikami. Dzi\u0119ki Gemini Embedding 2 mo\u017cesz przechowywa\u0107 osadzenia dla ca\u0142ej tej zawarto\u015bci w jednej przestrzeni wektorowej i zbudowa\u0107 <a href=\"https:\/\/meetcody.ai\/blog\/rag-private-clouds\/\">chatbota opartego na RAG<\/a>, kt\u00f3ry pobiera odpowiednie <a href=\"https:\/\/meetcody.ai\/blog\/how-does-cody-generate-responses-using-your-documents\/\">fragmenty<\/a> zar\u00f3wno z film\u00f3w, audio, jak i dokument\u00f3w. Wcze\u015bniej wymaga\u0142o to wielowarstwowego potoku osadzania &#8211; a nawet wtedy przechwytywa\u0142o tylko transkrypcje, pomijaj\u0105c wizualny kontekst wideo lub ton g\u0142osu m\u00f3wcy.  <\/p>\n<p>Model wykorzystuje <a href=\"https:\/\/arxiv.org\/abs\/2205.13147\">Matryoshka Representation Learning<\/a>, co oznacza, \u017ce nie musisz u\u017cywa\u0107 wszystkich 3072 wymiar\u00f3w, je\u015bli ich nie potrzebujesz. Mo\u017cna zmniejszy\u0107 rozmiar do 1536 lub 768 i nadal uzyskiwa\u0107 u\u017cyteczne wyniki. <\/p>\n<p><em>Matryoshka Representation Learning (MRL) to technika uczenia modeli osadzania tak, aby wyuczone reprezentacje by\u0142y u\u017cyteczne nie tylko w ich pe\u0142nej wymiarowo\u015bci, ale tak\u017ce w r\u00f3\u017cnych mniejszych wymiarach &#8211; zagnie\u017cd\u017conych jedna w drugiej jak rosyjskie lalki matrioszki. Podczas treningu funkcja straty jest obliczana nie tylko na pe\u0142nym osadzeniu, ale tak\u017ce na wielu prefiksach wektora osadzenia. Zach\u0119ca to model do upakowania najwa\u017cniejszych informacji w najwcze\u015bniejszych wymiarach, przy czym ka\u017cdy kolejny wymiar dodaje drobniejsze szczeg\u00f3\u0142y &#8211; struktur\u0119 od grubej do drobnej.  <\/em><\/p>\n<h2>Obs\u0142ugiwane tryby i limity wej\u015bciowe<\/h2>\n<p>Model akceptuje pi\u0119\u0107 typ\u00f3w danych wej\u015bciowych, z kt\u00f3rych wszystkie s\u0105 mapowane do tej samej przestrzeni osadzania:<\/p>\n<table>\n<thead>\n<tr>\n<th>Modalno\u015b\u0107<\/th>\n<th>Limit wej\u015bciowy<\/th>\n<th>Formaty<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Tekst<\/td>\n<td>Do 8 192 token\u00f3w<\/td>\n<td>Zwyk\u0142y tekst<\/td>\n<\/tr>\n<tr>\n<td>Obrazy<\/td>\n<td>Do 6 obraz\u00f3w na \u017c\u0105danie<\/td>\n<td>PNG, JPEG<\/td>\n<\/tr>\n<tr>\n<td>Wideo<\/td>\n<td>Do 120 sekund<\/td>\n<td>MP4, MOV<\/td>\n<\/tr>\n<tr>\n<td>D\u017awi\u0119k<\/td>\n<td>Do 80 sekund (natywny, bez transkrypcji)<\/td>\n<td>MP3, WAV<\/td>\n<\/tr>\n<tr>\n<td>Pliki PDF<\/td>\n<td>Bezpo\u015brednio osadzone<\/td>\n<td>Dokumenty PDF<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<h2>Jak wypada w por\u00f3wnaniu z istniej\u0105cymi modelami<\/h2>\n<p><strong>TLDR:<\/strong> Nowy model Google Gemini Embedding 2 przewy\u017csza swoich konkurent\u00f3w (swojego poprzednika, Amazon Nova 2 i Voyage Multimodal 3.5) w niemal ka\u017cdej modalno\u015bci: tek\u015bcie, obrazie, wideo i mowie. Najbardziej przekonuj\u0105co prowadzi w wyszukiwaniu wideo i dopasowywaniu obraz\u00f3w do tekstu. Jedynym testem por\u00f3wnawczym, w kt\u00f3rym nie wygrywa, jest wyszukiwanie dokument\u00f3w, w kt\u00f3rym Voyage nieznacznie wyprzedza. Wyszukiwanie tekstu za pomoc\u0105 mowy to kategoria, w kt\u00f3rej Gemini jest jedynym w\u0142a\u015bcicielem, poniewa\u017c \u017caden konkurent nawet jej nie obs\u0142uguje.   <\/p>\n<p>Google opublikowa\u0142o por\u00f3wnania z w\u0142asnymi starszymi modelami, Amazon Nova 2 Multimodal Embeddings i Voyage Multimodal 3.5. Oto pe\u0142ny obraz sytuacji: <\/p>\n<h3>Tekst-Tekst<\/h3>\n<table>\n<thead>\n<tr>\n<th>Metryczny<\/th>\n<th>Gemini Embedding 2<\/th>\n<th>gemini-embedding-001<\/th>\n<th>Amazon Nova 2<\/th>\n<th>Voyage Multimodal 3.5<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>MTEB Wieloj\u0119zyczny (\u015brednie zadanie)<\/td>\n<td><strong>69.9<\/strong><\/td>\n<td>68.4<\/td>\n<td>63.8**<\/td>\n<td>58.5***<\/td>\n<\/tr>\n<tr>\n<td>Kod MTEB (\u015brednie zadanie)<\/td>\n<td><strong>84.0<\/strong><\/td>\n<td>76.0<\/td>\n<td>*<\/td>\n<td>*<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Gemini Embedding 2 prowadzi w wieloj\u0119zycznym tek\u015bcie z wygodnym marginesem i przeskakuje o 8 punkt\u00f3w nad swoim poprzednikiem w wyszukiwaniu kodu. Ani Amazon Nova 2, ani Voyage nie zg\u0142aszaj\u0105 wynik\u00f3w kodu. <\/p>\n<h3>Obraz tekstowy<\/h3>\n<table>\n<thead>\n<tr>\n<th>Metryczny<\/th>\n<th>Gemini Embedding 2<\/th>\n<th>multimodalembedding@001<\/th>\n<th>Amazon Nova 2<\/th>\n<th>Voyage Multimodal 3.5<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>TextCaps (recall@1)<\/td>\n<td><strong>89.6<\/strong><\/td>\n<td>74.0<\/td>\n<td>76.0<\/td>\n<td>79.4<\/td>\n<\/tr>\n<tr>\n<td>Docci (recall@1)<\/td>\n<td><strong>93.4<\/strong><\/td>\n<td>&#8211;<\/td>\n<td>84.0<\/td>\n<td>83.8<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Wyra\u017ana przewaga w wyszukiwaniu tekstu na obraz &#8211; ponad 9 punkt\u00f3w przewagi nad najbli\u017cszym konkurentem w obu testach por\u00f3wnawczych.<\/p>\n<h3>Obraz-Tekst<\/h3>\n<table>\n<thead>\n<tr>\n<th>Metryczny<\/th>\n<th>Gemini Embedding 2<\/th>\n<th>multimodalembedding@001<\/th>\n<th>Amazon Nova 2<\/th>\n<th>Voyage Multimodal 3.5<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>TextCaps (recall@1)<\/td>\n<td><strong>97.4<\/strong><\/td>\n<td>88.1<\/td>\n<td>88.9<\/td>\n<td>88.6<\/td>\n<\/tr>\n<tr>\n<td>Docci (recall@1)<\/td>\n<td><strong>91.3<\/strong><\/td>\n<td>&#8211;<\/td>\n<td>76.5<\/td>\n<td>77.4<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Wyszukiwanie obraz-tekst wykazuje najwi\u0119ksz\u0105 luk\u0119 &#8211; prawie 15 punkt\u00f3w przewagi nad Amazon Nova 2 na Docci.<\/p>\n<h3>Dokument tekstowy<\/h3>\n<table>\n<thead>\n<tr>\n<th>Metryczny<\/th>\n<th>Gemini Embedding 2<\/th>\n<th>multimodalembedding@001<\/th>\n<th>Amazon Nova 2<\/th>\n<th>Voyage Multimodal 3.5<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>ViDoRe v2 (ndcg@10)<\/td>\n<td>64.9<\/td>\n<td>28.9<\/td>\n<td>60.6<\/td>\n<td><strong>65.5**<\/strong><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Jedyny test por\u00f3wnawczy, w kt\u00f3rym Voyage Multimodal 3.5 wyprzedza (zg\u0142oszony przez u\u017cytkownika). Wyszukiwanie dokument\u00f3w jest zbli\u017cone mi\u0119dzy najlepszymi modelami. <\/p>\n<h3>Tekst-Wideo<\/h3>\n<table>\n<thead>\n<tr>\n<th>Metryczny<\/th>\n<th>Gemini Embedding 2<\/th>\n<th>multimodalembedding@001<\/th>\n<th>Amazon Nova 2<\/th>\n<th>Voyage Multimodal 3.5<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Vatex (ndcg@10)<\/td>\n<td><strong>68.8<\/strong><\/td>\n<td>54.9<\/td>\n<td>60.3<\/td>\n<td>55.2<\/td>\n<\/tr>\n<tr>\n<td>MSR-VTT (ndcg@10)<\/td>\n<td><strong>68.0<\/strong><\/td>\n<td>57.9<\/td>\n<td>67.0<\/td>\n<td>63.0**<\/td>\n<\/tr>\n<tr>\n<td>Youcook2 (ndcg@10)<\/td>\n<td><strong>52.5<\/strong><\/td>\n<td>34.9<\/td>\n<td>34.7<\/td>\n<td>31.4**<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Pobieranie wideo to miejsce, w kt\u00f3rym Gemini Embedding 2 osi\u0105ga najwi\u0119ksz\u0105 przewag\u0119 &#8211; ponad 17 punkt\u00f3w nad Voyage na Youcook2 i ponad 13 punkt\u00f3w na Vatex.<\/p>\n<h3>Mowa-tekst<\/h3>\n<table>\n<thead>\n<tr>\n<th>Metryczny<\/th>\n<th>Gemini Embedding 2<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>MSEB (mrr@10)<\/td>\n<td><strong>73.9<\/strong><\/td>\n<\/tr>\n<tr>\n<td>MSEB ASR**** (mrr@10)<\/td>\n<td><strong>70.4<\/strong><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Pobieranie tekstu mowy jest ca\u0142kowicie bezsporne &#8211; ani Amazon, ani Voyage go nie obs\u0142uguj\u0105. Jest to kategoria, kt\u00f3rej Gemini Embedding 2 jest bezpo\u015brednim w\u0142a\u015bcicielem. <\/p>\n<p><em>&#8211; wynik nie jest dost\u0119pny ** zg\u0142oszony samodzielnie *** voyage-3.5 **** Model ASR konwertuje zapytania audio na tekst<\/em><\/p>\n<h2>Wycena<\/h2>\n<p>Model jest obecnie darmowy w ramach publicznej wersji zapoznawczej. Po przej\u015bciu na p\u0142atny poziom, oto podzia\u0142: <\/p>\n<table>\n<thead>\n<tr>\n<th><\/th>\n<th>Poziom darmowy<\/th>\n<th>Poziom p\u0142atny (za 1 mln token\u00f3w)<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Wprowadzanie tekstu<\/td>\n<td>Bezp\u0142atnie<\/td>\n<td>$0.20<\/td>\n<\/tr>\n<tr>\n<td>Wprowadzanie obrazu<\/td>\n<td>Bezp\u0142atnie<\/td>\n<td>0,45 USD (0,00012 USD za obraz)<\/td>\n<\/tr>\n<tr>\n<td>Wej\u015bcie audio<\/td>\n<td>Bezp\u0142atnie<\/td>\n<td>6,50 USD (0,00016 USD za sekund\u0119)<\/td>\n<\/tr>\n<tr>\n<td>Wej\u015bcie wideo<\/td>\n<td>Bezp\u0142atnie<\/td>\n<td>12,00 USD (0,00079 USD za klatk\u0119)<\/td>\n<\/tr>\n<tr>\n<td>U\u017cywane do ulepszania produkt\u00f3w Google<\/td>\n<td>Tak<\/td>\n<td>Nie<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<h2><strong>Pierwsze kroki<\/strong><\/h2>\n<p>Model jest ju\u017c dost\u0119pny w publicznej wersji zapoznawczej za po\u015brednictwem Gemini API i Vertex AI pod identyfikatorem modelu  <code>gemini-embedding-2-preview<\/code>. Integruje si\u0119 z LangChain, LlamaIndex, Haystack, Weaviate, Qdrant, ChromaDB i Vector Search.<\/p>\n<pre><code class=\"language-jsx\">from google import genai\nfrom google.genai import types\n\n# For Vertex AI:\n# PROJECT_ID='&lt;add_here&gt;'\n# client = genai.Client(vertexai=True, project=PROJECT_ID, location='us-central1')\n\nclient = genai.Client()\n\nwith open(\"example.png\", \"rb\") as f:\n    image_bytes = f.read()\n\nwith open(\"sample.mp3\", \"rb\") as f:\n    audio_bytes = f.read()\n\n# Embed text, image, and audio \nresult = client.models.embed_content(\n    model=\"gemini-embedding-2-preview\",\n    contents=[\n        \"What is the meaning of life?\",\n        types.Part.from_bytes(\n            data=image_bytes,\n            mime_type=\"image\/png\",\n        ),\n        types.Part.from_bytes(\n            data=audio_bytes,\n            mime_type=\"audio\/mpeg\",\n        ),\n    ],\n)\n\nprint(result.embeddings)\n<\/code><\/pre>\n<h2>Wypr\u00f3buj tutaj!<\/h2>\n<p>Stworzyli\u015bmy <a href=\"https:\/\/gemini-2-trial.vercel.app\">aplikacj\u0119<\/a> demonstracyjn\u0105, w kt\u00f3rej mo\u017cna przetestowa\u0107 multimodaln\u0105 wydajno\u015b\u0107 wyszukiwania gemini-embedding-2.<\/p>\n<p>Klucz API mo\u017cna uzyska\u0107, loguj\u0105c si\u0119 na stronie <a href=\"http:\/\/aistudio.google.com\">aistudio.google.com.<\/a><\/p>\n<h2>Ograniczenia, na kt\u00f3re nale\u017cy zwr\u00f3ci\u0107 uwag\u0119<\/h2>\n<ul>\n<li>Model jest wci\u0105\u017c w fazie publicznej wersji zapoznawczej (tag &#8220;preview&#8221; oznacza, \u017ce ceny i zachowanie mog\u0105 ulec zmianie przed GA).<\/li>\n<li>Wej\u015bcie wideo jest ograniczone do 120 sekund, a audio do 80 sekund.<\/li>\n<li>Wydajno\u015b\u0107 w niszowych domenach, takich jak finansowa kontrola jako\u015bci, jest s\u0142absza; przed podj\u0119ciem decyzji nale\u017cy oceni\u0107 j\u0105 pod k\u0105tem konkretnych danych.<\/li>\n<li>W przypadku potok\u00f3w czysto tekstowych, bez plan\u00f3w multimodalnych, premia kosztowa w stosunku do modeli tekstowych mo\u017ce nie by\u0107 uzasadniona.<\/li>\n<\/ul>\n<h2>Podsumowanie<\/h2>\n<p>Gemini Embedding 2 to nie tylko stopniowa poprawa, to zmiana kategorii. Dla zespo\u0142\u00f3w buduj\u0105cych multimodalne systemy RAG, wyszukiwanie semantyczne w r\u00f3\u017cnych typach medi\u00f3w lub ujednolicone bazy wiedzy, rozwi\u0105zanie to sprowadza to, co kiedy\u015b by\u0142o problemem zwi\u0105zanym z wieloma modelami i wieloma potokami, do pojedynczego wywo\u0142ania API. Je\u015bli Twoje dane obejmuj\u0105 wi\u0119cej ni\u017c tylko tekst, jest to model, kt\u00f3ry nale\u017cy oceni\u0107 w pierwszej kolejno\u015bci.  <\/p>\n<p>Tworzenie multimodalnego RAG nie powinno oznacza\u0107 zszywania od podstaw modeli osadzania, wektorowych baz danych i logiki wyszukiwania. Je\u015bli potrzebujesz zarz\u0105dzanego rozwi\u0105zania <a href=\"https:\/\/meetcody.ai\/blog\/rag-as-a-service-unlock-generative-ai-for-your-business\/\">RAG-as-a-Service<\/a>, kt\u00f3re obs\u0142uguje potok osadzania, <a href=\"https:\/\/getcody.ai\/\">zarejestruj<\/a> si\u0119 w bezp\u0142atnej wersji pr\u00f3bnej w Cody i zacznij tworzy\u0107 ju\u017c dzi\u015b. <\/p>\n<p><!-- notionvc: 1819203a-dd06-4804-9886-3355db49e8de --><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Gemini Embedding 2: funkcje, testy por\u00f3wnawcze, ceny i spos\u00f3b rozpocz\u0119cia pracy W zesz\u0142ym tygodniu Google opublikowa\u0142o Gemini Embedding 2, pierwszy natywnie multimodalny model osadzania zbudowany na architekturze Gemini. Je\u015bli pracujesz z osadzeniami w jakimkolwiek charakterze, zas\u0142uguje to na twoj\u0105 uwag\u0119. Ma potencja\u0142, aby znacz\u0105co zak\u0142\u00f3ci\u0107 potoki osadzania wielu modeli, na kt\u00f3rych polega obecnie wi\u0119kszo\u015b\u0107 zespo\u0142\u00f3w.<a class=\"excerpt-read-more\" href=\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/\" title=\"ReadGemini Embedding 2: pierwszy multimodalny model osadzania Google\">&#8230; Read more &raquo;<\/a><\/p>\n","protected":false},"author":2,"featured_media":70660,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[203],"tags":[],"class_list":["post-70683","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-bez-kategorii"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v21.8 (Yoast SEO v24.2) - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Gemini Embedding 2: pierwszy multimodalny model osadzania Google<\/title>\n<meta name=\"description\" content=\"Gemini Embedding 2 firmy Google mapuje tekst, obrazy, wideo, audio i pliki PDF w jednej przestrzeni wektorowej. Przedstawiamy testy por\u00f3wnawcze, ceny i ich znaczenie dla potoku RAG.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/\" \/>\n<meta property=\"og:locale\" content=\"pl_PL\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Gemini Embedding 2: pierwszy multimodalny model osadzania Google\" \/>\n<meta property=\"og:description\" content=\"Gemini Embedding 2 firmy Google mapuje tekst, obrazy, wideo, audio i pliki PDF w jednej przestrzeni wektorowej. Przedstawiamy testy por\u00f3wnawcze, ceny i ich znaczenie dla potoku RAG.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/\" \/>\n<meta property=\"og:site_name\" content=\"Cody - The AI Trained on Your Business\" \/>\n<meta property=\"article:published_time\" content=\"2026-03-24T03:02:17+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2026-03-26T18:07:32+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding-cover-scaled.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"2560\" \/>\n\t<meta property=\"og:image:height\" content=\"1440\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Om Kamath\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@meetcodyai\" \/>\n<meta name=\"twitter:site\" content=\"@meetcodyai\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Om Kamath\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"7 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/\"},\"author\":{\"name\":\"Om Kamath\",\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/person\/cde65ec55b79cd833a9777d0a62e83c8\"},\"headline\":\"Gemini Embedding 2: pierwszy multimodalny model osadzania Google\",\"datePublished\":\"2026-03-24T03:02:17+00:00\",\"dateModified\":\"2026-03-26T18:07:32+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/\"},\"wordCount\":1271,\"publisher\":{\"@id\":\"https:\/\/meetcody.ai\/#organization\"},\"image\":{\"@id\":\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding-cover-scaled.jpg\",\"articleSection\":[\"Bez kategorii\"],\"inLanguage\":\"pl-PL\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/\",\"url\":\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/\",\"name\":\"Gemini Embedding 2: pierwszy multimodalny model osadzania Google\",\"isPartOf\":{\"@id\":\"https:\/\/meetcody.ai\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding-cover-scaled.jpg\",\"datePublished\":\"2026-03-24T03:02:17+00:00\",\"dateModified\":\"2026-03-26T18:07:32+00:00\",\"description\":\"Gemini Embedding 2 firmy Google mapuje tekst, obrazy, wideo, audio i pliki PDF w jednej przestrzeni wektorowej. Przedstawiamy testy por\u00f3wnawcze, ceny i ich znaczenie dla potoku RAG.\",\"breadcrumb\":{\"@id\":\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#breadcrumb\"},\"inLanguage\":\"pl-PL\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#primaryimage\",\"url\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding-cover-scaled.jpg\",\"contentUrl\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding-cover-scaled.jpg\",\"width\":2560,\"height\":1440},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/meetcody.ai\/pl\/home-v2\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Gemini Embedding 2: pierwszy multimodalny model osadzania Google\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/meetcody.ai\/#website\",\"url\":\"https:\/\/meetcody.ai\/\",\"name\":\"Cody AI - The AI Trained on Your Business\",\"description\":\"AI Powered Knowledge Base for Employees\",\"publisher\":{\"@id\":\"https:\/\/meetcody.ai\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/meetcody.ai\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"pl-PL\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/meetcody.ai\/#organization\",\"name\":\"Cody AI - The AI Trained on Your Business\",\"url\":\"https:\/\/meetcody.ai\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/05\/logo-codyai.svg\",\"contentUrl\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/05\/logo-codyai.svg\",\"width\":\"1024\",\"height\":\"1024\",\"caption\":\"Cody AI - The AI Trained on Your Business\"},\"image\":{\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/x.com\/meetcodyai\",\"https:\/\/discord.com\/invite\/jXEVDcFxqs\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/person\/cde65ec55b79cd833a9777d0a62e83c8\",\"name\":\"Om Kamath\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/3903c678cd7f6c8df0a843ae177998f5d413954afa3062f984a030a889a97849?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/3903c678cd7f6c8df0a843ae177998f5d413954afa3062f984a030a889a97849?s=96&d=mm&r=g\",\"caption\":\"Om Kamath\"},\"description\":\"Om Kamath\",\"sameAs\":[\"http:\/\/meetcody.ai\"],\"url\":\"https:\/\/meetcody.ai\/pl\/blog\/author\/omkamath\/\"}]}<\/script>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"Gemini Embedding 2: pierwszy multimodalny model osadzania Google","description":"Gemini Embedding 2 firmy Google mapuje tekst, obrazy, wideo, audio i pliki PDF w jednej przestrzeni wektorowej. Przedstawiamy testy por\u00f3wnawcze, ceny i ich znaczenie dla potoku RAG.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/","og_locale":"pl_PL","og_type":"article","og_title":"Gemini Embedding 2: pierwszy multimodalny model osadzania Google","og_description":"Gemini Embedding 2 firmy Google mapuje tekst, obrazy, wideo, audio i pliki PDF w jednej przestrzeni wektorowej. Przedstawiamy testy por\u00f3wnawcze, ceny i ich znaczenie dla potoku RAG.","og_url":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/","og_site_name":"Cody - The AI Trained on Your Business","article_published_time":"2026-03-24T03:02:17+00:00","article_modified_time":"2026-03-26T18:07:32+00:00","og_image":[{"width":2560,"height":1440,"url":"https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding-cover-scaled.jpg","type":"image\/jpeg"}],"author":"Om Kamath","twitter_card":"summary_large_image","twitter_creator":"@meetcodyai","twitter_site":"@meetcodyai","twitter_misc":{"Written by":"Om Kamath","Est. reading time":"7 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#article","isPartOf":{"@id":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/"},"author":{"name":"Om Kamath","@id":"https:\/\/meetcody.ai\/#\/schema\/person\/cde65ec55b79cd833a9777d0a62e83c8"},"headline":"Gemini Embedding 2: pierwszy multimodalny model osadzania Google","datePublished":"2026-03-24T03:02:17+00:00","dateModified":"2026-03-26T18:07:32+00:00","mainEntityOfPage":{"@id":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/"},"wordCount":1271,"publisher":{"@id":"https:\/\/meetcody.ai\/#organization"},"image":{"@id":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#primaryimage"},"thumbnailUrl":"https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding-cover-scaled.jpg","articleSection":["Bez kategorii"],"inLanguage":"pl-PL"},{"@type":"WebPage","@id":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/","url":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/","name":"Gemini Embedding 2: pierwszy multimodalny model osadzania Google","isPartOf":{"@id":"https:\/\/meetcody.ai\/#website"},"primaryImageOfPage":{"@id":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#primaryimage"},"image":{"@id":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#primaryimage"},"thumbnailUrl":"https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding-cover-scaled.jpg","datePublished":"2026-03-24T03:02:17+00:00","dateModified":"2026-03-26T18:07:32+00:00","description":"Gemini Embedding 2 firmy Google mapuje tekst, obrazy, wideo, audio i pliki PDF w jednej przestrzeni wektorowej. Przedstawiamy testy por\u00f3wnawcze, ceny i ich znaczenie dla potoku RAG.","breadcrumb":{"@id":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#breadcrumb"},"inLanguage":"pl-PL","potentialAction":[{"@type":"ReadAction","target":["https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/"]}]},{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#primaryimage","url":"https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding-cover-scaled.jpg","contentUrl":"https:\/\/meetcody.ai\/wp-content\/uploads\/2026\/03\/embedding-cover-scaled.jpg","width":2560,"height":1440},{"@type":"BreadcrumbList","@id":"https:\/\/meetcody.ai\/pl\/blog\/gemini-embedding-2-pierwszy-multimodalny-model-osadzania-google\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/meetcody.ai\/pl\/home-v2\/"},{"@type":"ListItem","position":2,"name":"Gemini Embedding 2: pierwszy multimodalny model osadzania Google"}]},{"@type":"WebSite","@id":"https:\/\/meetcody.ai\/#website","url":"https:\/\/meetcody.ai\/","name":"Cody AI - The AI Trained on Your Business","description":"AI Powered Knowledge Base for Employees","publisher":{"@id":"https:\/\/meetcody.ai\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/meetcody.ai\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"pl-PL"},{"@type":"Organization","@id":"https:\/\/meetcody.ai\/#organization","name":"Cody AI - The AI Trained on Your Business","url":"https:\/\/meetcody.ai\/","logo":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/meetcody.ai\/#\/schema\/logo\/image\/","url":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/05\/logo-codyai.svg","contentUrl":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/05\/logo-codyai.svg","width":"1024","height":"1024","caption":"Cody AI - The AI Trained on Your Business"},"image":{"@id":"https:\/\/meetcody.ai\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/meetcodyai","https:\/\/discord.com\/invite\/jXEVDcFxqs"]},{"@type":"Person","@id":"https:\/\/meetcody.ai\/#\/schema\/person\/cde65ec55b79cd833a9777d0a62e83c8","name":"Om Kamath","image":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/meetcody.ai\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/3903c678cd7f6c8df0a843ae177998f5d413954afa3062f984a030a889a97849?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/3903c678cd7f6c8df0a843ae177998f5d413954afa3062f984a030a889a97849?s=96&d=mm&r=g","caption":"Om Kamath"},"description":"Om Kamath","sameAs":["http:\/\/meetcody.ai"],"url":"https:\/\/meetcody.ai\/pl\/blog\/author\/omkamath\/"}]}},"_links":{"self":[{"href":"https:\/\/meetcody.ai\/pl\/wp-json\/wp\/v2\/posts\/70683","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/meetcody.ai\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/meetcody.ai\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/meetcody.ai\/pl\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/meetcody.ai\/pl\/wp-json\/wp\/v2\/comments?post=70683"}],"version-history":[{"count":2,"href":"https:\/\/meetcody.ai\/pl\/wp-json\/wp\/v2\/posts\/70683\/revisions"}],"predecessor-version":[{"id":70701,"href":"https:\/\/meetcody.ai\/pl\/wp-json\/wp\/v2\/posts\/70683\/revisions\/70701"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/meetcody.ai\/pl\/wp-json\/wp\/v2\/media\/70660"}],"wp:attachment":[{"href":"https:\/\/meetcody.ai\/pl\/wp-json\/wp\/v2\/media?parent=70683"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/meetcody.ai\/pl\/wp-json\/wp\/v2\/categories?post=70683"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/meetcody.ai\/pl\/wp-json\/wp\/v2\/tags?post=70683"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}