{"id":32410,"date":"2023-11-07T18:37:44","date_gmt":"2023-11-07T18:37:44","guid":{"rendered":"https:\/\/meetcody.ai\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/"},"modified":"2023-11-16T11:49:18","modified_gmt":"2023-11-16T11:49:18","slug":"gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig","status":"publish","type":"post","link":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/","title":{"rendered":"GPT-4 Vision: Was kann sie leisten und warum ist sie wichtig?"},"content":{"rendered":"<p><span style=\"font-weight: 400;\">Hier kommt GPT-4 Vision (GPT-4V) ins Spiel, eine bahnbrechende Entwicklung von OpenAI, die die Leistung von Deep Learning mit Computer Vision kombiniert.  <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Dieses Modell geht \u00fcber das Textverst\u00e4ndnis hinaus und befasst sich mit visuellen Inhalten. W\u00e4hrend GPT-3 sich durch textbasiertes Verst\u00e4ndnis auszeichnete, macht GPT-4 Vision einen gewaltigen Sprung, indem es visuelle Elemente in sein Repertoire integriert.  <\/span><\/p>\n<p><span style=\"font-weight: 400;\">In diesem Blog werden wir die faszinierende Welt von GPT-4 Vision erkunden und die m\u00f6glichen Anwendungen, die zugrunde liegende Technologie und die ethischen \u00dcberlegungen im Zusammenhang mit dieser leistungsstarken KI-Entwicklung untersuchen.<\/span><\/p>\n<h2><b>Was ist GPT-4 Vision (GPT-4V)?<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision, oft auch als GPT-4V bezeichnet, stellt einen bedeutenden Fortschritt auf dem Gebiet der k\u00fcnstlichen Intelligenz dar. Dabei werden zus\u00e4tzliche Modalit\u00e4ten wie Bilder in gro\u00dfe Sprachmodelle (LLMs) integriert. Diese Innovation er\u00f6ffnet neue Horizonte f\u00fcr die k\u00fcnstliche Intelligenz, da multimodale LLMs das Potenzial haben, die F\u00e4higkeiten sprachbasierter Systeme zu erweitern, neuartige Schnittstellen einzuf\u00fchren und ein breiteres Spektrum an Aufgaben zu l\u00f6sen, was letztlich einzigartige Erfahrungen f\u00fcr die Nutzer bietet. Es baut auf den Erfolgen von GPT-3 auf, einem Modell, das f\u00fcr sein nat\u00fcrliches Sprachverst\u00e4ndnis bekannt ist. GPT-4 Vision beh\u00e4lt nicht nur dieses Verst\u00e4ndnis von Text bei, sondern erweitert auch seine M\u00f6glichkeiten, visuelle Inhalte zu verarbeiten und zu erzeugen.  <\/span><\/p>\n<blockquote class=\"twitter-tweet\">\n<p dir=\"ltr\" lang=\"en\">Hier ist eine Demo der gpt-4-vision API, die ich <a href=\"https:\/\/twitter.com\/bubble?ref_src=twsrc%5Etfw\"> in@bubble<\/a> in 30 Minuten erstellt habe.<\/p>\n<p>Es nimmt eine URL, wandelt sie in ein Bild um und sendet sie \u00fcber die Vision-API, um mit individuellen Vorschl\u00e4gen zur Optimierung der Landing Page zu reagieren.  <a href=\"https:\/\/t.co\/dzRfMuJYsp\">pic.twitter.com\/dzRfMuJYsp<\/a><\/p>\n<p>&#8211; Seth Kramer (@sethjkramer) <a href=\"https:\/\/twitter.com\/sethjkramer\/status\/1721662666056315294?ref_src=twsrc%5Etfw\">November 6, 2023<\/a><\/p><\/blockquote>\n<p><script async=\"\" src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><\/p>\n<p><span style=\"font-weight: 400;\">Dieses multimodale KI-Modell verf\u00fcgt \u00fcber die einzigartige F\u00e4higkeit, sowohl textliche als auch visuelle Informationen zu verstehen. Hier erhalten Sie einen Einblick in sein immenses Potenzial:<\/span><\/p>\n<h3><b>Visuelle Fragenbeantwortung (VQA)<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4V kann Fragen zu Bildern beantworten, z. B. &#8220;Was ist das f\u00fcr ein Hund?&#8221; oder &#8220;Was passiert auf diesem Bild?&#8221;.<\/span><\/p>\n<blockquote class=\"twitter-tweet\">\n<p dir=\"ltr\" lang=\"en\">begonnen, mit gpt-4 vision API zu spielen <a href=\"https:\/\/t.co\/vZmFt5X24S\">pic.twitter.com\/vZmFt5X24S<\/a><\/p>\n<p>&#8211; Ibelick (@Ibelick) <a href=\"https:\/\/twitter.com\/Ibelick\/status\/1721654235752763878?ref_src=twsrc%5Etfw\">November 6, 2023<\/a><\/p><\/blockquote>\n<p><script async=\"\" src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><\/p>\n<h3><b>Bild-Klassifizierung<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Es kann Objekte und Szenen in Bildern identifizieren und Autos, Katzen, Str\u00e4nde und vieles mehr unterscheiden.<\/span><\/p>\n<h3><b>Bildunterschriften<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4V kann Bildbeschreibungen generieren, die S\u00e4tze wie &#8220;Eine schwarze Katze sitzt auf einer roten Couch&#8221; oder &#8220;Eine Gruppe von Menschen spielt Volleyball am Strand&#8221; enthalten.<\/span><\/p>\n<h3><b>Bild-\u00dcbersetzung<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Das Modell kann Text in Bildern von einer Sprache in eine andere \u00fcbersetzen.<\/span><\/p>\n<h3><b>Kreatives Schreiben<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4V ist nicht nur auf das Verstehen und Erzeugen von Text beschr\u00e4nkt, sondern kann auch verschiedene kreative Inhaltsformate wie Gedichte, Codes, Skripte, Musikst\u00fccke, E-Mails und Briefe erstellen und Bilder nahtlos einbinden.<\/span><\/p>\n<p><b><br \/>\n  <i>Lesen Sie mehr: <\/i><br \/>\n<\/b><a href=\"https:\/\/meetcody.ai\/blog\/openais-dev-day-reveals-updates-128k-context-pricing-leaks\/\"><br \/>\n  <b><br \/>\n    <i>GPT-4 Turbo 128K-Kontext: Alles, was Sie wissen m\u00fcssen<\/i><br \/>\n  <\/b><br \/>\n<\/a><\/p>\n<h2><b>Wie kann ich auf GPT-4 Vision zugreifen?<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">Der Zugriff auf GPT-4 Vision erfolgt haupts\u00e4chlich \u00fcber die von OpenAI bereitgestellten APIs. Diese APIs erm\u00f6glichen es Entwicklern, das Modell in ihre Anwendungen zu integrieren und seine F\u00e4higkeiten f\u00fcr verschiedene Aufgaben zu nutzen. OpenAI bietet verschiedene Preisstufen und Nutzungspl\u00e4ne f\u00fcr GPT-4 Vision an, so dass es f\u00fcr viele Nutzer zug\u00e4nglich ist. Die Verf\u00fcgbarkeit von GPT-4 Vision \u00fcber APIs macht es vielseitig und anpassungsf\u00e4hig f\u00fcr verschiedene Anwendungsf\u00e4lle.<\/span><\/p>\n<h2><b>Wie viel kostet GPT-4 Vision?<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">Die Preise f\u00fcr GPT-4 Vision k\u00f6nnen je nach Nutzung, Volumen und den von Ihnen gew\u00e4hlten APIs oder Diensten variieren.  <\/span><a href=\"https:\/\/meetcody.ai\/blog\/openai-devday-announcements-live-stream-conference\/\"><span style=\"font-weight: 400;\">OpenAI<\/span><\/a><span style=\"font-weight: 400;\">  bietet in der Regel detaillierte Preisinformationen auf seiner offiziellen Website oder seinem Entwicklerportal. Die Nutzer k\u00f6nnen die verschiedenen Preisstufen, Nutzungsbeschr\u00e4nkungen und Abonnementoptionen pr\u00fcfen, um den am besten geeigneten Plan zu ermitteln.<\/span><\/p>\n<h2><b>Was ist der Unterschied zwischen GPT-3 und GPT-4 Vision?<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision stellt einen bedeutenden Fortschritt gegen\u00fcber GPT-3 dar, vor allem im Hinblick auf die F\u00e4higkeit, visuelle Inhalte zu verstehen und zu erzeugen. W\u00e4hrend sich GPT-3 auf textbasiertes Verstehen und Generieren konzentrierte, integriert GPT-4 Vision nahtlos Text und Bilder in seine F\u00e4higkeiten. Hier sind die wichtigsten Unterschiede zwischen den beiden Modellen:<\/span><\/p>\n<h3><b>Multimodale F\u00e4higkeit<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision kann gleichzeitig Text und Bilder verarbeiten und verstehen, was es zu einer echten multimodalen KI macht. GPT-3 hingegen konzentrierte sich haupts\u00e4chlich auf Text.<\/span><\/p>\n<h3><b>Visuelles Verstehen<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision kann Bilder analysieren und interpretieren und liefert detaillierte Beschreibungen und Antworten auf Fragen zu visuellen Inhalten. Dem GPT-3 fehlt diese F\u00e4higkeit, da es in erster Linie im Bereich des Textes arbeitet.<\/span><\/p>\n<h3><b>Generierung von Inhalten<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">W\u00e4hrend GPT-3 die Erstellung von textbasierten Inhalten beherrscht, bringt GPT-4 Vision die Inhaltserstellung auf die n\u00e4chste Stufe, indem es Bilder in kreative Inhalte einbezieht, von Gedichten und Codes bis hin zu Skripten und Musikkompositionen.<\/span><\/p>\n<h3><b>Bildgest\u00fctzte \u00dcbersetzung<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision kann Text in Bildern von einer Sprache in eine andere \u00fcbersetzen, eine Aufgabe, die \u00fcber die F\u00e4higkeiten von GPT-3 hinausgeht.<\/span><\/p>\n<h2><b>Welche Technologie wird bei GPT-4 Vision verwendet?<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">Um die M\u00f6glichkeiten von GPT-4 Vision voll aussch\u00f6pfen zu k\u00f6nnen, ist es wichtig, die Technologie zu verstehen, die seiner Funktionalit\u00e4t zugrunde liegt. Im Kern beruht GPT-4 Vision auf Deep-Learning-Techniken, insbesondere auf neuronalen Netzen.  <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Das Modell besteht aus mehreren Schichten miteinander verbundener Knoten, die der Struktur des menschlichen Gehirns nachempfunden sind, wodurch es in der Lage ist, umfangreiche Datens\u00e4tze effektiv zu verarbeiten und zu verstehen. Zu den wichtigsten technologischen Komponenten von GPT-4 Vision geh\u00f6ren:<\/span><\/p>\n<h3><b>1. Architektur des Transformators<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Wie seine Vorg\u00e4nger nutzt auch GPT-4 Vision die Transformer-Architektur, die sich besonders f\u00fcr die Verarbeitung sequenzieller Daten eignet. Diese Architektur ist ideal f\u00fcr die Verarbeitung von textlichen und visuellen Informationen und bietet eine solide Grundlage f\u00fcr die F\u00e4higkeiten des Modells.<\/span><\/p>\n<h3><b>2. Multimodales Lernen<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Das entscheidende Merkmal von GPT-4 Vision ist seine F\u00e4higkeit zum multimodalen Lernen. Das bedeutet, dass das Modell Text und Bilder gleichzeitig verarbeiten kann, so dass es in der Lage ist, Textbeschreibungen zu Bildern zu erstellen, Fragen zu visuellen Inhalten zu beantworten und sogar Bilder auf der Grundlage von Textbeschreibungen zu erzeugen. Die Verschmelzung dieser Modalit\u00e4ten ist der Schl\u00fcssel zur Vielseitigkeit von GPT-4 Vision.<\/span><\/p>\n<h3><b>3. Pre-Training und Feinabstimmung<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision durchl\u00e4uft einen zweistufigen Ausbildungsprozess. In der Pre-Trainingsphase lernt es durch die Analyse umfangreicher Datens\u00e4tze, Texte und Bilder zu verstehen und zu erzeugen. Anschlie\u00dfend wird es einer Feinabstimmung unterzogen, einem dom\u00e4nenspezifischen Trainingsprozess, der seine F\u00e4higkeiten f\u00fcr Anwendungen verfeinert.<\/span><\/p>\n<p><b><br \/>\n  <i>Lernen Sie LLaVA kennen: <\/i><br \/>\n<\/b><a href=\"https:\/\/meetcody.ai\/blog\/meet-llava-the-new-competitor-to-gpt-4-vision\/\"><br \/>\n  <b><br \/>\n    <i>Der neue Konkurrent von GPT-4 Vision<\/i><br \/>\n  <\/b><br \/>\n<\/a><\/p>\n<h2><b>Schlussfolgerung<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision ist ein leistungsf\u00e4higes neues Werkzeug, das das Potenzial hat, eine breite Palette von Branchen und Anwendungen zu revolutionieren.  <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Mit ihrer weiteren Entwicklung wird sie wahrscheinlich noch leistungsf\u00e4higer und vielseitiger werden und neue Horizonte f\u00fcr KI-gesteuerte Anwendungen er\u00f6ffnen. Dennoch sind die verantwortungsvolle Entwicklung und der Einsatz von GPT-4 Vision bei gleichzeitiger Abw\u00e4gung von Innovation und ethischen Erw\u00e4gungen von gr\u00f6\u00dfter Bedeutung, um sicherzustellen, dass dieses leistungsf\u00e4hige Instrument der Gesellschaft zugute kommt.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Da wir in das Zeitalter der KI eintreten, m\u00fcssen wir unbedingt unsere Praktiken und Vorschriften anpassen, um das volle Potenzial der GPT-4 Vision zum Wohle der Menschheit zu nutzen.<\/span><\/p>\n<p><b><br \/>\n  <i>Lesen Sie mehr: <\/i><br \/>\n<\/b><a href=\"https:\/\/meetcody.ai\/blog\/open-ai-chatgpt-enterprise-pricing-buy-benefits-compare\/\"><br \/>\n  <b><br \/>\n    <i>OpenAIs ChatGPT Unternehmen: Kosten, Nutzen und Sicherheit<\/i><br \/>\n  <\/b><br \/>\n<\/a><\/p>\n<h2><b>H\u00e4ufig gestellte Fragen (FAQs)<\/b><\/h2>\n<h3><b>1. Was ist GPT Vision, und wie funktioniert es bei der Bilderkennung?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT Vision ist eine KI-Technologie, die Bilder automatisch analysiert, um Objekte, Text, Personen und vieles mehr zu identifizieren. Die Benutzer m\u00fcssen lediglich ein Bild hochladen, und GPT Vision kann Beschreibungen des Bildinhalts bereitstellen, die eine Umwandlung von Bild in Text erm\u00f6glichen.<\/span><\/p>\n<h3><b>2. Welche OCR-Funktionen bietet GPT Vision, und welche Arten von Text k\u00f6nnen erkannt werden?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT Vision verf\u00fcgt \u00fcber eine branchenf\u00fchrende OCR-Technologie (Optical Character Recognition), die Text in Bildern, einschlie\u00dflich handgeschriebenem Text, genau erkennen kann. Es kann gedruckten und handgeschriebenen Text mit hoher Pr\u00e4zision in elektronischen Text umwandeln, was es f\u00fcr verschiedene Szenarien n\u00fctzlich macht.<\/span><\/p>\n<p>&nbsp;<\/p>\n<blockquote class=\"twitter-tweet\">\n<p dir=\"ltr\" lang=\"en\">GPT-4-Vision ist auch beim Lesen von Text sehr gut! Ich konnte einfach ein paar Anweisungen an den Rand meines Mocks schreiben und er hat sie befolgt \ud83e\udd2f. Es f\u00fcgt Javascript hinzu und macht die Hover-Status rot! <a href=\"https:\/\/t.co\/PmcS0u4xOT\">pic.twitter.com\/PmcS0u4xOT<\/a><\/p>\n<p>&#8211; Sawyer Hood (@sawyerhood) <a href=\"https:\/\/twitter.com\/sawyerhood\/status\/1721924480304603320?ref_src=twsrc%5Etfw\">November 7, 2023<\/a><\/p><\/blockquote>\n<p><script async=\"\" src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><\/p>\n<h3><b>3. Kann GPT Vision komplexe Diagramme und Schaubilder analysieren?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Ja, GPT Vision ist in der Lage, komplexe Diagramme und Grafiken zu analysieren, was es f\u00fcr Aufgaben wie das Extrahieren von Informationen aus Datenvisualisierungen wertvoll macht.<\/span><\/p>\n<h3><b>4. Unterst\u00fctzt GPT-4V die sprach\u00fcbergreifende Erkennung von Bildinhalten?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Ja, der GPT-4V unterst\u00fctzt die Erkennung mehrerer Sprachen, darunter die wichtigsten Weltsprachen wie Chinesisch, Englisch, Japanisch und andere. Es kann Bildinhalte in verschiedenen Sprachen genau erkennen und in entsprechende Textbeschreibungen umwandeln.<\/span><\/p>\n<h3><b>5. In welchen Anwendungsszenarien k\u00f6nnen die Bilderkennungsfunktionen des GPT-4V eingesetzt werden?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Die Bilderkennungsfunktionen des GPT-4V sind vielseitig einsetzbar, z. B. in den Bereichen E-Commerce, Dokumentendigitalisierung, barrierefreie Dienste, Sprachenlernen und vieles mehr. Es kann Einzelpersonen und Unternehmen bei der Bearbeitung bildlastiger Aufgaben unterst\u00fctzen und so die Arbeitseffizienz verbessern.<\/span><\/p>\n<h3><b>6. Welche Arten von Bildern kann GPT-4V analysieren?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4V kann verschiedene Arten von Bildern analysieren, darunter Fotos, Zeichnungen, Diagramme und Tabellen, solange das Bild klar genug f\u00fcr die Interpretation ist.<\/span><\/p>\n<h3><b>7. Kann das GPT-4V Text in handschriftlichen Dokumenten erkennen?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Ja, der GPT-4V kann dank seiner fortschrittlichen OCR-Technologie Text in handschriftlichen Dokumenten mit hoher Genauigkeit erkennen.<\/span><\/p>\n<h3><b>8. Unterst\u00fctzt das GPT-4V die Erkennung von Text in mehreren Sprachen?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Ja, der GPT-4V unterst\u00fctzt die Mehrsprachenerkennung und kann Text in mehreren Sprachen erkennen, wodurch er f\u00fcr eine Vielzahl von Benutzern geeignet ist.<\/span><\/p>\n<h3><b>9. Wie genau ist das GPT-4V bei der Bilderkennung?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Die Genauigkeit der Bilderkennung des GPT-4V variiert je nach Komplexit\u00e4t und Qualit\u00e4t des Bildes. Sie ist in der Regel sehr genau bei einfacheren Bildern wie Produkten oder Logos und wird mit mehr Training immer besser.<\/span><\/p>\n<h3><b>10. Gibt es irgendwelche Nutzungsgrenzen f\u00fcr GPT-4V?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">&#8211; Die Nutzungsbeschr\u00e4nkungen f\u00fcr GPT-4V h\u00e4ngen vom Abonnementplan des Nutzers ab. Kostenlose Nutzer k\u00f6nnen eine begrenzte Anzahl von Aufforderungen pro Monat erhalten, w\u00e4hrend kostenpflichtige Tarife h\u00f6here oder gar keine Begrenzungen bieten k\u00f6nnen. Au\u00dferdem sind Inhaltsfilter vorhanden, um sch\u00e4dliche Nutzungen zu verhindern.<\/span><\/p>\n<h2>Trivia (oder nicht?!)<\/h2>\n<blockquote class=\"twitter-tweet\">\n<p dir=\"ltr\" lang=\"en\">GPT-4V + TTS = AI-Sporterz\u00e4hler \ud83e\ude84\u26bd\ufe0f<\/p>\n<p>Jedes Einzelbild eines Fu\u00dfballvideos an gpt-4-vision-preview \u00fcbergeben und mit einer einfachen Eingabeaufforderung aufgefordert, eine Erz\u00e4hlung zu erstellen<\/p>\n<p>Keine Bearbeitungen, das ist so, wie es vom Model kam (aka kann SO VIEL BESSER sein) <a href=\"https:\/\/t.co\/KfC2pGt02X\">pic.twitter.com\/KfC2pGt02X<\/a><\/p>\n<p>&#8211; Gonzalo Espinoza Graham \ud83c\udff4\u200d\u2620\ufe0f (@geepytee) <a href=\"https:\/\/twitter.com\/geepytee\/status\/1721705524176257296?ref_src=twsrc%5Etfw\">November 7, 2023<\/a><\/p><\/blockquote>\n<p><script async=\"\" src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Hier kommt GPT-4 Vision (GPT-4V) ins Spiel, eine bahnbrechende Entwicklung von OpenAI, die die Leistung von Deep Learning mit Computer Vision kombiniert. Dieses Modell geht \u00fcber das Textverst\u00e4ndnis hinaus und befasst sich mit visuellen Inhalten. W\u00e4hrend GPT-3 sich durch textbasiertes Verst\u00e4ndnis auszeichnete, macht GPT-4 Vision einen gewaltigen Sprung, indem es visuelle Elemente in sein Repertoire<a class=\"excerpt-read-more\" href=\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/\" title=\"ReadGPT-4 Vision: Was kann sie leisten und warum ist sie wichtig?\">&#8230; Read more &raquo;<\/a><\/p>\n","protected":false},"author":1,"featured_media":32401,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[197,80],"tags":[450,448,388],"class_list":["post-32410","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai-tools-de","category-kunstliche-intelligenz","tag-gpt-4-vision-de","tag-gpt-4v-de","tag-offene-ki"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v21.8 (Yoast SEO v24.2) - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>GPT-4 Vision: Was kann sie leisten und warum ist sie wichtig?<\/title>\n<meta name=\"description\" content=\"GPT-4 Vision (GPT-4V), eine bahnbrechende Entwicklung von OpenAI, kombiniert die Leistung von Deep Learning mit Computer Vision. Seine Merkmale sind\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"GPT-4 Vision: Was kann sie leisten und warum ist sie wichtig?\" \/>\n<meta property=\"og:description\" content=\"GPT-4 Vision (GPT-4V), eine bahnbrechende Entwicklung von OpenAI, kombiniert die Leistung von Deep Learning mit Computer Vision. Seine Merkmale sind\" \/>\n<meta property=\"og:url\" content=\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/\" \/>\n<meta property=\"og:site_name\" content=\"Cody - The AI Trained on Your Business\" \/>\n<meta property=\"article:published_time\" content=\"2023-11-07T18:37:44+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-11-16T11:49:18+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1156\" \/>\n\t<meta property=\"og:image:height\" content=\"648\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Oriol Zertuche\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@oriol003\" \/>\n<meta name=\"twitter:site\" content=\"@meetcodyai\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Oriol Zertuche\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"9 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/\"},\"author\":{\"name\":\"Oriol Zertuche\",\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/person\/b3486c07f03571f834cfb7646dba8749\"},\"headline\":\"GPT-4 Vision: Was kann sie leisten und warum ist sie wichtig?\",\"datePublished\":\"2023-11-07T18:37:44+00:00\",\"dateModified\":\"2023-11-16T11:49:18+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/\"},\"wordCount\":1741,\"publisher\":{\"@id\":\"https:\/\/meetcody.ai\/#organization\"},\"image\":{\"@id\":\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png\",\"keywords\":[\"gpt-4 Vision\",\"gpt-4v\",\"Offene KI\"],\"articleSection\":[\"AI-Tools\",\"K\u00fcnstliche Intelligenz\"],\"inLanguage\":\"de-DE\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/\",\"url\":\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/\",\"name\":\"GPT-4 Vision: Was kann sie leisten und warum ist sie wichtig?\",\"isPartOf\":{\"@id\":\"https:\/\/meetcody.ai\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png\",\"datePublished\":\"2023-11-07T18:37:44+00:00\",\"dateModified\":\"2023-11-16T11:49:18+00:00\",\"description\":\"GPT-4 Vision (GPT-4V), eine bahnbrechende Entwicklung von OpenAI, kombiniert die Leistung von Deep Learning mit Computer Vision. Seine Merkmale sind\",\"breadcrumb\":{\"@id\":\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#primaryimage\",\"url\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png\",\"contentUrl\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png\",\"width\":1156,\"height\":648,\"caption\":\"GPT-4 with Vision (GPT-4V), a groundbreaking advancement by OpenAI, combines the power of deep learning with computer vision.\u00a0Its features are\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/meetcody.ai\/de\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"GPT-4 Vision: Was kann sie leisten und warum ist sie wichtig?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/meetcody.ai\/#website\",\"url\":\"https:\/\/meetcody.ai\/\",\"name\":\"Cody AI - The AI Trained on Your Business\",\"description\":\"AI Powered Knowledge Base for Employees\",\"publisher\":{\"@id\":\"https:\/\/meetcody.ai\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/meetcody.ai\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/meetcody.ai\/#organization\",\"name\":\"Cody AI - The AI Trained on Your Business\",\"url\":\"https:\/\/meetcody.ai\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/05\/logo-codyai.svg\",\"contentUrl\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/05\/logo-codyai.svg\",\"width\":\"1024\",\"height\":\"1024\",\"caption\":\"Cody AI - The AI Trained on Your Business\"},\"image\":{\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/x.com\/meetcodyai\",\"https:\/\/discord.com\/invite\/jXEVDcFxqs\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/person\/b3486c07f03571f834cfb7646dba8749\",\"name\":\"Oriol Zertuche\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/b54b9af69d5e8feacb5a92bf0d4be8c751d589ef418e21e6f69f48e4283b8525?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/b54b9af69d5e8feacb5a92bf0d4be8c751d589ef418e21e6f69f48e4283b8525?s=96&d=mm&r=g\",\"caption\":\"Oriol Zertuche\"},\"description\":\"Oriol Zertuche is the CEO of CODESM and Cody AI. As an engineering student from the University of Texas-Pan American, Oriol leveraged his expertise in technology and web development to establish renowned marketing firm CODESM. He later developed Cody AI, a smart AI assistant trained to support businesses and their team members. Oriol believes in delivering practical business solutions through innovative technology.\",\"sameAs\":[\"https:\/\/meetcody.ai\",\"https:\/\/www.linkedin.com\/in\/oriolzertuche\/\",\"https:\/\/x.com\/oriol003\"],\"url\":\"https:\/\/meetcody.ai\/de\/blog\/author\/alien\/\"}]}<\/script>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"GPT-4 Vision: Was kann sie leisten und warum ist sie wichtig?","description":"GPT-4 Vision (GPT-4V), eine bahnbrechende Entwicklung von OpenAI, kombiniert die Leistung von Deep Learning mit Computer Vision. Seine Merkmale sind","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/","og_locale":"de_DE","og_type":"article","og_title":"GPT-4 Vision: Was kann sie leisten und warum ist sie wichtig?","og_description":"GPT-4 Vision (GPT-4V), eine bahnbrechende Entwicklung von OpenAI, kombiniert die Leistung von Deep Learning mit Computer Vision. Seine Merkmale sind","og_url":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/","og_site_name":"Cody - The AI Trained on Your Business","article_published_time":"2023-11-07T18:37:44+00:00","article_modified_time":"2023-11-16T11:49:18+00:00","og_image":[{"width":1156,"height":648,"url":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png","type":"image\/png"}],"author":"Oriol Zertuche","twitter_card":"summary_large_image","twitter_creator":"@oriol003","twitter_site":"@meetcodyai","twitter_misc":{"Written by":"Oriol Zertuche","Est. reading time":"9 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#article","isPartOf":{"@id":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/"},"author":{"name":"Oriol Zertuche","@id":"https:\/\/meetcody.ai\/#\/schema\/person\/b3486c07f03571f834cfb7646dba8749"},"headline":"GPT-4 Vision: Was kann sie leisten und warum ist sie wichtig?","datePublished":"2023-11-07T18:37:44+00:00","dateModified":"2023-11-16T11:49:18+00:00","mainEntityOfPage":{"@id":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/"},"wordCount":1741,"publisher":{"@id":"https:\/\/meetcody.ai\/#organization"},"image":{"@id":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#primaryimage"},"thumbnailUrl":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png","keywords":["gpt-4 Vision","gpt-4v","Offene KI"],"articleSection":["AI-Tools","K\u00fcnstliche Intelligenz"],"inLanguage":"de-DE"},{"@type":"WebPage","@id":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/","url":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/","name":"GPT-4 Vision: Was kann sie leisten und warum ist sie wichtig?","isPartOf":{"@id":"https:\/\/meetcody.ai\/#website"},"primaryImageOfPage":{"@id":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#primaryimage"},"image":{"@id":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#primaryimage"},"thumbnailUrl":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png","datePublished":"2023-11-07T18:37:44+00:00","dateModified":"2023-11-16T11:49:18+00:00","description":"GPT-4 Vision (GPT-4V), eine bahnbrechende Entwicklung von OpenAI, kombiniert die Leistung von Deep Learning mit Computer Vision. Seine Merkmale sind","breadcrumb":{"@id":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/"]}]},{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#primaryimage","url":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png","contentUrl":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png","width":1156,"height":648,"caption":"GPT-4 with Vision (GPT-4V), a groundbreaking advancement by OpenAI, combines the power of deep learning with computer vision.\u00a0Its features are"},{"@type":"BreadcrumbList","@id":"https:\/\/meetcody.ai\/de\/blog\/gpt-4-mit-vision-was-kann-es-leisten-und-warum-ist-es-wichtig\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/meetcody.ai\/de\/"},{"@type":"ListItem","position":2,"name":"GPT-4 Vision: Was kann sie leisten und warum ist sie wichtig?"}]},{"@type":"WebSite","@id":"https:\/\/meetcody.ai\/#website","url":"https:\/\/meetcody.ai\/","name":"Cody AI - The AI Trained on Your Business","description":"AI Powered Knowledge Base for Employees","publisher":{"@id":"https:\/\/meetcody.ai\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/meetcody.ai\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de-DE"},{"@type":"Organization","@id":"https:\/\/meetcody.ai\/#organization","name":"Cody AI - The AI Trained on Your Business","url":"https:\/\/meetcody.ai\/","logo":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/meetcody.ai\/#\/schema\/logo\/image\/","url":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/05\/logo-codyai.svg","contentUrl":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/05\/logo-codyai.svg","width":"1024","height":"1024","caption":"Cody AI - The AI Trained on Your Business"},"image":{"@id":"https:\/\/meetcody.ai\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/meetcodyai","https:\/\/discord.com\/invite\/jXEVDcFxqs"]},{"@type":"Person","@id":"https:\/\/meetcody.ai\/#\/schema\/person\/b3486c07f03571f834cfb7646dba8749","name":"Oriol Zertuche","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/meetcody.ai\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/b54b9af69d5e8feacb5a92bf0d4be8c751d589ef418e21e6f69f48e4283b8525?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/b54b9af69d5e8feacb5a92bf0d4be8c751d589ef418e21e6f69f48e4283b8525?s=96&d=mm&r=g","caption":"Oriol Zertuche"},"description":"Oriol Zertuche is the CEO of CODESM and Cody AI. As an engineering student from the University of Texas-Pan American, Oriol leveraged his expertise in technology and web development to establish renowned marketing firm CODESM. He later developed Cody AI, a smart AI assistant trained to support businesses and their team members. Oriol believes in delivering practical business solutions through innovative technology.","sameAs":["https:\/\/meetcody.ai","https:\/\/www.linkedin.com\/in\/oriolzertuche\/","https:\/\/x.com\/oriol003"],"url":"https:\/\/meetcody.ai\/de\/blog\/author\/alien\/"}]}},"_links":{"self":[{"href":"https:\/\/meetcody.ai\/de\/wp-json\/wp\/v2\/posts\/32410","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/meetcody.ai\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/meetcody.ai\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/meetcody.ai\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/meetcody.ai\/de\/wp-json\/wp\/v2\/comments?post=32410"}],"version-history":[{"count":1,"href":"https:\/\/meetcody.ai\/de\/wp-json\/wp\/v2\/posts\/32410\/revisions"}],"predecessor-version":[{"id":32470,"href":"https:\/\/meetcody.ai\/de\/wp-json\/wp\/v2\/posts\/32410\/revisions\/32470"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/meetcody.ai\/de\/wp-json\/wp\/v2\/media\/32401"}],"wp:attachment":[{"href":"https:\/\/meetcody.ai\/de\/wp-json\/wp\/v2\/media?parent=32410"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/meetcody.ai\/de\/wp-json\/wp\/v2\/categories?post=32410"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/meetcody.ai\/de\/wp-json\/wp\/v2\/tags?post=32410"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}