{"id":32413,"date":"2023-11-07T18:37:44","date_gmt":"2023-11-07T18:37:44","guid":{"rendered":"https:\/\/meetcody.ai\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/"},"modified":"2023-11-16T11:49:21","modified_gmt":"2023-11-16T11:49:21","slug":"gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante","status":"publish","type":"post","link":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/","title":{"rendered":"Visi\u00f3n GPT-4: \u00bfDe qu\u00e9 es capaz y por qu\u00e9 es importante?"},"content":{"rendered":"<p><span style=\"font-weight: 400;\">Entra en escena GPT-4 Vision (GPT-4V), un avance innovador de OpenAI que combina la potencia del aprendizaje profundo con la visi\u00f3n por ordenador.  <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Este modelo va m\u00e1s all\u00e1 de la comprensi\u00f3n de textos y profundiza en los contenidos visuales. Mientras que GPT-3 destacaba en la comprensi\u00f3n basada en texto, GPT-4 Vision da un salto monumental al integrar elementos visuales en su repertorio.  <\/span><\/p>\n<p><span style=\"font-weight: 400;\">En este blog, exploraremos el cautivador mundo de la Visi\u00f3n GPT-4, examinando sus aplicaciones potenciales, la tecnolog\u00eda subyacente y las consideraciones \u00e9ticas asociadas a este poderoso desarrollo de la IA.<\/span><\/p>\n<h2><b>\u00bfQu\u00e9 es GPT-4 Vision (GPT-4V)?<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision, a menudo denominada GPT-4V, representa un avance significativo en el campo de la inteligencia artificial. Se trata de integrar modalidades adicionales, como las im\u00e1genes, en grandes modelos ling\u00fc\u00edsticos (LLM). Esta innovaci\u00f3n abre nuevos horizontes a la inteligencia artificial, ya que los LLM multimodales tienen el potencial de ampliar las capacidades de los sistemas basados en el lenguaje, introducir interfaces novedosas y resolver una gama m\u00e1s amplia de tareas, ofreciendo en \u00faltima instancia experiencias \u00fanicas a los usuarios. Se basa en los \u00e9xitos de GPT-3, un modelo famoso por su comprensi\u00f3n del lenguaje natural. GPT-4 Vision no s\u00f3lo conserva esta comprensi\u00f3n del texto, sino que tambi\u00e9n ampl\u00eda sus capacidades para procesar y generar contenidos visuales.  <\/span><\/p>\n<blockquote class=\"twitter-tweet\">\n<p dir=\"ltr\" lang=\"en\">Aqu\u00ed tienes una demo de la API gpt-4-vision que constru\u00ed <a href=\"https:\/\/twitter.com\/bubble?ref_src=twsrc%5Etfw\"> en@bubble<\/a> en 30 min.<\/p>\n<p>Toma una URL, la convierte en una imagen y la env\u00eda a trav\u00e9s de la API de Vision para responder con sugerencias personalizadas de optimizaci\u00f3n de la p\u00e1gina de destino.  <a href=\"https:\/\/t.co\/dzRfMuJYsp\">pic.twitter.com\/dzRfMuJYsp<\/a><\/p>\n<p>&#8211; Seth Kramer (@sethjkramer) <a href=\"https:\/\/twitter.com\/sethjkramer\/status\/1721662666056315294?ref_src=twsrc%5Etfw\">6 de noviembre de 2023<\/a><\/p><\/blockquote>\n<p><script async=\"\" src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><\/p>\n<p><span style=\"font-weight: 400;\">Este modelo de IA multimodal posee la capacidad \u00fanica de comprender tanto informaci\u00f3n textual como visual. He aqu\u00ed un atisbo de su inmenso potencial:<\/span><\/p>\n<h3><b>Respuesta visual a preguntas (VQA)<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4V puede responder a preguntas sobre im\u00e1genes, proporcionando respuestas como &#8220;\u00bfQu\u00e9 tipo de perro es \u00e9ste?&#8221; o &#8220;\u00bfQu\u00e9 est\u00e1 pasando en esta foto?&#8221;.<\/span><\/p>\n<blockquote class=\"twitter-tweet\">\n<p dir=\"ltr\" lang=\"en\">empezado a jugar con gpt-4 vision API <a href=\"https:\/\/t.co\/vZmFt5X24S\">pic.twitter.com\/vZmFt5X24S<\/a><\/p>\n<p>&#8211; Ibelick (@Ibelick) <a href=\"https:\/\/twitter.com\/Ibelick\/status\/1721654235752763878?ref_src=twsrc%5Etfw\">6 de noviembre de 2023<\/a><\/p><\/blockquote>\n<p><script async=\"\" src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><\/p>\n<h3><b>Clasificaci\u00f3n de im\u00e1genes<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Puede identificar objetos y escenas dentro de las im\u00e1genes, distinguiendo coches, gatos, playas y mucho m\u00e1s.<\/span><\/p>\n<h3><b>Subtitulado de im\u00e1genes<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4V puede generar descripciones de im\u00e1genes, elaborando frases como &#8220;Un gato negro sentado en un sof\u00e1 rojo&#8221; o &#8220;Un grupo de personas jugando al voleibol en la playa&#8221;.<\/span><\/p>\n<h3><b>Traducci\u00f3n de im\u00e1genes<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">El modelo puede traducir el texto de las im\u00e1genes de un idioma a otro.<\/span><\/p>\n<h3><b>Escritura creativa<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4V no se limita a comprender y generar texto; tambi\u00e9n puede crear diversos formatos de contenido creativo, como poemas, c\u00f3digos, guiones, piezas musicales, correos electr\u00f3nicos y cartas, e incorporar im\u00e1genes sin problemas.<\/span><\/p>\n<p><b><br \/>\n  <i>M\u00e1s informaci\u00f3n: <\/i><br \/>\n<\/b><a href=\"https:\/\/meetcody.ai\/blog\/openais-dev-day-reveals-updates-128k-context-pricing-leaks\/\"><br \/>\n  <b><br \/>\n    <i>Contexto GPT-4 Turbo 128K: Todo lo que necesita saber<\/i><br \/>\n  <\/b><br \/>\n<\/a><\/p>\n<h2><b>\u00bfC\u00f3mo acceder a GPT-4 Vision?<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">El acceso a GPT-4 Vision se realiza principalmente a trav\u00e9s de las API proporcionadas por OpenAI. Estas API permiten a los desarrolladores integrar el modelo en sus aplicaciones, lo que les permite aprovechar sus capacidades para diversas tareas. OpenAI ofrece diferentes niveles de precios y planes de uso para GPT-4 Vision, lo que la hace accesible a muchos usuarios. La disponibilidad de GPT-4 Vision a trav\u00e9s de API la hace vers\u00e1til y adaptable a diversos casos de uso.<\/span><\/p>\n<h2><b>\u00bfCu\u00e1nto cuesta GPT-4 Vision?<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">Los precios de GPT-4 Vision pueden variar en funci\u00f3n del uso, el volumen y las API o servicios espec\u00edficos que elija.  <\/span><a href=\"https:\/\/meetcody.ai\/blog\/openai-devday-announcements-live-stream-conference\/\"><span style=\"font-weight: 400;\">OpenAI<\/span><\/a><span style=\"font-weight: 400;\">  suele ofrecer informaci\u00f3n detallada sobre precios en su sitio web oficial o en su portal para desarrolladores. Los usuarios pueden explorar los niveles de precios, los l\u00edmites de uso y las opciones de suscripci\u00f3n para determinar el plan m\u00e1s adecuado.<\/span><\/p>\n<h2><b>\u00bfCu\u00e1l es la diferencia entre GPT-3 y GPT-4 Vision?<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision representa un avance significativo con respecto a GPT-3, principalmente en su capacidad para comprender y generar contenidos visuales. Mientras que GPT-3 se centraba en la comprensi\u00f3n y generaci\u00f3n basadas en texto, GPT-4 Vision integra a la perfecci\u00f3n texto e im\u00e1genes en sus capacidades. He aqu\u00ed las principales diferencias entre ambos modelos:<\/span><\/p>\n<h3><b>Capacidad multimodal<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision puede procesar y comprender simult\u00e1neamente texto e im\u00e1genes, lo que la convierte en una aut\u00e9ntica IA multimodal. GPT-3, en cambio, se centr\u00f3 principalmente en el texto.<\/span><\/p>\n<h3><b>Comprensi\u00f3n visual<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision puede analizar e interpretar im\u00e1genes, proporcionando descripciones detalladas y respuestas a preguntas sobre el contenido visual. GPT-3 carece de esta capacidad, ya que opera principalmente en el \u00e1mbito del texto.<\/span><\/p>\n<h3><b>Generaci\u00f3n de contenidos<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Mientras que GPT-3 es competente en la generaci\u00f3n de contenidos basados en texto, GPT-4 Vision lleva la generaci\u00f3n de contenidos al siguiente nivel incorporando im\u00e1genes a contenidos creativos, desde poemas y c\u00f3digos hasta guiones y composiciones musicales.<\/span><\/p>\n<h3><b>Traducci\u00f3n basada en im\u00e1genes<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision puede traducir el texto de las im\u00e1genes de un idioma a otro, una tarea que supera las capacidades de GPT-3.<\/span><\/p>\n<h2><b>\u00bfQu\u00e9 tecnolog\u00eda utiliza GPT-4 Vision?<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">Para apreciar plenamente las capacidades de GPT-4 Vision, es importante comprender la tecnolog\u00eda que sustenta su funcionalidad. En esencia, GPT-4 Vision se basa en t\u00e9cnicas de aprendizaje profundo, concretamente en redes neuronales.  <\/span><\/p>\n<p><span style=\"font-weight: 400;\">El modelo consta de m\u00faltiples capas de nodos interconectados, imitando la estructura del cerebro humano, lo que le permite procesar y comprender con eficacia extensos conjuntos de datos. Los componentes tecnol\u00f3gicos clave de GPT-4 Vision incluyen:<\/span><\/p>\n<h3><b>1. Arquitectura del transformador<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Al igual que sus predecesores, GPT-4 Vision utiliza la arquitectura de transformador, que destaca en el manejo de datos secuenciales. Esta arquitectura es ideal para procesar informaci\u00f3n textual y visual, y proporciona una base s\u00f3lida para las capacidades del modelo.<\/span><\/p>\n<h3><b>2. Aprendizaje multimodal<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">La caracter\u00edstica definitoria de GPT-4 Vision es su capacidad de aprendizaje multimodal. Esto significa que el modelo puede procesar texto e im\u00e1genes simult\u00e1neamente, lo que le permite generar descripciones textuales de las im\u00e1genes, responder a preguntas sobre contenido visual e incluso generar im\u00e1genes basadas en descripciones textuales. La fusi\u00f3n de estas modalidades es la clave de la versatilidad de GPT-4 Vision.<\/span><\/p>\n<h3><b>3. Preentrenamiento y puesta a punto<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision se somete a un proceso de formaci\u00f3n en dos fases. En la fase de preentrenamiento, aprende a comprender y generar texto e im\u00e1genes analizando extensos conjuntos de datos. Posteriormente, se somete a un proceso de perfeccionamiento, un proceso de formaci\u00f3n espec\u00edfico del dominio que perfecciona sus capacidades para las aplicaciones.<\/span><\/p>\n<p><b><br \/>\n  <i>Conozca a LLaVA: <\/i><br \/>\n<\/b><a href=\"https:\/\/meetcody.ai\/blog\/meet-llava-the-new-competitor-to-gpt-4-vision\/\"><br \/>\n  <b><br \/>\n    <i>El nuevo competidor de GPT-4 Vision<\/i><br \/>\n  <\/b><br \/>\n<\/a><\/p>\n<h2><b>Conclusi\u00f3n<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">GPT-4 Vision es una nueva y potente herramienta que tiene el potencial de revolucionar una amplia gama de industrias y aplicaciones.  <\/span><\/p>\n<p><span style=\"font-weight: 400;\">A medida que siga desarroll\u00e1ndose, es probable que sea a\u00fan m\u00e1s potente y vers\u00e1til, abriendo nuevos horizontes para las aplicaciones basadas en la IA. No obstante, el desarrollo y despliegue responsables de GPT-4 Vision, al tiempo que se equilibran la innovaci\u00f3n y las consideraciones \u00e9ticas, son primordiales para garantizar que esta poderosa herramienta beneficie a la sociedad.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">A medida que nos adentramos en la era de la IA, es imperativo adaptar nuestras pr\u00e1cticas y normativas para aprovechar todo el potencial de GPT-4 Vision en beneficio de la humanidad.<\/span><\/p>\n<p><b><br \/>\n  <i>M\u00e1s informaci\u00f3n: <\/i><br \/>\n<\/b><a href=\"https:\/\/meetcody.ai\/blog\/open-ai-chatgpt-enterprise-pricing-buy-benefits-compare\/\"><br \/>\n  <b><br \/>\n    <i>ChatGPT Enterprise de OpenAI: Coste, beneficios y seguridad<\/i><br \/>\n  <\/b><br \/>\n<\/a><\/p>\n<h2><b>Preguntas m\u00e1s frecuentes (FAQ)<\/b><\/h2>\n<h3><b>1. \u00bfQu\u00e9 es GPT Vision y c\u00f3mo funciona para el reconocimiento de im\u00e1genes?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT Vision es una tecnolog\u00eda de IA que analiza autom\u00e1ticamente im\u00e1genes para identificar objetos, texto, personas y mucho m\u00e1s. Los usuarios s\u00f3lo tienen que cargar una imagen, y GPT Vision puede proporcionar descripciones del contenido de la imagen, permitiendo la conversi\u00f3n de imagen a texto.<\/span><\/p>\n<h3><b>2. \u00bfCu\u00e1les son las capacidades de OCR de GPT Vision y qu\u00e9 tipos de texto puede reconocer?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT Vision cuenta con la tecnolog\u00eda OCR (reconocimiento \u00f3ptico de caracteres) l\u00edder del sector, capaz de reconocer con precisi\u00f3n texto en im\u00e1genes, incluido el texto manuscrito. Puede convertir texto impreso y manuscrito en texto electr\u00f3nico con gran precisi\u00f3n, lo que lo hace \u00fatil para diversas situaciones.<\/span><\/p>\n<p>&nbsp;<\/p>\n<blockquote class=\"twitter-tweet\">\n<p dir=\"ltr\" lang=\"en\">GPT-4-Vision tambi\u00e9n lee muy bien los textos. Me bastaba con escribir unas instrucciones en los m\u00e1rgenes de mi simulacro y las segu\u00eda \ud83e\udd2f. A\u00f1adi\u00f3 Javascript y hacer que los estados hover rojo! <a href=\"https:\/\/t.co\/PmcS0u4xOT\">pic.twitter.com\/PmcS0u4xOT<\/a><\/p>\n<p>&#8211; Sawyer Hood (@sawyerhood) <a href=\"https:\/\/twitter.com\/sawyerhood\/status\/1721924480304603320?ref_src=twsrc%5Etfw\">7 de noviembre de 2023<\/a><\/p><\/blockquote>\n<p><script async=\"\" src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><\/p>\n<h3><b>3. \u00bfPuede GPT Vision analizar tablas y gr\u00e1ficos complejos?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">S\u00ed, GPT Vision puede analizar tablas y gr\u00e1ficos complejos, por lo que resulta muy \u00fatil para tareas como la extracci\u00f3n de informaci\u00f3n de visualizaciones de datos.<\/span><\/p>\n<h3><b>4. \u00bfAdmite GPT-4V el reconocimiento multiling\u00fce del contenido de las im\u00e1genes?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">S\u00ed, GPT-4V admite el reconocimiento multiling\u00fce, incluidos los principales idiomas del mundo, como el chino, el ingl\u00e9s y el japon\u00e9s, entre otros. Puede reconocer con precisi\u00f3n contenidos de im\u00e1genes en distintos idiomas y convertirlos en las correspondientes descripciones de texto.<\/span><\/p>\n<h3><b>5. \u00bfEn qu\u00e9 escenarios de aplicaci\u00f3n pueden utilizarse las capacidades de reconocimiento de im\u00e1genes de GPT-4V?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">Las funciones de reconocimiento de im\u00e1genes de GPT-4V tienen muchas aplicaciones, como el comercio electr\u00f3nico, la digitalizaci\u00f3n de documentos, los servicios de accesibilidad y el aprendizaje de idiomas, entre otras. Puede ayudar a particulares y empresas en la gesti\u00f3n de tareas con muchas im\u00e1genes para mejorar la eficacia del trabajo.<\/span><\/p>\n<h3><b>6. \u00bfQu\u00e9 tipos de im\u00e1genes puede analizar GPT-4V?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">GPT-4V puede analizar varios tipos de im\u00e1genes, incluidas fotos, dibujos, diagramas y gr\u00e1ficos, siempre que la imagen sea lo suficientemente clara para su interpretaci\u00f3n.<\/span><\/p>\n<h3><b>7. \u00bfPuede GPT-4V reconocer texto en documentos escritos a mano?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">S\u00ed, GPT-4V puede reconocer texto en documentos manuscritos con gran precisi\u00f3n, gracias a su avanzada tecnolog\u00eda OCR.<\/span><\/p>\n<h3><b>8. \u00bfAdmite GPT-4V el reconocimiento de texto en varios idiomas?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">S\u00ed, GPT-4V admite el reconocimiento multiling\u00fce y puede reconocer texto en varios idiomas, lo que lo hace adecuado para una amplia gama de usuarios.<\/span><\/p>\n<h3><b>9. \u00bfCu\u00e1l es la precisi\u00f3n de GPT-4V en el reconocimiento de im\u00e1genes?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">La precisi\u00f3n del reconocimiento de im\u00e1genes de GPT-4V var\u00eda en funci\u00f3n de la complejidad y la calidad de la imagen. Suele ser muy preciso para im\u00e1genes m\u00e1s sencillas, como productos o logotipos, y mejora continuamente con m\u00e1s entrenamiento.<\/span><\/p>\n<h3><b>10. \u00bfExisten l\u00edmites de uso para GPT-4V?<\/b><\/h3>\n<p><span style=\"font-weight: 400;\">&#8211; Los l\u00edmites de uso de GPT-4V dependen del plan de suscripci\u00f3n del usuario. Los usuarios gratuitos pueden tener un n\u00famero limitado de avisos al mes, mientras que los planes de pago pueden ofrecer l\u00edmites m\u00e1s altos o ninguno. Adem\u00e1s, existen filtros de contenidos para evitar usos nocivos.<\/span><\/p>\n<h2>Trivialidades (\u00bfo no?)<\/h2>\n<blockquote class=\"twitter-tweet\">\n<p dir=\"ltr\" lang=\"en\">GPT-4V + TTS = AI narrador deportivo \ud83e\ude84\u26bd\ufe0f<\/p>\n<p>Pasamos todos los fotogramas de un v\u00eddeo de f\u00fatbol a gpt-4-vision-preview y, con unas sencillas instrucciones, le pedimos que generara una narraci\u00f3n.<\/p>\n<p>Sin ediciones, esto es como sali\u00f3 de la modelo (aka puede ser MUCHO MEJOR) <a href=\"https:\/\/t.co\/KfC2pGt02X\">pic.twitter.com\/KfC2pGt02X<\/a><\/p>\n<p>&#8211; Gonzalo Espinoza Graham \ud83c\udff4\u200d\u2620\ufe0f (@geepytee) <a href=\"https:\/\/twitter.com\/geepytee\/status\/1721705524176257296?ref_src=twsrc%5Etfw\">7 de noviembre de 2023<\/a><\/p><\/blockquote>\n<p><script async=\"\" src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Entra en escena GPT-4 Vision (GPT-4V), un avance innovador de OpenAI que combina la potencia del aprendizaje profundo con la visi\u00f3n por ordenador. Este modelo va m\u00e1s all\u00e1 de la comprensi\u00f3n de textos y profundiza en los contenidos visuales. Mientras que GPT-3 destacaba en la comprensi\u00f3n basada en texto, GPT-4 Vision da un salto monumental<a class=\"excerpt-read-more\" href=\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/\" title=\"ReadVisi\u00f3n GPT-4: \u00bfDe qu\u00e9 es capaz y por qu\u00e9 es importante?\">&#8230; Read more &raquo;<\/a><\/p>\n","protected":false},"author":1,"featured_media":32406,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[201,53],"tags":[457,456,413],"class_list":["post-32413","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-herramientas-de-ia","category-inteligencia-artificial","tag-gpt-4-vision-es","tag-gpt-4v-es","tag-ia-abierta"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v21.8 (Yoast SEO v24.2) - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Visi\u00f3n GPT-4: \u00bfDe qu\u00e9 es capaz y por qu\u00e9 es importante?<\/title>\n<meta name=\"description\" content=\"GPT-4 Vision (GPT-4V), un avance innovador de OpenAI, combina la potencia del aprendizaje profundo con la visi\u00f3n por ordenador. Sus caracter\u00edsticas son\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Visi\u00f3n GPT-4: \u00bfDe qu\u00e9 es capaz y por qu\u00e9 es importante?\" \/>\n<meta property=\"og:description\" content=\"GPT-4 Vision (GPT-4V), un avance innovador de OpenAI, combina la potencia del aprendizaje profundo con la visi\u00f3n por ordenador. Sus caracter\u00edsticas son\" \/>\n<meta property=\"og:url\" content=\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/\" \/>\n<meta property=\"og:site_name\" content=\"Cody - The AI Trained on Your Business\" \/>\n<meta property=\"article:published_time\" content=\"2023-11-07T18:37:44+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-11-16T11:49:21+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1156\" \/>\n\t<meta property=\"og:image:height\" content=\"648\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Oriol Zertuche\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@oriol003\" \/>\n<meta name=\"twitter:site\" content=\"@meetcodyai\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Oriol Zertuche\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"10 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/\"},\"author\":{\"name\":\"Oriol Zertuche\",\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/person\/b3486c07f03571f834cfb7646dba8749\"},\"headline\":\"Visi\u00f3n GPT-4: \u00bfDe qu\u00e9 es capaz y por qu\u00e9 es importante?\",\"datePublished\":\"2023-11-07T18:37:44+00:00\",\"dateModified\":\"2023-11-16T11:49:21+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/\"},\"wordCount\":1918,\"publisher\":{\"@id\":\"https:\/\/meetcody.ai\/#organization\"},\"image\":{\"@id\":\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png\",\"keywords\":[\"gpt-4 visi\u00f3n\",\"gpt-4v\",\"IA abierta\"],\"articleSection\":[\"Herramientas de IA\",\"Inteligencia artificial\"],\"inLanguage\":\"es-ES\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/\",\"url\":\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/\",\"name\":\"Visi\u00f3n GPT-4: \u00bfDe qu\u00e9 es capaz y por qu\u00e9 es importante?\",\"isPartOf\":{\"@id\":\"https:\/\/meetcody.ai\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png\",\"datePublished\":\"2023-11-07T18:37:44+00:00\",\"dateModified\":\"2023-11-16T11:49:21+00:00\",\"description\":\"GPT-4 Vision (GPT-4V), un avance innovador de OpenAI, combina la potencia del aprendizaje profundo con la visi\u00f3n por ordenador. Sus caracter\u00edsticas son\",\"breadcrumb\":{\"@id\":\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#breadcrumb\"},\"inLanguage\":\"es-ES\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"es-ES\",\"@id\":\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#primaryimage\",\"url\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png\",\"contentUrl\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png\",\"width\":1156,\"height\":648,\"caption\":\"GPT-4 with Vision (GPT-4V), a groundbreaking advancement by OpenAI, combines the power of deep learning with computer vision.\u00a0Its features are\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/meetcody.ai\/es\/inicio-v2\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Visi\u00f3n GPT-4: \u00bfDe qu\u00e9 es capaz y por qu\u00e9 es importante?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/meetcody.ai\/#website\",\"url\":\"https:\/\/meetcody.ai\/\",\"name\":\"Cody AI - The AI Trained on Your Business\",\"description\":\"AI Powered Knowledge Base for Employees\",\"publisher\":{\"@id\":\"https:\/\/meetcody.ai\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/meetcody.ai\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es-ES\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/meetcody.ai\/#organization\",\"name\":\"Cody AI - The AI Trained on Your Business\",\"url\":\"https:\/\/meetcody.ai\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es-ES\",\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/05\/logo-codyai.svg\",\"contentUrl\":\"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/05\/logo-codyai.svg\",\"width\":\"1024\",\"height\":\"1024\",\"caption\":\"Cody AI - The AI Trained on Your Business\"},\"image\":{\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/x.com\/meetcodyai\",\"https:\/\/discord.com\/invite\/jXEVDcFxqs\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/person\/b3486c07f03571f834cfb7646dba8749\",\"name\":\"Oriol Zertuche\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es-ES\",\"@id\":\"https:\/\/meetcody.ai\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/b54b9af69d5e8feacb5a92bf0d4be8c751d589ef418e21e6f69f48e4283b8525?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/b54b9af69d5e8feacb5a92bf0d4be8c751d589ef418e21e6f69f48e4283b8525?s=96&d=mm&r=g\",\"caption\":\"Oriol Zertuche\"},\"description\":\"Oriol Zertuche is the CEO of CODESM and Cody AI. As an engineering student from the University of Texas-Pan American, Oriol leveraged his expertise in technology and web development to establish renowned marketing firm CODESM. He later developed Cody AI, a smart AI assistant trained to support businesses and their team members. Oriol believes in delivering practical business solutions through innovative technology.\",\"sameAs\":[\"https:\/\/meetcody.ai\",\"https:\/\/www.linkedin.com\/in\/oriolzertuche\/\",\"https:\/\/x.com\/oriol003\"],\"url\":\"https:\/\/meetcody.ai\/es\/blog\/author\/alien\/\"}]}<\/script>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"Visi\u00f3n GPT-4: \u00bfDe qu\u00e9 es capaz y por qu\u00e9 es importante?","description":"GPT-4 Vision (GPT-4V), un avance innovador de OpenAI, combina la potencia del aprendizaje profundo con la visi\u00f3n por ordenador. Sus caracter\u00edsticas son","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/","og_locale":"es_ES","og_type":"article","og_title":"Visi\u00f3n GPT-4: \u00bfDe qu\u00e9 es capaz y por qu\u00e9 es importante?","og_description":"GPT-4 Vision (GPT-4V), un avance innovador de OpenAI, combina la potencia del aprendizaje profundo con la visi\u00f3n por ordenador. Sus caracter\u00edsticas son","og_url":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/","og_site_name":"Cody - The AI Trained on Your Business","article_published_time":"2023-11-07T18:37:44+00:00","article_modified_time":"2023-11-16T11:49:21+00:00","og_image":[{"width":1156,"height":648,"url":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png","type":"image\/png"}],"author":"Oriol Zertuche","twitter_card":"summary_large_image","twitter_creator":"@oriol003","twitter_site":"@meetcodyai","twitter_misc":{"Written by":"Oriol Zertuche","Est. reading time":"10 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#article","isPartOf":{"@id":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/"},"author":{"name":"Oriol Zertuche","@id":"https:\/\/meetcody.ai\/#\/schema\/person\/b3486c07f03571f834cfb7646dba8749"},"headline":"Visi\u00f3n GPT-4: \u00bfDe qu\u00e9 es capaz y por qu\u00e9 es importante?","datePublished":"2023-11-07T18:37:44+00:00","dateModified":"2023-11-16T11:49:21+00:00","mainEntityOfPage":{"@id":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/"},"wordCount":1918,"publisher":{"@id":"https:\/\/meetcody.ai\/#organization"},"image":{"@id":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#primaryimage"},"thumbnailUrl":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png","keywords":["gpt-4 visi\u00f3n","gpt-4v","IA abierta"],"articleSection":["Herramientas de IA","Inteligencia artificial"],"inLanguage":"es-ES"},{"@type":"WebPage","@id":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/","url":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/","name":"Visi\u00f3n GPT-4: \u00bfDe qu\u00e9 es capaz y por qu\u00e9 es importante?","isPartOf":{"@id":"https:\/\/meetcody.ai\/#website"},"primaryImageOfPage":{"@id":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#primaryimage"},"image":{"@id":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#primaryimage"},"thumbnailUrl":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png","datePublished":"2023-11-07T18:37:44+00:00","dateModified":"2023-11-16T11:49:21+00:00","description":"GPT-4 Vision (GPT-4V), un avance innovador de OpenAI, combina la potencia del aprendizaje profundo con la visi\u00f3n por ordenador. Sus caracter\u00edsticas son","breadcrumb":{"@id":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#breadcrumb"},"inLanguage":"es-ES","potentialAction":[{"@type":"ReadAction","target":["https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/"]}]},{"@type":"ImageObject","inLanguage":"es-ES","@id":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#primaryimage","url":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png","contentUrl":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/11\/gpt4v-gpt-4-vision-features.png","width":1156,"height":648,"caption":"GPT-4 with Vision (GPT-4V), a groundbreaking advancement by OpenAI, combines the power of deep learning with computer vision.\u00a0Its features are"},{"@type":"BreadcrumbList","@id":"https:\/\/meetcody.ai\/es\/blog\/gpt-4-con-vision-de-que-es-capaz-y-por-que-es-importante\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/meetcody.ai\/es\/inicio-v2\/"},{"@type":"ListItem","position":2,"name":"Visi\u00f3n GPT-4: \u00bfDe qu\u00e9 es capaz y por qu\u00e9 es importante?"}]},{"@type":"WebSite","@id":"https:\/\/meetcody.ai\/#website","url":"https:\/\/meetcody.ai\/","name":"Cody AI - The AI Trained on Your Business","description":"AI Powered Knowledge Base for Employees","publisher":{"@id":"https:\/\/meetcody.ai\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/meetcody.ai\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es-ES"},{"@type":"Organization","@id":"https:\/\/meetcody.ai\/#organization","name":"Cody AI - The AI Trained on Your Business","url":"https:\/\/meetcody.ai\/","logo":{"@type":"ImageObject","inLanguage":"es-ES","@id":"https:\/\/meetcody.ai\/#\/schema\/logo\/image\/","url":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/05\/logo-codyai.svg","contentUrl":"https:\/\/meetcody.ai\/wp-content\/uploads\/2023\/05\/logo-codyai.svg","width":"1024","height":"1024","caption":"Cody AI - The AI Trained on Your Business"},"image":{"@id":"https:\/\/meetcody.ai\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/meetcodyai","https:\/\/discord.com\/invite\/jXEVDcFxqs"]},{"@type":"Person","@id":"https:\/\/meetcody.ai\/#\/schema\/person\/b3486c07f03571f834cfb7646dba8749","name":"Oriol Zertuche","image":{"@type":"ImageObject","inLanguage":"es-ES","@id":"https:\/\/meetcody.ai\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/b54b9af69d5e8feacb5a92bf0d4be8c751d589ef418e21e6f69f48e4283b8525?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/b54b9af69d5e8feacb5a92bf0d4be8c751d589ef418e21e6f69f48e4283b8525?s=96&d=mm&r=g","caption":"Oriol Zertuche"},"description":"Oriol Zertuche is the CEO of CODESM and Cody AI. As an engineering student from the University of Texas-Pan American, Oriol leveraged his expertise in technology and web development to establish renowned marketing firm CODESM. He later developed Cody AI, a smart AI assistant trained to support businesses and their team members. Oriol believes in delivering practical business solutions through innovative technology.","sameAs":["https:\/\/meetcody.ai","https:\/\/www.linkedin.com\/in\/oriolzertuche\/","https:\/\/x.com\/oriol003"],"url":"https:\/\/meetcody.ai\/es\/blog\/author\/alien\/"}]}},"_links":{"self":[{"href":"https:\/\/meetcody.ai\/es\/wp-json\/wp\/v2\/posts\/32413","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/meetcody.ai\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/meetcody.ai\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/meetcody.ai\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/meetcody.ai\/es\/wp-json\/wp\/v2\/comments?post=32413"}],"version-history":[{"count":1,"href":"https:\/\/meetcody.ai\/es\/wp-json\/wp\/v2\/posts\/32413\/revisions"}],"predecessor-version":[{"id":32476,"href":"https:\/\/meetcody.ai\/es\/wp-json\/wp\/v2\/posts\/32413\/revisions\/32476"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/meetcody.ai\/es\/wp-json\/wp\/v2\/media\/32406"}],"wp:attachment":[{"href":"https:\/\/meetcody.ai\/es\/wp-json\/wp\/v2\/media?parent=32413"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/meetcody.ai\/es\/wp-json\/wp\/v2\/categories?post=32413"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/meetcody.ai\/es\/wp-json\/wp\/v2\/tags?post=32413"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}