¿Cómo entrenar GPT en datos de Excel de forma gratuita? (Beta)

Una guía para añadir datos de Excel a su base de conocimientos Cody y formación ChatGPT gratis.

Antes de empezar a entrenar a Cody con los datos de Excel de su empresa, es necesario aclarar algunos conceptos para garantizar las mejores respuestas de su bot. Los GPT (Generative Pre-Trained Transformers) son modelos lingüísticos entrenados en amplios conjuntos de datos para predecir la siguiente palabra de una frase u oración con el fin de completarla. Se entrenan específicamente en conjuntos de datos de lenguaje natural que comprenden grandes muestras de datos conversacionales o literales no estructurados. A diferencia de los modelos estadísticos como la Regresión Lineal, los GPT no son competentes en la predicción de números utilizando datos de entrenamiento lógicos. Por ejemplo, si entrenas a GPT en un conjunto de datos que afirma que 2+2=5, responderá afirmando que 2+2=5 sin intentar comprender la incoherencia lógica (esto es sólo un ejemplo; OpenAI maneja este tipo de consultas con respuestas precisas). Esto, unido a otra limitación de los LLM, que son las alucinaciones, crea un entorno poco propicio para los cálculos matemáticos.

Ahora que comprende las limitaciones de GPT, permítanos guiarle a través de un proceso de entrenamiento gratuito de GPT en datos de Excel. Hemos desarrollado un método para añadir datos Excel o CSV a su base de conocimientos Cody. Como ya se ha mencionado, GPT destaca en la comprensión del lenguaje natural, por lo que convertiremos los datos de Excel a un formato legible que pueda ser consumido fácilmente por el modelo lingüístico.

Paso 1: Transformación de los datos de Excel

Coge los datos CSV o Excel con los que quieres entrenar a tu Bot y conviértelos en un archivo de texto usando esta utilidad creada por nosotros. La utilidad convierte los datos de Excel en un archivo de texto anotando los datos con sus cabeceras correspondientes. Anotar los elementos de la celda con encabezados permite al modelo lingüístico comprender mejor el contexto, ya que existe una alta probabilidad de que los encabezados se omitan debido a la segmentación del documento en la fase de preprocesamiento.

Ej.

Datos Excel:

Datos de texto:

{The Name is ‘John’. The Age is ‘16’.}, {The Name is ‘Marie’. The Age is ‘18’.}

El archivo de texto generado sigue un formato similar a JSON pero con un estilo más literario para proporcionar una sensación más humana. Aunque esta solución se encuentra actualmente en fase experimental y aún no está integrada en la aplicación Cody, funciona bien con los tres modelos de GPT, pero seguimos explorando mejores soluciones para este fin.

Interfaz de utilidad:

CSV/Excel to TXT converter for Cody for Training GPT on Excel data for free

Muestra de datos CSV:

Muestra de datos CSV para la formación gratuita de GPT en datos Excel

Se recomienda limpiar los datos antes de la transformación para obtener la mejor calidad de respuestas de su bot.

Interfaz de usuario del conversor para Training GPT en datos Excel gratuito

Después de cargar los datos CSV o Excel en la utilidad, puede previsualizar los datos antes de generar el archivo de texto compatible con GPT.

Filas por parte: Para conjuntos de datos más grandes, es aconsejable dividir el conjunto de datos en varias partes. Esta división mejora la búsqueda semántica y aumenta la calidad de las respuestas.

Incluir referencias de celdas: Si desea que el archivo de texto incluya referencias a celdas de Excel, puede seleccionar esta opción. El bot puede entonces referirse a estas referencias de celdas al crear guías paso a paso para las acciones que se pueden realizar en Excel. Por ejemplo, puede generar una fórmula para hallar la mediana.

Se generará una carpeta zip comprimida que contendrá todas las partes de tus datos excel en formato .txt.

Ficheros generados gratuitamente para Training GPT sobre datos Excel

Paso 2: Añadir los datos a su base de conocimientos Cody

Para añadir los datos transformados a la base de conocimientos de Cody, siga estos pasos:

  1. Vaya a la aplicación Cody y navegue hasta la sección “Contenido”.
  2. Cree una nueva carpeta dentro de la base de conocimientos donde desee almacenar los datos.
  3. Una vez creada la carpeta, navega dentro de ella.
  4. Haga clic en el botón “Cargar” para cargar los datos transformados.
  5. Seleccione todos los archivos de datos transformados de su almacenamiento local que desee añadir a la base de conocimientos.
  6. Confirme la selección e inicie el proceso de carga.
  7. Los archivos de datos transformados se cargarán y se añadirán a la Base de Conocimientos de Cody, almacenados en la carpeta que haya creado. Una vez que los documentos se hayan aprendido correctamente, el estado del documento se mostrará como “aprendido”.

Archivos de texto cargados para Training GPT on Excel data de forma gratuita

Paso 3: Configurar la personalidad del bot

Como aún se encuentra en fase experimental, estamos trabajando para mejorar el aviso antes de añadirlo al modo de plantilla.

Prompt:

Eres Data Cody, un analista de datos de IA para mi empresa. Su objetivo principal es generar inferencias a partir de los datos de Excel que se le han proporcionado. Las referencias a las celdas de Excel pueden darse en forma de $Cell. No mencione la referencia de la celda en las respuestas. La información contenida en ‘{}’ es un registro. Si le preguntan por los detalles de un registro concreto, enumérelos en punteros.

Pregunta del sistema:

Intente responder de forma humana cuando le pregunten por cualquier detalle. No justifiques tus respuestas.

Este proceso funciona bien con los tres modelos de GPT, así que aunque estés en el plan gratuito, puedes probarlo. No obstante, cabe señalar que los modelos GPT-3.5 16K y GPT-4 tienden a comprender mejor los datos. Si está satisfecho con las respuestas que recibe en el plan gratuito, pero desea más flexibilidad en el formato de las respuestas y la posibilidad de comparar varios registros, la actualización a GPT-3.5 16K o GPT-4 puede ser beneficiosa. La ventana contextual adicional que ofrecen estos modelos permite un análisis y una manipulación más exhaustivos de los datos.

Demo

Demostración gratuita de formación GPT sobre datos Excel

Referencia para la primera consulta:

Referencia para la segunda consulta:

Limitaciones

La posibilidad de cargar archivos Excel o CSV en Cody no lo convierte en una alternativa directa a herramientas de hojas de cálculo como Google Sheets o Microsoft Excel. Hay que tener en cuenta varias limitaciones al trabajar con datos estructurados en Cody:

  1. Alucinaciones durante tareas analíticas: Las tareas que implican cálculos estadísticos o analíticos, como preguntar a Cody por promedios, medianas o valores mínimo/máximo, pueden producir respuestas incorrectas. Cody no realiza cálculos en tiempo real y puede proporcionar resultados inexactos. Las recientes actualizaciones de OpenAI, como el intérprete de código y la llamada a funciones, pueden mejorar esto en el futuro.
  2. Error al comparar registros: En algunos casos, Cody puede encontrar dificultades para obtener datos de diferentes segmentos del documento, lo que da lugar a respuestas que indican que la información no está disponible. Este escenario es más probable con el modelo GPT-3.5 disponible en el plan gratuito. La actualización a los planes Basic o Premium le permite utilizar el modelo GPT-3.5 16K o el modelo GPT-4. Ambos modelos tienen ventanas de contexto más amplias y pueden resolver potencialmente esta limitación.

Conclusión

A pesar de estas limitaciones, este proceso es especialmente útil para situaciones en las que los datos de preguntas frecuentes de su empresa u otros datos literales, como los datos de formación de los empleados, se almacenan en formato Excel o CSV. Cody puede entrenarse con estos datos sin necesidad de modificaciones. Cody también ofrece buenos resultados cuando se obtienen detalles de un único registro, se describen los datos o se ofrecen sugerencias basadas en información inferida de conjuntos de datos numéricos como balances o cifras de ventas.

Como solución provisional para la formación de Cody sobre datos Excel o CSV, agradecemos enormemente sus comentarios sobre este enfoque. Valoramos tu opinión y te animamos a que la compartas con nosotros en nuestro servidor Discord o poniéndote en contacto con nosotros a través de la función Obtener ayuda. Estamos impacientes por conocer su experiencia y aprender más de sus comentarios. Espero que te haya gustado nuestro enfoque de la formación GPT en los datos de Excel de forma gratuita. Consulta nuestros blogs para saber más sobre Cody.

 

More From Our Blog

Lanzamiento del Soneto Claude 3.5 de Anthropic: ¿Mejor que GPT-4o?

Lanzamiento del Soneto Claude 3.5 de Anthropic: ¿Mejor que GPT-4o?

Claude 3.5 Sonnet es el último modelo de la familia Claude 3.5 de grandes modelos lingüísticos (LLM). Presentado por Anthropic en marzo de 2024, supone un importante salto adelante. Este modelo supera a sus predecesores y a competidores notables c...

Read More
¿Cómo Automatizar Tareas con las Herramientas y Claude 3 de Anthropic?

¿Cómo Automatizar Tareas con las Herramientas y Claude 3 de Anthropic?

Cómo empezar a utilizar las Herramientas Antrópicas La mayor ventaja de emplear LLM para tareas es su versatilidad. Los LLM pueden impulsarse de formas específicas para servir a un sinfín de propósitos, funcionando como API para la generación d...

Read More

Build Your Own Business AI

Get Started Free
Top