Ir al contenido principal

Chat con documentos

El siguiente paso en el procesamiento de información

En lugar de confiar en conjuntos de datos públicos y conocimientos generales, "Chat con Documentos" genera respuestas y análisis context-specificos basados en tus fuentes internas de confianza. ¡Carga tus documentos y usa estos documentos como base para responder preguntas en el chat!

Resolver limitaciones de datos

Si haces preguntas a un modelo de lenguaje, dependes del conjunto de datos con el que el modelo fue entrenado. Por lo general, es información obtenida de Internet. Fuentes no públicas probablemente no estén en ese conjunto de datos. Al usar tus documentos como fuente para el chat, te aseguras de que el modelo disponga de la información que necesitas para responder tus preguntas.

Posibilidades con tus documentos

Puedes hacer preguntas sobre tus documentos, como enumerar los puntos principales de un documento o resumirlo. También puedes pedir al modelo de lenguaje que realice análisis específicos utilizando tu propio conjunto de datos.

Desventajas de chatear basado en documentos

Cargar documentos y procesarlos implica pasos adicionales que no tendrías que realizar si puedes obtener respuestas sin el contexto de información específica. Además, toma más tiempo generar una respuesta porque primero hay que extraer la información necesaria del documento antes de enviar la solicitud al modelo de lenguaje.

Detrás de las escenas del chat con documentos

El texto de los documentos que subes se extrae del documento y se divide en fragmentos. Estos fragmentos tienen una cantidad fija de caracteres (1024 caracteres) y también hemos configurado una superposición (128 caracteres) entre fragmentos. Cada fragmento de texto se guarda como vector en una base de datos vectorial. Para cada pregunta, se seleccionan estos datos en función de su similitud con la pregunta formulada.

Proceso de selección de fragmentos de documentos

Los fragmentos de texto ya están convertidos en vectores. Los vectores tienen múltiples dimensiones que indican cuán “parecido” está este texto a otro texto. Piensa en el sistema de color RGB. Un color con un valor RGB similar también es un color similar, pero ligeramente diferente. La base de datos vectorial nos permite recuperar los fragmentos de texto de forma ordenada y filtrada según la pregunta. Seleccionamos como máximo 100 fragmentos de texto de 1024 caracteres para enviar junto con la pregunta.

Modelos adecuados para chatear con documentos

Hemos seleccionado modelos con un gran contexto para permitir chatear con documentos. Queremos poder enviar como máximo 100 fragmentos de texto de 1024 caracteres. Esto equivale a más de 100.000 caracteres. Usa preferiblemente un modelo de alta calidad desde el catálogo central de modelos.

Modelos adecuados

Los modelos adecuados son aquellos con suficiente espacio de contexto y buena capacidad de análisis de documentos, como los modelos de alta calidad de OpenAI, Claude, Google o AI de la UE.

Selecciona uno o varios documentos

Puedes activar el modo de archivos haciendo clic en el clip en la parte derecha de la barra de preguntas. Puedes seleccionar hasta 10 archivos para chatear.

Modelos de lenguaje adecuados

En el momento en que comienza a chatear con documentos, se verifica si el modelo de lenguaje es adecuado para chatear con documentos. Si no lo es, automáticamente se selecciona un modelo adecuado de la catalogación actual.

Chat te con estos documentos mientras el modo de archivos esté activado.

Procesar por archivo

Además de chatear con documentos, AI-Public también ofrece la posibilidad de aplicar un prompt por separado a cada documento y recibir respuestas individuales. Esta función se llama Procesar por archivo.

Procesar por archivo

Esta función puede usarse en combinación con "Chat con archivos".

Escenario posible

Un ejemplo práctico del uso de "Procesar por archivo":

  1. Cargas un documento de referencia y lo activas en Chat con archivos
  2. Cargas varios documentos que deben ser analizados y los activas en Procesar por archivo
  3. Formulas un prompt que se aplica a todos los archivos de forma individual

De esta manera puedes, por ejemplo, hacer que todos los documentos se analicen automáticamente en función del documento de referencia.

Número máximo de archivos

Existe un máximo de 30 archivos para la función "Procesar por archivo".

Tipos de archivos compatibles

AI-Public admite diferentes tipos de archivos para chatear con documentos:

  • Archivos PDF que terminan en .pdf
  • Archivos Word que terminan en .docx
  • Archivos CSV que terminan en .csv
  • Archivos JSON que terminan en .json
  • Archivos de texto que terminan en .txt
  • Archivos de audio y video con las extensiones 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' o 'webm'

Chatear con archivos de audio o video

Para chatear con archivos de audio o video, AI-Public utiliza el modelo Whisper de OpenAI.

Después de la extracción de texto, se puede usar un modelo de texto adecuado para verificar y corregir puntuación y ortografía.

Luego sigue el mismo procedimiento que la extracción de PDF o Word.

Whisper tiene un límite de 25 MB por archivo de audio o video. Por eso aplicamos el mismo límite al subir nuevos archivos.

Archivos que puedes descargar como ejemplo

Informe empresarial de ejemplo Ejemplo de plan de proyecto Documento histórico grande

Procesar y reutilizar archivos

Los archivos que subes se procesan primero antes de que AI-Public pueda usar su contenido en chats, asistentes y flujos de trabajo. Si el procesamiento falla, el archivo obtendrá un estado de error y podrás volver a subirlo o volver a procesarlo desde Gestión de Archivos.

Para los PDFs, AI-Public puede usar la capa de texto normal y, cuando sea necesario, realizar un análisis de PDF más detallado. Esto es útil para documentos escaneados, formularios rellenados, notas escritas a mano, elecciones rodeadas o subrayadas, tablas e información visual. Los PDFs grandes pueden dividirse en partes durante el procesamiento.

Cuando un formulario o flujo de trabajo solicita uno de los archivos, puedes subir un nuevo archivo o elegir un archivo existente desde el gestor de medios. Los archivos añadidos a través de dicho formulario están disponibles para el asistente en esa conversación, pero no se seleccionan automáticamente para preguntas de chat habituales.

Los archivos Markdown con la extensión .md también son compatibles.