Ir al contenido principal

Procesamiento

Modelos de lenguaje

Los modelos de lenguaje son sistemas de IA avanzados que pueden comprender, interpretar y generar lenguaje humano. Estos modelos se entrenan en conjuntos de datos enormes de texto y aprenden patrones, combinaciones de palabras, estructuras de oraciones, e incluso las sutilezas de diferentes idiomas y usos del lenguaje. El núcleo de muchos modelos de lenguaje modernos es la arquitectura de transformers, que utiliza mecanismos de atención propia para determinar qué partes del texto son importantes en un contexto dado.

Al procesar el lenguaje, estos modelos utilizan métodos estadísticos para predecir cuál podría ser la siguiente palabra más probable o la siguiente oración más probable en un texto. Pueden entender el contexto en piezas largas de texto y, por tanto, no solo generar textos gramaticalmente correctos, sino también coherentes y relevantes en cuanto al contenido.

Al usar un modelo de lenguaje, por ejemplo para un chatbot o un generador de texto, se le proporcionan al modelo ciertas indicaciones o datos iniciales y, basándose en esa entrada, el modelo genera texto que lógicamente sigue la contextual dada. El objetivo de estos modelos es producir texto que parezca lo más humano posible, tanto en contenido como en estilo.

Modelos de texto-a-imagen

Los modelos de texto-a-imagen son sistemas de IA capaces de generar representaciones visuales a partir de descripciones textuales escritas, como fotografías, ilustraciones u otros tipos de material visual. Estos modelos utilizan redes neuronales avanzadas y, más específicamente, redes generativas adversariales (GANs) o variaciones de estas como modelos de difusión.

El proceso comienza con una descripción de texto introducida por un usuario. El modelo evalúa ese texto y trata de entender su significado y contexto. Luego genera imágenes que correspondan a la descripción textual, utilizando lo que ha aprendido durante el entrenamiento, al estar entrenado en enormes conjuntos de datos de pares texto-imagen.

Durante el entrenamiento, el modelo aprende asociaciones entre descripciones de texto y características visuales. Por ejemplo, si el modelo ve repetidamente la combinación de palabras "un sol amarillo sobre un mar azul" junto con imágenes que ilustran ese escenario, aprende a reconocer y reproducir estos elementos en futuras creaciones de imágenes.

El resultado suele ser imágenes sorprendentemente precisas y detalladas que se ajustan a la descripción de entrada. Estos modelos se están volviendo cada vez más refinados y son capaces de representar escenarios complejos con múltiples objetos y conceptos abstractos. Se utilizan en una amplia variedad de aplicaciones, incluyendo creaciones artísticas, diseño de juegos, realidad virtual y más.

OpenAI Public desbloquea modelos

Es importante tener en cuenta que AI-Public desbloquea varios modelos de IA que son ofrecidos por grandes empresas de tecnología a través de una API. Una API, o Application Programming Interface, es un conjunto de reglas y definiciones que permiten a programas de software comunicarse entre sí. Funciona como un tipo de "lenguaje" que los programas entienden para intercambiar información y llamar funciones entre sí. OpenAI Public no tiene modelos de lenguaje ni modelos de texto-a-imagen propios.

No nos hacemos responsables de los resultados de los distintos modelos. Sin embargo, hemos prestado atención a la selección de los modelos más adecuados e interesantes para las empresas.

Procedimiento de procesamiento

El siguiente procedimiento se sigue para generar una respuesta:

  • El usuario crea una prompt.
  • La aplicación frontend se conecta a la conversación activa y añade un mensaje de chat con el estado "Inicializar".
  • En los servidores de AI-Public se activa una función al añadir un mensaje de chat.
  • El estado del mensaje de chat se establece en "Procesando".
  • Al seleccionar chat con documentos, el servidor primero envía una solicitud a la Firestore vector database para seleccionar los textos de los documentos.
  • El servidor envía entonces la solicitud a través de una conexión API al modelo de lenguaje seleccionado.
  • Si la configuración está activada la opción Transmisión, guardamos el mensaje después de cada 10 fragmentos recibidos y después de cada 25 fragmentos tras recibir 100 fragmentos.
  • Una vez recibido todo la respuesta, se establece el estado en "Completado".
  • La aplicación frontend se actualiza tras cada actualización de la base de datos.
  • Si se detectan errores, el estado se establece en "Error" y se muestra un mensaje de error.

No enviamos datos personales junto con cada solicitud de API. Sin embargo, el usuario podría haber incluido datos personales en la prompt o en los documentos cargados.