Traitement
Modèles de langage
Les modèles de langage sont des systèmes d'IA avancés capables de comprendre, interpréter et générer le langage humain. Ces modèles sont entraînés sur d'immenses ensembles de données textuelles et apprennent les motifs, les combinaisons de mots, les structures de phrases, et même les subtilités des différentes langues et usages linguistiques. Le cœur de nombreux modèles de langage modernes est l'architecture transformer, qui utilise des mécanismes d'auto-attention pour déterminer quelles parties du texte sont importantes dans un contexte donné.
Lors du traitement du langage, ces modèles utilisent des méthodes statistiques pour prédire le mot ou la phrase suivante la plus probable dans un texte. Ils peuvent comprendre le contexte sur de longs passages de texte et ainsi générer non seulement des textes grammaticalement corrects, mais aussi cohérents et pertinents sur le plan du contenu.
Lors de l'utilisation d'un modèle de langage pour un chatbot ou un générateur de texte, le modèle reçoit certaines invites ou données initiales et, en fonction de cette entrée, génère un texte qui suit logiquement le contexte donné. L'objectif de ces modèles est de produire un texte qui ressemble le plus possible à un texte humain, tant en termes de contenu que de style.
Modèles texte-à-image
Les modèles texte-à-image sont des systèmes d'IA capables de générer des représentations visuelles à partir de descriptions textuelles écrites, telles que des photos, des illustrations ou d'autres types de matériel visuel. Ces modèles utilisent des réseaux neuronaux avancés, et plus spécifiquement des réseaux antagonistes génératifs (GAN) ou des variations telles que les modèles de diffusion.
Le processus commence par une description textuelle saisie par un utilisateur. Le modèle évalue ce texte et tente de comprendre sa signification et son contexte. Il génère ensuite des images qui correspondent à la description textuelle, en utilisant ce qu'il a appris pendant l'entraînement, en s'entraînant sur d'immenses ensembles de données de paires texte-image.
Pendant l'entraînement, le modèle apprend les associations entre les descriptions textuelles et les caractéristiques visuelles. Par exemple, si le modèle voit à plusieurs reprises la combinaison de mots "un soleil jaune au-dessus d'une mer bleue" avec des images illustrant ce sc énario, il apprend à reconnaître et à reproduire ces éléments dans de futures créations d'images.
En résultat, on obtient souvent des images étonnamment précises et détaillées qui correspondent à la description textuelle saisie. Ces modèles deviennent de plus en plus raffinés et sont capables de représenter des scénarios complexes avec plusieurs objets et concepts abstraits. Ils sont utilisés dans un large éventail d'applications, y compris les créations artistiques, la conception de jeux, la réalité virtuelle et plus encore.
AI-Public déverrouille des modèles
Il est important de comprendre qu'AI-Public déverrouille différents modèles d'IA proposés par de grandes entreprises technologiques via une API. Une API, ou Interface de Programmation d'Application, est un ensemble de règles et de définitions permettant aux programmes logiciels de communiquer entre eux. Elle fonctionne comme une sorte de "langue" comprise par les programmes pour échanger des informations et invoquer des fonctions les uns des autres. AI-Public n'a pas ses propres modèles de langage ou modèles texte-à-image.
Nous ne sommes pas responsables des résultats des différents modèles. Cependant, nous avons accordé une attention à la sélection des modèles les plus performants et les plus intéressants pour les entreprises.
Procédure de traitement
La procédure suivante est suivie pour générer une réponse :
- L'utilisateur crée un prompt.
- L'application web front-end le relie à la conversation active et ajoute un message de chat avec le statut "Initialisation".
- Sur les serveurs d'AI-Public, une fonction est déclenchée par l'ajout d'un message de chat.
- Le statut du message de chat est défini sur "Traitement".
- Lors de la sélection d'une conversation avec des documents, le serveur envoie d'abord une requête à la base de données vectorielle Firestore pour sélectionner les textes des documents.
- Le serveur envoie ensuite la requête via une liaison API au modèle de langage sélectionné.
- Si le paramètre Streaming est activé, nous conservons le message après chaque tranche de 10 reçues et après chaque 25 tranches après la réception de 100 tranches.
- Une fois la réponse complète reçue, le statut est défini sur "Terminé".
- L'application front-end est actualisée après chaque mise à jour de la base de données.
- En cas d'erreurs détectées, le statut est défini sur "Erreur" et un message d'erreur est affiché.
Nous n'envoyons aucune donnée personnelle avec chaque requête API. Cependant, l'utilisateur peut avoir inclus des données personnelles dans le prompt ou dans les documents téléchargés.