Ir para o conteúdo principal

Processamento

Modelos de linguagem

Modelos de linguagem são sistemas de IA avançados que conseguem compreender, interpretar e gerar linguagem humana. Estes modelos são treinados em conjuntos de dados enormes de texto e aprendem padrões, combinações de palavras, estruturas de frases e até as sutilezas de diferentes idiomas e usos linguísticos. O núcleo de muitos modelos de linguagem modernos é a arquitetura transformer, que utiliza mecanismos de auto-atenção para determinar quais partes do texto são importantes em um determinado contexto.

Ao processar a linguagem, esses modelos usam métodos estatísticos para prever qual é a próxima palavra mais provável ou a próxima frase mais provável em um texto. Eles podem entender o contexto em trechos longos de texto e, assim, gerar textos não apenas gramaticalmente corretos, mas também semanticamente coesos e relevantes.

Ao usar um modelo de linguagem, por exemplo, para um chatbot ou gerador de texto, o modelo recebe determinados prompts ou dados iniciais e, com base nessa entrada, gera texto que logicamente segue a partir do contexto dado. O objetivo desses modelos é produzir texto que pareça o mais humano possível, tanto em conteúdo quanto em estilo.

Modelos de texto-para-imagem

Modelos de texto-para-imagem são sistemas de IA capazes de gerar representações visuais a partir de descrições textuais escritas, como fotos, ilustrações ou outros tipos de material visual. Esses modelos usam redes neurais avançadas, e mais especificamente redes adversárias generativas (GANs) ou variações deste tipo, como modelos de difusão.

O processo começa com uma descrição textual inserida pelo usuário. O modelo avalia o texto e tenta entender o significado e o contexto. Em seguida, o modelo gera imagens que correspondem à descrição textual, utilizando o que aprendeu durante o treinamento, sendo treinado em enormes conjuntos de dados de pares texto-imagem.

Durante o treinamento, o modelo aprende associações entre descrições textuais e características visuais. Por exemplo, se o modelo vê repetidamente a expressão ‘um sol amarelo acima de um mar azul’ junto com imagens que ilustram esse cenário, ele aprende a reconhecer e reproduzir esses elementos em criações de imagem futuras.

O resultado costuma ser imagens surpreendentemente precisas e com riqueza de detalhes que correspondem à descrição inserida. Esses modelos estão se tornando mais refinados e capazes de representar cenários complexos com vários objetos e conceitos abstratos. Eles são usados em uma ampla gama de aplicações, incluindo criações artísticas, design de jogos, realidade virtual e muito mais.

AI-Public disponibiliza modelos

É importante entender que a AI-Public disponibiliza diferentes modelos de IA oferecidos por grandes empresas de tecnologia por meio de uma API. Uma API, ou Interface de Programação de Aplicações, é um conjunto de regras e definições que permitem que programas de software se comuniquem entre si. Funciona como uma espécie de “linguagem” que os programas entendem para trocar informações e invocar funções entre si. A AI-Public não possui, por si só, modelos de linguagem ou modelos de texto-para-imagem.

Não nos responsabilizamos pelos resultados dos diferentes modelos. No entanto, prestamos atenção à seleção dos melhores e mais interessantes modelos para empresas.

Procedimento de processamento

O seguinte procedimento é seguido para gerar uma resposta:

  • O usuário cria um prompt.
  • A aplicação front-end conecta isso à conversa ativa e adiciona uma mensagem de chat com o status "Inicializar".
  • Nos servidores da AI-Public, uma função é acionada pelo recebimento da mensagem de chat.
  • O status da mensagem de chat é definido como "Processando".
  • Ao selecionar chat com documentos, o servidor primeiro envia uma solicitação para o ** Firestore vector database ** para selecionar os textos dos documentos.
  • O servidor então envia a solicitação através de uma integração de API ao modelo de linguagem selecionado.
  • Se a configuração Transmitir estiver ligada, armazenamos a mensagem após cada 10 trechos recebidos e após cada 25 trechos após receber 100 trechos.
  • Assim que toda a resposta for recebida, o status é definido como "Concluído".
  • A aplicação front-end é atualizada após cada atualização de banco de dados.
  • Em caso de erros detectados, o status é definido como "Erro" e uma mensagem de erro é mostrada.

Não enviamos dados pessoais com cada solicitação de API. No entanto, o usuário pode ter incluído dados pessoais no prompt ou nos documentos carregados.