Vai al contenuto principale

Chat con documenti

Il prossimo passo nell'elaborazione delle informazioni

Invece di fare affidamento su set di dati pubblici e conoscenze generali, "Chat con Documenti" genera risposte e analisi contestualizzate in base alle tue fonti interne fidate. Carica i tuoi documenti e usali come base per rispondere alle domande nella chat!

Risoluzione dei limiti dei dati

Se poni domande a un modello linguistico, dipendi dal set di dati con cui il modello è stato addestrato. In genere è informazioni reperite da Internet. Le fonti non pubbliche probabilmente non sono incluse in questo set. Utilizzando i tuoi documenti come fonte per la chat, ti assicuri che il modello disponga delle informazioni necessarie per rispondere alle tue domande.

Possibilità con i tuoi documenti

Puoi porre domande sui tuoi documenti, ad esempio elencare i punti principali di un documento o riassumerlo. Puoi anche far eseguire analisi specifiche al modello linguistico utilizzando il tuo dataset.

Limiti della chat basata su documenti

Il caricamento dei documenti e la loro elaborazione comportano passaggi aggiuntivi rispetto a una risposta semplice senza contesto informativo specifico. Inoltre, potrebbe richiedere più tempo generare una risposta poiché bisogna recuperare prima le informazioni necessarie dal documento prima di inviare la richiesta al modello linguistico.

Dietro le quinte della chat con documenti

Il testo dai documenti che carichi viene estratto dal documento e suddiviso in frammenti. Questi frammenti hanno una lunghezza fissa (1024 caratteri) e abbiamo anche impostato una sovrapposizione (128 caratteri) tra i frammenti. Ogni porzione di testo viene memorizzata come vettore in un database vettoriale. Per ogni domanda viene selezionata una porzione di questi dati in base alla somiglianza con la domanda posta.

Processo di selezione dei frammenti di documento

I frammenti di testo sono già stati convertiti in vettori. I vettori hanno molte dimensioni che indicano quanto è “simile” questo testo ad altri testi. Pensa al sistema di colori RGB. Un colore con valore RGB simile è anche un colore simile ma leggermente diverso. Il database vettoriale ci permette di recuperare i frammenti di testo in ordine di rilevanza e filtrati in base alla domanda. Selezioniamo al massimo 100 frammenti di testo di 1024 caratteri da inviare insieme alla domanda.

Modelli adatti alla chat basata su documenti

Abbiamo selezionato modelli con una ampia finestra contestuale per rendere possibile chiacchierare con documenti. Vogliamo poter inviare al massimo 100 frammenti di testo da 1024 caratteri. Questo è più di 100.000 caratteri. Per favore, usa preferibilmente un modello linguistico di alta qualità dalla catalogo centrale dei modelli.

Modelli adatti

I modelli adatti sono modelli con capacità contestuale sufficiente e buone capacità di analisi dei documenti, come i modelli di alta qualità di OpenAI, Claude, Google o AI europe.

Seleziona uno o più documenti

Puoi attivare la modalità file cliccando sulla graffetta a destra della barra delle domande. Puoi selezionare fino a 10 file per chattare.

Modelli linguistici adatti

Al momento di iniziare a chatare con i documenti, viene verificato se il modello linguistico è adatto per chat con documenti. Se non lo è, verrà automaticamente selezionato un modello idoneo dall'attuale catalogo.

Chatta con questi documenti finché la modalità file resta attiva.

Elaborazione per singolo file

Oltre alla chat con documenti, AI-Public offre anche la possibilità di applicare un prompt separato a ciascun documento e ricevere risposte individuali. Questa funzione è chiamata Elaborazione per singolo file.

Elaborazione per singolo file

Questa funzione può essere usata in combinazione con "Chat con file".

Scenario possibile

Un esempio pratico di utilizzo di "Elaborazione per singolo file":

  1. Carichi un documento di riferimento e lo attivi in Chat con file
  2. Carichi più documenti che devono essere analizzati e li attivi in Elaborazione per singolo file
  3. Formuli un prompt, che viene applicato a tutti i file individualmente

Così puoi far analizzare automaticamente tutti i documenti in base al documento di riferimento.

Numero massimo di file

Esiste un massimo di 30 file per la funzione "Elaborazione per singolo file".

Tipi di file supportati

AI-Public supporta diversi tipi di file per la chat con documenti:

  • file PDF con estensione .pdf
  • file Word con estensione .docx
  • file CSV con estensione .csv
  • file JSON con estensione .json
  • file di testo con estensione .txt
  • file audio e video con le estensioni 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' o 'webm'

Chat con file audio o video

Per la chat con file audio o video, AI-Public usa il modello Whisper di OpenAI.

Dopo l’estrazione del testo, può essere utilizzato un modello di testo adatto per controllare e correggere punteggiatura e ortografia.

Poi segue la stessa procedura di estrazione da PDF o Word.

Whisper ha un limite di 25 MB per file audio o video. Manteniamo quindi lo stesso limite anche per il caricamento di nuovi file.

File che puoi scaricare come esempio

Rapporto aziendale di esempio Progetto piano di esempio Documento storico grande

Elaborazione e riutilizzo dei file

I file che carichi vengono elaborati prima che AI-Public possa utilizzare il contenuto nelle chat, negli assistenti e nei flussi di lavoro. Se l’elaborazione fallisce, il file ottiene uno stato di errore e puoi caricarlo di nuovo o farlo elaborare nuovamente da Gestione file.

Per i PDF, AI-Public può utilizzare lo strato di testo normale e, quando necessario, eseguire un’analisi PDF più approfondita. Questo è utile per documenti scansionati, moduli compilati, appunti manoscritti, opzioni cerchiate o sottolineate, tabelle e informazioni visive. I PDF di grandi dimensioni possono essere suddivisi durante l’elaborazione in parti più piccole.

Quando un modulo o un flusso di lavoro richiede un file, puoi caricare un nuovo file o selezionare un file esistente tramite l’amministrazione multimediale. I file aggiunti tramite un modulo sono disponibili per l’assistente in quella chat, ma non vengono automaticamente selezionati per le normali domande di chat.

I file Markdown con estensione .md sono anch'essi supportati.