Чат із документами

Наступний крок у обробці інформації

Замість того щоб покладатися на відкриті набори даних та загальні знання, «Чат із Документами» генерує контекстно-специфічні відповіді та аналітику на основі ваших надійних внутрішніх джерел. Завантажуйте свої документи і використовуйте ці документи як основу для відповідей у чаті!

Вирішення обмежень даних

Коли ви ставите запитання мовній моделі, ви залежите від набору даних, на яких навчалась модель. Зазвичай це інформація з інтернету. Непублічні джерела, ймовірно, не входять до цього набору даних. Використовуючи ваші документи як джерело для чату, ви можете бути впевнені, що модель має потрібну інформацію для відповідей.

Можливості з вашими документами

Ви можете ставити запитання щодо ваших документів, наприклад, називаті основні пункти документа або його резюме. Також можна запустити конкретні аналітики за допомогою мовної моделі з використанням вашого власного набору даних.

Недоліки документно-орієнтованого чату

Завантаження документів та їх обробка є додатковими кроками, які вам не потрібно виконувати, якщо відповіді можна отримати без контексту конкретної інформації. Також відповіді створюються повільніше, оскільки потрібно витягнути потрібну інформацію з документа перед відправкою запиту до мовної моделі.

За лаштунками чату з документами

Текст з документів, які ви завантажуєте, витягується з документа та ділиться на фрагменти. Ці фрагменти мають фіксовану кількість символів (1024 символи) і ми також встановили перекриття (128 символів) між фрагментами. Кожну порцію тексту зберігають як вектор у векторній базі даних. Під час кожного запиту з цих даних вибирають відповідні за схожістю з поставленим запитом.

Процес відбору фрагментів документа

Фрагменти вже перетворені на вектори. Вектори мають кілька вимірів, які вказують, наскільки «похожий» цей текст на інший текст. Подумайте про систему кольорів RGB. Колір з подібним RGB-значенням також подібний, але трохи інший. Векторна база даних дозволяє нам витягувати фрагменти тексту у відсортованому та фільтрованому вигляді за запитом.

Ми відбираємо максимум 100 фрагментів тексту довжиною 1024 символи для подальшого використання з запитом.

Підходящі моделі для документно-орієнтованого чату

Ми відібрали моделі з великим контекстним вікном, щоб забезпечити можливість чату з документами. Ми прагнемо мати можливість передавати до 100 фрагментів тексту довжиною 1024 символи. Це більше ніж 100 000 символів. Використовуйте, за можливості, якісну мовну модель із центрального каталогу моделей.

Підходящі моделі

Підходящі моделі — це моделі з достатнім контекстним вікном та гарним аналізом документів, такі як високоякісні моделі від OpenAI, Claude, Google або європейського штучного інтелекту.

Вибрати один або кілька документів

Ви можете увімкнути режим завантаження файлів, натиснувши на скріпку з правого боку рядка запиту. Можете обрати до 10 файлів для чату.

Підходящі мовні моделі

У момент старту чату з документами перевіряється, чи підходить мовна модель для чату з документами. Якщо ні, автоматично вибирається відповідна модель з актуального каталогу.

Почніть чат із цими документами, поки режим файлів увімкнено.

Обробка за кожним файлом

Окрім чату з документами, AI-Public також дозволяє застосувати окремий запит до кожного документа та отримати індивідуальні відповіді. Ця функція називається Обробка за кожним файлом.

Обробка за кожним файлом

Цю функцію можна використовувати разом із «Чат із файлами».

Можливий сценарій

Практичний приклад використання «Обробки за кожним файлом»:

Завантажуєте референтний документ і вмикаєте його у Чат із файлами
Завантажуєте кілька документів, які потрібно проаналізувати, та вмикаєте їх у Обробку за кожним файлом
Формулюєте запит, який застосовується до всіх файлів індивідуально

Таким чином ви можете, наприклад, автоматично аналізувати всі документи на основі референтного документу.

Максимальна кількість файлів

Встановлено максимум 30 файлів для функції «Обробка за кожним файлом».

Підтримувані типи файлів

AI-Public підтримує різні типи файлів для чатування з документами:

PDF файли з розширенням .pdf
Word файли з розширенням .docx
CSV файли з розширенням .csv
JSON файли з розширенням .json
Текстові файли з розширенням .txt
Аудіо та відео файли з розширеннями 'mp3', 'mp4', 'mpeg', 'mpga', 'm4a', 'wav' або 'webm'

Чат з аудіо- або відеофайлами

AI-School спочатку транскрибує аудіо- та відеофайли налаштованим постачальником транскрипції. У розмовах результат може містити часові блоки та мітки спікерів. Потім відповідна текстова модель може виправити пунктуацію, правопис, мітки спікерів і фахові терміни. Довгі файли можуть оброблятися інакше через обмеження постачальника та моделі.

Вирішення обмежень даних​

Можливості з вашими документами​

Недоліки документно-орієнтованого чату​

За лаштунками чату з документами​

Процес відбору фрагментів документа​

Підходящі моделі для документно-орієнтованого чату​

Вибрати один або кілька документів​

Обробка за кожним файлом​

Можливий сценарій​

Підтримувані типи файлів​

Чат з аудіо- або відеофайлами​

Вирішення обмежень даних

Можливості з вашими документами

Недоліки документно-орієнтованого чату

За лаштунками чату з документами

Процес відбору фрагментів документа

Підходящі моделі для документно-орієнтованого чату

Вибрати один або кілька документів

Обробка за кожним файлом

Можливий сценарій

Підтримувані типи файлів

Чат з аудіо- або відеофайлами