Чат із документами
Наступний крок у обробці інформації
Замість того щоб покладатися на відкриті набори даних та загальні знання, «Чат із Документами» генерує контекстно-специфічні відповіді та аналітику на основі ваших надійних внутрішніх джерел. Завантажуйте свої документи і використовуйте ці документи як основу для відповідей у чаті!
Вирішення обмежень даних
Коли ви ставите запитання мовній моделі, ви залежите від набору даних, на яких навчалась модель. Зазвичай це інформація з інтернету. Непублічні джерела, ймовірно, не входять до цього набору даних. Використовуючи ваші документи як джерело для чату, ви можете бути впевнені, що модель має потрібну інформацію для відповідей.
Можливості з вашими документами
Ви можете ставити запитання щодо ваших документів, наприклад, називаті основні пункти документа або його резюме. Також можна запустити конкретні аналітики за допомогою мовної моделі з використанням вашого власного набору даних.
Недоліки документно-орієнтованого чату
Завантаження документів та їх обробка є додатковими кроками, які вам не потрібно виконувати, якщо відповіді можна отримати без контексту конкретної інформації. Також відповіді створюються повільніше, оскільки потрібно витягнути потрібну інформацію з документа перед відправкою запиту до мовної моделі.
За лаштунками чату з документами
Текст з документів, які ви завантажуєте, витягується з документа та ділиться на фрагменти. Ці фрагменти мають фіксовану кількість символів (1024 символи) і ми також встановили перекриття (128 символів) між фрагментами. Кожну порцію тексту зберігають як вектор у векторній базі даних. Під час кожного запиту з цих даних вибирають відповідні за схожістю з поставленим запитом.
Процес відбору фрагментів документа
Фрагменти вже перетворені на вектори. Вектори мають кілька вимірів, які вказують, наскільки «похожий» цей текст на інший текст. Подумайте про систему кольорів RGB. Колір з подібним RGB-значенням також подібний, але трохи інший. Векторна база даних дозволяє нам витягувати фрагменти тексту у відсортованому та фільтрованому вигляді за запитом.
Ми відбираємо максимум 100 фрагментів тексту довжиною 1024 символи для подальшого використання з запитом.
Підходящі моделі для документно-орієнтованого чату
Ми відібрали моделі з великим контекстним вікном, щоб забезпечити можливість чату з документами. Ми прагнемо мати можливість передавати до 100 фрагментів тексту довжиною 1024 символи. Це більше ніж 100 000 символів. Використовуйте, за можливості, якісну мовну модель із центрального каталогу моделе й.
Підходящі моделі — це моделі з достатнім контекстним вікном та гарним аналізом документів, такі як високоякісні моделі від OpenAI, Claude, Google або європейського штучного інтелекту.
Вибрати один або кілька документів
Ви можете увімкнути режим завантаження файлів, натиснувши на скріпку з правого боку рядка запиту. Можете обрати до 10 файлів для чату.
У момент старту чату з документами перевіряється, чи підходить мовна модель для чату з документами. Якщо ні, автоматично вибирається відповідна модель з актуального каталогу.
Почніть чат із цими документами, поки режим файлів увімкнено.
Обробка за кожним файлом
Окрім чату з документами, AI-Public також дозволяє застосувати окремий запит до кожного документа та отримати індивідуальні відповіді. Ця функція називається Обробка за кожним файлом.

Цю функцію можна використовувати разом із «Чат із файлами».