Перейти к основному содержимому

Audio Transcriptie & Vergadernotulen

AI-Public предлагает мощные возможности транскрипции для преобразования аудио в текст с использованием реального времени API OpenAI. Транскрипция выполняется в режиме реального времени, чтобы вы могли сразу проверить корректность отображаемого текста. Кроме того, можно автоматически составлять повестки заседаний на основе транскрипции.

Главный экран

На главном экране модуля транскрибации можно выбрать между новой записью в реальном времени или загрузкой существующего аудиофайла.

Загрузка аудио

Существуют два способа предоставить аудио для транскрипции:

Прямой записью в AI-Public

Нажмите на большую кнопку «Start Opname» (Начать запись), чтобы начать запись в реальном времени. Перед началом записи появится диалоговое окно с настройками записи:

Настройки записи

При запуске записи можно настроить различные параметры:

  1. Тип записи: Выберите тип записи для оптимизации качества аудио:

    • Личная запись: Для одного человека рядом с микрофоном (подкаст, личные заметки)
    • Совещание (по умолчанию): Для нескольких говорящих в помещении
    • Урок или презентация: Для одного докладчика с возможным взаимодействием

    В зависимости от вашего выбора будет применён соответствующий аудио-фильтр:

    • Фильтр ближнего расстояния для личных записей
    • Без фильтра для совещаний (чтобы захватить всех говорящих)
    • Фильтр дальнего расстояния для уроков и презентаций
  2. Запись аудио: Укажите, желаете ли сохранять аудио вместе с транскрипцией

    • Да: Аудио сохраняется в Firebase Storage
    • Нет: Сохраняется только текстовая транскрипция
  3. Интервал загрузки аудио (только если выбрана запись аудио):

    • Укажите интервал (1-15 минут), через который аудио будет сохраняться
    • По умолчанию: 5 минут
    • Более короткие интервалы (например, 1-2 мин): больше файлов, но безопаснее при сбоях компьютера
    • Более длинные интервалы (например, 10-15 мин): меньше файлов, но риск потери при технических проблемах

Использовать существующий аудиофайл

Также можно загрузить ранее записанный аудиофайл в AI-Public. Нажмите кнопку «Selecteer audio bestand» и выберите файл. Поддерживаемые форматы: MP3, WAV, M4A и WebM.

Живая транскрипция

Во время транскрипции AI-Public использует реального времени API OpenAI. Это означает, что можно следить за текстом онлайн или за корректностью транскрипции.

Важно: если транскрипция не полностью совпадает с произнесённым текстом:

  • Говорите яснее и чётче
  • Убедитесь, что используете хороший микрофон
  • Убедитесь, что микрофон находится близко к говорящему
  • Выберите правильный тип записи в настройках

Протоколы собраний

После записи и транскрипции можно автоматически составлять протоколы собраний. Перейдите на вкладку «Vergadernotulen» и нажмите кнопку «Vergadernotulen opstellen».

Протоколы собраний автоматически составляются на основе транскрипции и активного запроса.

Расширенные настройки

Управление промптами

Вы можете полностью настраивать и управлять промптами для протоколов собраний. Нажмите кнопку «Prompt configureren», чтобы открыть диалог настройки промптов.

Стандартные промпты

AI-Public предлагает два стандартных промпта:

  1. Стандартная встреча: создаёт структурированные протоколы собраний с общими разделами
  2. С распознаванием говорящего: создаёт протоколы собраний с распознаванием говорящего и присваивает каждому говорящему уникальный номер

Собственные промпты

Вы также можете создавать свои собственные промпты:

  • Нажмите «Eigen prompt toevoegen»
  • Дайте промпту имя
  • Опишите инструкции по формированию протоколов собраний
  • Сохраните промпт

Все пользовательские промпты сохраняются в вашей учётной записи и доступны для будущих транскрипций.

Управление историей

Можно просматривать и управлять историей ранее созданных транскрипций через кнопку «Geschiedenis».

В истории можно:

  • Поиск транскрипций по названию, дате или содержимому
  • Редактировать заголовки по клику на иконку карандаша
  • Загружать транскрипции повторно просмотреть или отредактировать
  • Удалять транскрипции, которые больше не нужны
  • Воспроизводить аудио если транскрипция содержит аудиозаписи

Как использовать транскрипцию

Можно использовать транскрипцию различными способами:

  • Копировать: скопируйте транскрипцию кнопкой копирования
  • Экспорт в PDF: скачайте транскрипцию как PDF-документ
  • Использовать в чате: вставляйте транскрипцию в чат для задавания вопросов или проведения аналитики
  • Экспорт протоколов собраний: экспортируйте протоколы собраний в PDF или Word

Автоматическое деление аудио

Во время живой транскрипции AI-Public может сохранять аудио частями. Эти части загружаются на заднем плане и обрабатываются, чтобы длинные записи были лучше защищены при потере соединения, браузера или устройства.

Интервальная загрузка не останавливает живую запись. Каждый интервал сохраняется как самостоятельный WAV-аудиофайл, чтобы служба обработки получила полный и действующий аудиофайл. Последняя часть сохраняется также при остановке записи.

Если обработка аудиодоля не удалась, запись может продолжаться. После завершения проверьте статус файлов и повторно загрузите или обработайте часть, если нужно.