Аудіо-транскрипція та протоколи зборів
AI-Public пропонує потужні можливості транскрипції для перетворення аудіо на текст за допомогою реального часу API від OpenAI. Транскрипція виконується в режимі реального часу, щоб ви могли одразу перевірити, чи текст відображається правильно. Також можна автоматично складати протоколи зборів на основі транскрипції.
Головний екран
На головному екрані модуля транскрипції ви можете обрати між новою записом у режимі реального часу або завантаженням існуючого ауди файлу.
Подання аудіо
Є два способи подати аудіо для транскрипції:
Прямий запис в AI-Public
Натисніть на велику кнопку "Почати запис", щоб розпочати транскрипцію в режимі реального часу. Перед початком запису з'являється діалогове вікно з налаштуваннями запису:
Налаштування запису
Починаючи запис, ви можете налаштувати різні параметри:
-
Тип запису: Оберіть тип запису для оптимізації якості аудіо:
- Приватний запис: для однієї особи поруч з мікрофоном (подовідник, особисті нотатки)
- Зустріч (за замовчуванням): для кількох доповідачів у приміщенні
- Урок або презентація: для одного головного доповідача з можливими взаємодіями
На основі вашого вибору застосовується відповідний аудіо-фільтр:
- Фільтр близького поля для приватних записів
- Жодного фільтра для зустрічей (щоб усі доповідачі були чітко зафіксовані)
- Фільтр далекого поля для уроків та презентацій
-
Запис аудіо: Виберіть, чи зберігати аудіо під час транскрипції
- Так: аудіо зберігається у Firebase Storage
- Ні: зберігається лише текст транскрипції
-
Інтервал завантаження аудіо (лише якщо обрано запис аудіо):
- Встановіть інтервал (1-15 хвилин), через який аудіо зберігається
- За замовчуванням: 5 хвилин
- Коротші інтервали (наприклад, 1-2 хв): більше аудіофайлів, але безпечніше під час збоїв комп'ютера
- Довші інтервали (наприклад, 10-15 хв): менше файлів, але ризик втрати при технічних збої
Використати існуючий аудіофайл
Також можна завантажити раніше записаний аудіофайл до AI-Public. Натисніть кнопку "Вибрати аудіофайл" та оберіть файл. Підтримувані формати: MP3, WAV, M4A та WebM.
Живе транскрипція
Під час транскрипції AI-Public використовує реальному часі API від OpenAI. Це означає, що ви можете читати текст в режимі реального часу або переконатись, що транскрипція відображається коректно.
Зверніть увагу: якщо транскрипція не повністю відповідає вимові тексту:
- говоріть чітко та артикуляційно
- переконайтесь, що використовується якісний мікрофон
- переконайтесь, що мікрофон розміщено ближче до мовця
- оберіть правильний тип запису в настройках