オーディオ文字起こしと会議要約
AI-Public は OpenAI のリアルタイム API を使用して音声をテキストに変換する強力な文字起こし機能を提供します。文字起こしはリアルタイムで行われるので、テキストが正しく表示されているかを即座に確認できます。さらに、文字起こしを基に自動で会議要約を作成することも可能です。
スタート画面
文字起こしモジュールのスタート画面では、新規のリアルタイム録音を選ぶか、既存の音声ファイルをアップロードするかを選択できます。
音声の投入
文字起こしには、音声を投入する方法が2通りあります。
AI-Public での直接録音
大きな「Start Opname(録音開始)」ボタンをクリックして、リアルタイム録音を開始します。録音を開始する前には、録音設定のダイアログが表示されます。
録音設定
録音を開始する際に、以下の設定を構成できます 。
-
録音タイプ: 音質を最適化するための録音タイプを選択します。
- プライベート録音: マイクに近い1人用(ポッドキャスト、個人的メモ)
- 会議(標準): 複数の話者が同じ部屋にいる場合
- 授業またはプレゼンテーション: 主講者がいて、対話の可能性がある場合
選択に基づいて適切な音声フィルターが適用されます:
- プライベート録音には Near-field フィルター
- 会議には フィルターなし(全ての話者を正確に捉えるため)
- 授業・プレゼンには Far-field フィルター
-
音声の録音保存: 録音中の音声を保存するかどうかを選択します。
- はい: 音声は Firebase Storage に保存されます
- いいえ: 文字起こしテキストのみが保存されます
-
音声アップロード間隔(音声録音を選択した場合のみ):
- 音声が保存される間隔を設定します(1–15分)
- デフォルト: 5分
- 短い間隔(例: 1–2分): より多くの音声ファイルになりますが、コンピュータのクラッシュ時には安全性が高くなります
- 長い間隔(例: 10–15分): ファイル数は少なくなりますが、技術的な問題での損失リスクが高まります