話者認識と高速言語モデルが利用可能に

2026年6月9日 · 2 分で読めます

話者認識と高速言語モデルが利用可能に

改善された文字起こしと Gemini 3.5 Flash で、より効率的に作業できます。

日付: 2026-06-09

カテゴリー: ニュース

AI-Public で新しいモデルが利用可能になり、公共部門において、さらに効率的かつ正確に作業できるようになりました。主な追加は、文字起こしモジュール向けの新モデル gpt-4o-transcribe-diarize です。

このモデルは、別の話者が発言したタイミングを自動で認識します。これにより、インタビュー、市民参加イベント、同僚との打ち合わせなどの記録作成が、より整理しやすくなります。テキストは話者ごとに直接分けられるため（たとえば話者 A、話者 B）、会話記録を手作業で編集する時間を大幅に削減できます。話者認識を備えた改善版の文字起こしは、音声録音に対して文字起こしモジュールを開始すると自動的に適用されます。

さらに、言語モデルのラインアップに Gemini 3.5 Flash を追加しました。このモデルは、速度と効率性を重視して特別に設計されています。市民向けコミュニケーションのための短い文章案の生成、届いた文書の迅速な要約、業務中の事実確認の質問への回答など、すぐに結果が必要な作業に最適です。

これらの更新により、AI-Public が支援業務をより速く、より分かりやすく処理することで、皆さまは本来の業務内容により多くの時間を割けるようになります。

新しいモデルは、本日より組織内のすべてのユーザーがすぐに利用できます。