
GoogleがGemini 3.5 Live Translateを提供開始、2,000以上の言語ペアで連続音声翻訳
Gemini 3.5 Live Translateは70以上の言語を自動検出し、手動設定なしで語調やペースを維持しながら、話者の数秒遅れで翻訳音声をストリーミングする。本日より、AndroidおよびiOS版Google翻訳、1分あたり0.023ドルのGemini Live API、2,000以上の言語ペアをカバーするGoogle Meetのエンタープライズプレビューで利用可能だ。このAPIの価格設定と、Meetの対応言語が5言語から70言語以上へと飛躍したことは、リアルタイムの多言語音声がもはや特別な組み込み機能ではなく、インフラとして価格設定されるようになったことを示している。
出典: blog.google ↗
3.5 Live Translateは、文脈を待って品質を向上させるか、話し手に合わせて即座に翻訳するかというトレードオフのバランスをとりつつ、音声を継続的に生成する。
Google Blog
なぜ重要か
- → 手動での言語設定が不要となり、リアルタイム通話で70以上の言語を自動検出する。
- → Google Meetの対応言語を5言語から70以上に拡大し、2,000以上の翻訳ペアを可能にする。
- → 1秒未満の低遅延で、多言語チーム間での自然な会話の流れを維持する。
大規模な音声翻訳