415.tech
シリコンバレー発、AIとテックの最前線
GoogleがGemini 3.5 Live Translateを提供開始、2,000以上の言語ペアで連続音声翻訳

GoogleがGemini 3.5 Live Translateを提供開始、2,000以上の言語ペアで連続音声翻訳

Gemini 3.5 Live Translateは70以上の言語を自動検出し、手動設定なしで語調やペースを維持しながら、話者の数秒遅れで翻訳音声をストリーミングする。本日より、AndroidおよびiOS版Google翻訳、1分あたり0.023ドルのGemini Live API、2,000以上の言語ペアをカバーするGoogle Meetのエンタープライズプレビューで利用可能だ。このAPIの価格設定と、Meetの対応言語が5言語から70言語以上へと飛躍したことは、リアルタイムの多言語音声がもはや特別な組み込み機能ではなく、インフラとして価格設定されるようになったことを示している。

出典: blog.google

Xでポストメール

3.5 Live Translateは、文脈を待って品質を向上させるか、話し手に合わせて即座に翻訳するかというトレードオフのバランスをとりつつ、音声を継続的に生成する。

Google Blog

なぜ重要か

  • → 手動での言語設定が不要となり、リアルタイム通話で70以上の言語を自動検出する。
  • → Google Meetの対応言語を5言語から70以上に拡大し、2,000以上の翻訳ペアを可能にする。
  • → 1秒未満の低遅延で、多言語チーム間での自然な会話の流れを維持する。
大規模な音声翻訳
このエディションの他の記事