音声AI
タグ「音声AI」の記事一覧
GoogleのGemini 3.1 Flash TTS登場。日本語対応と音声タグでAI音声生成が実務向けに近づく
GoogleがGemini 3.1 Flash TTSを発表した。70超言語対応、音声タグ、SynthID透かし、Google AI Studio・Vertex AI・Google Vids展開まで含めて、AI音声生成の実務導入が一段進んだ。
Google「検索 Live」とは? 日本提供開始でAI検索は音声・カメラ時代へ——Gemini 3.1 Flash Liveの意味
Googleが2026年3月27日、日本で検索 Live を開始。Gemini 3.1 Flash Liveを軸に、音声とカメラで会話する検索が一般化し、開発者はLive APIから同系統の音声エージェントを構築できるようになった。
Alibaba Qwen3.5-Omni発表——テキスト・音声・映像を1パスで処理する「全方位AI」は何を変えるか
AlibabaのQwenチームがオムニモーダルモデルQwen3.5-Omniを公開。113言語の音声認識、10時間超の音声処理、映像からのコード生成まで。Gemini 3.1 Proを複数ベンチマークで上回る性能の中身を解説。
Mistralが音声AIに本格参入。オープンソースTTSモデル「Voxtral」の衝撃
フランスのMistral AIがテキスト読み上げモデル Voxtral TTS をApache 2.0ライセンスで公開。4Bパラメータの軽量設計で、ElevenLabsやOpenAIに真正面から挑む。