オープンソース
タグ「オープンソース」の記事一覧
Alibaba Qwen3.5-Omni発表——テキスト・音声・映像を1パスで処理する「全方位AI」は何を変えるか
AlibabaのQwenチームがオムニモーダルモデルQwen3.5-Omniを公開。113言語の音声認識、10時間超の音声処理、映像からのコード生成まで。Gemini 3.1 Proを複数ベンチマークで上回る性能の中身を解説。
Mistralが音声AIに本格参入。オープンソースTTSモデル「Voxtral」の衝撃
フランスのMistral AIがテキスト読み上げモデル Voxtral TTS をApache 2.0ライセンスで公開。4Bパラメータの軽量設計で、ElevenLabsやOpenAIに真正面から挑む。