マイクロソフト(Microsoft)のAI研究部門「Microsoft AI」は、テキスト・音声・画像の3モダリティをカバーする独自の基盤AIモデル群を発表した。25言語対応の高速音声認識「MAI-Transcribe-1」、音声生成モデル「MAI-Voice-1」、画像生成モデル「MAI-Image-2」の3種類で、いずれもAPIで商業利用が可能。
この記事の続きを読むにはログインが必要です
ログイン / 新規登録AI解析サマリー
Microsoft AIが音声・テキスト・画像の3基盤モデルを同時発表し、OpenAI・Google対抗の自社AIスタック構築を鮮明にした。
マイクロソフト(Microsoft)のAI研究部門「Microsoft AI」は、テキスト・音声・画像の3モダリティをカバーする独自の基盤AIモデル群を発表した。25言語対応の高速音声認識「MAI-Transcribe-1」、音声生成モデル「MAI-Voice-1」、画像生成モデル「MAI-Image-2」の3種類で、いずれもAPIで商業利用が可能。
この記事の続きを読むにはログインが必要です
ログイン / 新規登録