マイクロソフト(Microsoft)のAI研究部門「Microsoft AI」は、テキスト・音声・画像の3モダリティをカバーする独自の基盤AIモデル群を発表した。25言語対応の高速音声認識「MAI-Transcribe-1」、音声生成モデル「MAI-Voice-1」、画像生成モデル「MAI-Image-2」の3種類で、いずれもAPIで商業利用が可能。

この記事の続きを読むにはログインが必要です

ログイン / 新規登録