百度推出蒸汽机2.0视频生成大模型,实现多人有声视频一体化

8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型完成了升级,实现了多人有声视频一体化生成。百度蒸汽机是中文音视频一体化生成的I2V模型,其多模态潜在空间规划技术能够自主协调多角色身份、情感与互动逻辑。该系列大模型已经在百度搜索、营销等多个场景落地应用。

相关文章