阶跃星辰连发两款开源多模态大模型,视频生成大模型Step-Video和语音交互Step-Audio模型,性能位列开源多模态全行业第一。 - Step-Video-T2V 是全球范围内参数量最大、性能最好的开源视频生成模型。和此前引爆全球科技界的 DeepSeek R1 一样,阶跃星辰的 Step-Video-T2V 视频生成模型,采用最为宽松的 MIT 许可协议,支持免费商用、任意修改和衍生开发,为开源社区带来了新的技术思路启发。这次发布也意味着阶跃星辰成为大模型开源世界的又一股中国力量。 - Step-Audio 是首个产品级语音交互模型,能够根据不同场景生成情绪、方言、语种、歌声和个性化风格的表达,让 AI 能和用户自然地进行高质量对话。 2月21日,在全球开发者大会(GDC)上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。截至目前,魔搭社区已上架超过4万个开源模型,涵盖LLM、对话、语音、文生图、图生视频等多个领域,是中国最大的AI模型社区。阿里云魔搭社区首发阶跃星辰最新开源两款多模态模型,已上架超4万个开源模型|界面新闻 · 快讯