当前位置：首页> 腾云科技> 正文

科大讯飞星火多模态交互大模型上线实现“语音、视觉、数字人交互”三合一

腾云科技
腾云科技
2024-11-15 22:26:46
788

　　科大讯飞最新推出的讯飞星火多模态交互大模型标志着其从单一语音交互技术拓展到音视频流实时多模态交互的新阶段。该模型集成了语音、视觉和数字人交互功能，实现了三者的无缝结合，引入了超拟人数字人技术，提升了AI的生动性和真实感。新模型通过跨模态的语义一致性实现了情感表达更加真实连贯，支持超拟人极速交互技术，提供个性化的交互体验。多模态视觉交互使模型能全面感知背景场景、物流状态，为用户提供更丰富和精准的交互体验。

微信图片_20241115222549.png

　　亮点提要：

　　科大讯飞推出讯飞星火多模态交互大模型，集成语音、视觉和数字人交互功能，实现无缝结合。

　　引入超拟人数字人技术，数字人动作与语音内容精准匹配，提升AI的生动性和真实感。

　　支持超拟人极速交互技术，实现语音到语音的端到端建模，提供个性化的交互体验。

　　详情入口：

　　https://www.xfyun.cn/solutions/Multimodel

本站内容来源于网络，并不代表本站立场！版权归原作者所有，转发请注明来源，文章内容仅供参考。
腾云数据--为你提供快速、稳定、安全的专业云计算服务。www.qqidc.com.cn 联系QQ：810379922
本文链接： https://www.qqidc.com.cn/keji/198.html

上一篇
2024年第三季度全球AI PC市场份额突破20%

下一篇
Anthropic发布提示词优化新功能

最新文章

新浪云终止服务
2026-06-18
小米开源可控视频音效生成模型 ControlFoley，让声音“按你想要的来
2026-06-02
科大讯飞 AI 眼镜发布：支持 122 种语言翻译，售价 4299 元
2026-06-02
天涯社区访问须知事项
2026-06-01
关于天涯社区恢复访问进展的情况说明
2026-06-01
互联网信息内容多渠道分发服务管理规定
2026-05-29
国家网信办等五部门联合公布《互联网信息内容多渠道分发服务管理规定》
2026-05-29
360站长平台关于升级网站库管理规则、开展备案合规核查的公告
2026-05-12