选择你喜欢的标签
我们会为你匹配适合你的网址导航

跳过将删除所有初始化信息

您的位置：0XUCN > 资讯 > 智能

新闻分类

科技
- 通信
- 数码
- 科学
互联网
- 融资
- 新零售
- 企服
- 共享
- 教育
- 医疗
- 物联网
- 安全
- 智能
- 政策
- 动态
- 技术
- 软件
娱乐
- 电影
- 电视剧
- 综艺
- 动漫
- 音乐
- 明星
- 网娱
- 韩娱
- 热点
- 值得买
游戏
- 手游
- 端游
- 页游
- 主机
- 公告
- 攻略
体育
- 业界
- 足球
- 篮球
- 彩票
汽车
- 车讯
- 新车
- 评测
时尚
- 奢侈品
- 时装
- 美妆
- 美体
健康
- 疾病
- 两性
- 健美
- 医美
- 养生
- 新冠
旅游
母婴
- 孕产
- 哺育
- 早教
- 亲子
- 萌娃
房产
- 资讯
- 家居
- 家电
教育
- 高考
- 考研
- 公考
- 留学
- 高校
- 小初高
宠物
- 资讯
- 百科
- 训练
- 常识
- 宠物用品
其它
造数

AudioGenie – 腾讯AI Lab推出的多模态音频生成工具

智能 PRO 作者：姚彤彤 2025-08-19 00:46

AudioGenie是腾讯AI Lab团队推出的多模态音频生成工具，能从视频、文本、图像等多种模态输入生成音效、语音、音乐等多种音频输出。工具采用无训练的多智能体框架，通过生成团队和监督团队的双层架构实现高效协同。生成团队负责将复杂的输入分解为具体的音频子事件，通过自适应混合专家（MoE）协作机制动态选择最适合的模型进行生成。监督团队则负责时空一致性验证，通过反馈循环进行自我纠错，确保生成的音频高度可靠。

AudioGenie建立了全球首个针对多模态到多音频生成（MM2MA）任务的基准测试集MA-Bench，包含198个带有多类型音频注释的视频。在测试中，AudioGenie在9项指标、8项任务中均达到或接近最先进水平，尤其在音质、准确性、内容对齐和美学体验方面表现出色。

AudioGenie的主要功能

多模态输入与多音频输出：支持从视频、文本、图像等多种模态输入，生成音效、语音、音乐等多种音频类型。

无训练多智能体框架：采用双层架构，生成团队负责任务分解和动态模型选择，监督团队负责验证和自我纠错，确保输出的可靠性。

精细化任务分解：将复杂的多模态输入分解为具体的音频子事件，精确标注音频类型、起止时间和内容描述，形成结构化的生成蓝图。

试错与迭代优化：采用基于“思维树”的迭代优化流程，系统会生成候选音频，由监督团队从质量、对齐度、美学等维度进行评估，若存在瑕疵则自动触发修正或重试流程，直至输出满足要求。

AudioGenie的技术原理

双层多智能体架构：采用生成团队和监督团队的双层架构。生成团队负责音频生成任务的分解与执行，监督团队则负责验证输出的时空一致性并提供反馈以优化生成结果。

自适应混合专家（MoE）协作：根据不同的音频子任务，动态选择最适合的模型进行生成，并通过专家间的协作修正机制优化生成方案，提高生成质量和效率。

无训练框架：采用无训练的多智能体系统，避免了传统训练方法中数据稀缺和过拟合的问题，提高了系统的泛化能力和适应性。

时空一致性验证：监督团队通过反馈循环验证生成音频的时空一致性，确保生成的音频在时间和空间上与输入内容协调一致。

AudioGenie的项目地址

项目官网：https://audiogenie.github.io/

AudioGenie的应用场景

影视制作：快速生成与视频内容高度匹配的背景音乐、环境音效和角色配音，提升制作效率并增强观众的沉浸感。

虚拟人物配音：为虚拟主播、虚拟客服等虚拟人物生成自然流畅的语音，更具表现力和真实感。

游戏开发：根据游戏场景自动生成逼真的环境音效、背景音乐和角色语音，增强玩家的沉浸感和游戏体验。

播客制作：依据播客内容自动生成随剧情起伏的配乐，提升播客的吸引力和专业性。

广告片剪辑：快速匹配品牌调性的音效和音乐，节省制作时间和成本，提升广告的吸引力和感染力。

# AI工具# AI项目和框架

0XU.CN

[超站]友情链接：

四季很好，只要有你，文娱排行榜：https://www.yaopaiming.com/
关注数据与安全，洞悉企业级服务市场：https://www.ijiandao.com/

*文章为作者独立观点，不代表 0XUCN 立场

本文由姚彤彤发表，转载此文章须经作者同意，并请附上出处(0XUCN)及本页链接。

原文链接 https://www.0xu.cn/article/intelnet/intelligent/62773.html

AudioGenie 腾讯 AI Lab

图库

公众号

关注网络尖刀微信公众号
随时掌握互联网精彩

赞助链接

fastposter

processon

itrust

SSL

K2CMS

百度热搜榜

排名热点搜索指数

分享文章

微信
微信扫码分享

新浪微博
离开
复制链接
返回顶部