MuseTalk一种实时高质量口型同步模型（在 NVIDIA Tesla V100 上为 30fps+）。

意思是：性能高于此显卡就可以开直播，实现实时直播流。

MuseTalk 可以与输入视频一起应用，例如由MuseV生成的视频，作为完整的虚拟人解决方案。

意思是：先利用MuseV生成视频，再由MuseTalk对视频口型。

功能特性

MuseTalk是一个实时高质量音频驱动的口型同步模型，在的潜在空间中进行训练ft-mse-vae，其中
根据输入音频修改未见过的脸部，脸部区域的大小为256 x 256。
支持中文、英文、日文等多种语言的音频。
支持 NVIDIA Tesla V100 上 30fps+ 的实时推理（直播流，可以开直播的意思）。
支持修改面部区域中心点建议，这显著影响生成结果。
检查点可用在 HDTF 数据集上进行训练。

对于视频配音，我们应用了自主开发的工具，可以识别说话的人。

MuseTalk 在潜在空间中进行训练，其中图像由冻结的 VAE 进行编码。音频由冻结whisper-tiny模型编码。生成网络的架构借鉴了UNet stable-diffusion-v1-4，其中音频嵌入通过交叉注意力融合到图像嵌入。

bbox_shift 调整张嘴大小

🔎我们发现面罩上界对张口度有重要影响。因此，为了控制掩模区域，我们建议使用该bbox_shift参数。正值（朝下半部分移动）会增加嘴巴张开度，而负值（朝上半部分移动）会减少嘴巴张开度。

您可以先使用默认配置运行以获得可调整的值范围，然后在此范围内重新运行脚本。使用默认例子，运行默认配置后，显示可调整值范围为[-9, 9]。然后，为了减少嘴巴张开度，我们将值设置为-7。

总结

MuseTalk是一个实时高质量音频驱动的口型同步模型，专为实现虚拟数字人口型与音频的精准同步而设计。

如果您想进行在线视频聊天，建议您使用MuseV生成视频，并提前进行必要的预处理，例如人脸检测、人脸解析等。在线聊天时，只涉及UNet和VAE解码器，这使得MuseTalk具有实时性。

开源地址

服务声明：本网站所有发布的软件和学习资料以及牵涉到的源码均为网友推荐收集各大资源网站整理而来，仅供功能验证和学习研究使用，您必须在下载后24小时内删除。不得使用于非法商业用途，不得违反国家法律，否则后果自负！一切关于该资源商业行为与本站无关。如果您喜欢该程序，请支持购买正版源码，得到更好的正版服务。如有侵犯你的版权合法权益，请邮件与我们联系处理删除83855733@qq.com，本站将立即更正。请作者喝杯咖啡

MuseTalk腾讯Ai数字人，1种实时高质量口型同步模型，支持直播流

功能特性

bbox_shift 调整张嘴大小

总结

评论(0)

提示：请文明发言取消回复

排行榜

MathType (数学公式编辑器) v7.8.0 中文破解版

【灵狐剪辑永久版】AI视频剪辑利器，智能混剪＋自动去重，小白可操作（附教程＋安装包）

Office AI 助手智能AI办公工具软件-长期免费支持公文排版）

思维导图 XMind 2024 v24.01.14362 中文破解版

IDM下载器 (Internet Download Manager) v6.42.7 中文破解版

Deep Freeze (冰点还原) v8.71.020.5734 中文破解版

一键AI脱衣 – ComfyUI 工作流分享

免费Ai唱歌生成软件！多种声音选择，且免费

万兴亿图图示 (Wondershare EdrawMax) v13.0.2.1071 中文破解版

点源卡证通-ver1.0.42-身份证等卡证免费拼版工具免费使用无需注册亲测好用

Replay强大且易于使用的AI翻唱工具，适合各种水平的用户尝试和使用

多角色文本AI语音生成软件EmotiVoice-Plus离线整合包

打印机局域网共享工具一键修复系统更新造成的打印机无法共享报错709 连接失败

Microsoft Office 专业增强版 2024 简体中文批量授权版_2024年11月更新版

星海SVIP神器v4.0 解锁版

WPS Office 2023 v12.8.2.18205 专业增强版 – 流行国产办公软件

office2024绿色精简版-永久激活

NeuCo AI – 全新声音克隆AI工具，无需训练，一键翻唱任意歌手任意歌曲

公众号文章下载工具，一键保存公众号所有历史文章

【PDFCommander v1.18.1】1.2.0永久免费的PDF万能水印删除工具，去水印、换颜色、删文本

MuseTalk腾讯Ai数字人，1种实时高质量口型同步模型，支持直播流

功能特性

bbox_shift 调整张嘴大小

总结

相关文章

评论(0)

提示：请文明发言 取消回复

排行榜

提示：请文明发言取消回复