MuseTalk一种实时高质量口型同步模型（在 NVIDIA Tesla V100 上为 30fps+）。

意思是：性能高于此显卡就可以开直播，实现实时直播流。

MuseTalk 可以与输入视频一起应用，例如由MuseV生成的视频，作为完整的虚拟人解决方案。

意思是：先利用MuseV生成视频，再由MuseTalk对视频口型。

MuseTalk的应用场景广泛而多样，从虚拟人视频生成到视频制作与编辑，再到娱乐与社交分享，无所不能。

1、虚拟人视频生成：与MuseV搭配使用，创造出高度逼真的虚拟人演讲或表演视频。

2、视频制作与编辑：提供高效的解决方案，实现内容的快速修改，不牺牲视频质量。

3、娱乐与社交分享：为照片或绘画作品添加口型动画，创造有趣的视频内容，分享至社交媒体。

四、离线懒人包

为了方便大家体验这一神奇的技术，我们提供了离线整合包，下载到本地解压即用。只需简单几步，你就能轻松体验MuseTalk：

1、双击“一键启动.exe”。

2、打开命令提示窗口，项目会自动运行。加载成功后，复制网址在浏览器打开：“http://127.0.0.1:7860/”。

3、打开页面后，可以看到已经是中文的主界面了，不担心看不懂英文了。

五、使用方法

简单四步，轻松制作数字人视频

1. 输入视频文件。

2. 再输入音频文件。

3. 设置参数，如果不会设置，一般默认参数即可。

4. 点击提交，开始制作。项目运行一段时间后，在主界面的右侧就会生成高品质唇形数字人视频。

六、注意事项

1、显卡要求：建议使用英伟达显卡运行，建议10G显存以上。

2、安装路径：请确保安装路径不包含中文，避免引起适配问题。

功能特性

MuseTalk是一个实时高质量音频驱动的口型同步模型，在的潜在空间中进行训练ft-mse-vae，其中
根据输入音频修改未见过的脸部，脸部区域的大小为256 x 256。
支持中文、英文、日文等多种语言的音频。
支持 NVIDIA Tesla V100 上 30fps+ 的实时推理（直播流，可以开直播的意思）。
支持修改面部区域中心点建议，这显著影响生成结果。
检查点可用在 HDTF 数据集上进行训练。

对于视频配音，我们应用了自主开发的工具，可以识别说话的人。

MuseTalk 在潜在空间中进行训练，其中图像由冻结的 VAE 进行编码。音频由冻结whisper-tiny模型编码。生成网络的架构借鉴了UNet stable-diffusion-v1-4，其中音频嵌入通过交叉注意力融合到图像嵌入。

bbox_shift 调整张嘴大小

🔎我们发现面罩上界对张口度有重要影响。因此，为了控制掩模区域，我们建议使用该bbox_shift参数。正值（朝下半部分移动）会增加嘴巴张开度，而负值（朝上半部分移动）会减少嘴巴张开度。

您可以先使用默认配置运行以获得可调整的值范围，然后在此范围内重新运行脚本。使用默认例子，运行默认配置后，显示可调整值范围为[-9, 9]。然后，为了减少嘴巴张开度，我们将值设置为-7。

总结

MuseTalk是一个实时高质量音频驱动的口型同步模型，专为实现虚拟数字人口型与音频的精准同步而设计。

如果您想进行在线视频聊天，建议您使用MuseV生成视频，并提前进行必要的预处理，例如人脸检测、人脸解析等。在线聊天时，只涉及UNet和VAE解码器，这使得MuseTalk具有实时性。

开源地址：

隐藏内容

本内容需评论后查看

评论后查看

MuseV简介：腾讯版Sora、Ai数字人、基于世界的Ai视频模型（附整合包）

服务声明：本网站所有发布的软件和学习资料以及牵涉到的源码均为网友推荐收集各大资源网站整理而来，仅供功能验证和学习研究使用，您必须在下载后24小时内删除。不得使用于非法商业用途，不得违反国家法律，否则后果自负！一切关于该资源商业行为与本站无关。如果您喜欢该程序，请支持购买正版源码，得到更好的正版服务。如有侵犯你的版权合法权益，请邮件与我们联系处理删除83855733@qq.com，本站将立即更正。请作者喝杯咖啡

自学教程

Ai数字人工具自动获客实战

课程简介 2025Ai数字人工具自动获客，涵盖AI短视频方法、6步获客突围法、商...

3 月前

自学教程

快手AI数字人短视频带货【自动化+全域化】

课程简介本课程从零开始，手把手带您完成整个操作闭环：从前期账号注册、选品诀窍、...

2 月前

自学教程

小白速进爆笑视频混剪课程

课程介绍《小白速进爆笑视频混剪课程》专为视频剪辑新手设计，快速掌握混剪技巧。课...

1 年前

AI+视频

word文档转视频生成工具v1.4 图片一键生成视频

这款应用将图片转视频的制作门槛降低到了前所未有的程度。以往，我们可能需要花费大量...

11 月前

AI+视频

Topaz Video Enhance AI v5.4.0 AI 人工智能技术的视频放大工具

软件介绍 Topaz Video Enhance AI 是一款运用了 AI 人工...

11 月前

AI+图像 AI+视频

iw3 AI裸眼3D转换v1.0 绿色版-一种创新的图像与视频处理解决方案

软件介绍 iw3 是一款 AI 裸眼 3D 转换工具，是一种创新的图像与视频处理...

11 月前

AI+视频

Topaz Video Enhance AI 人工智能技术的视频放大工具

软件说明 Topaz Video Enhance AI是一款运用了AI人工智能技...

4 月前

AI+视频

【灵狐剪辑永久版】AI视频剪辑利器，智能混剪＋自动去重，小白可操作（附教程＋安装包）

前言在视频内容创作日益盛行的今天，拥有一款强大的视频剪辑软件对于自媒体创作者来...

11 月前

lei521 普通用户

这个文件估计很大吧

11 月前

gongrong2025 普通用户

评论就可以下载了么

9 月前

hanchuan 普通用户

感谢大佬

9 月前

q2783885020 普通用户

感谢打捞呀

8 月前

cxn007 普通用户

i see see

8 月前

rose 普通用户

想要下载

8 月前

1093908463 普通用户

111

7 月前

aigcypy 普通用户

我要成为榜一大哥

6 月前

mhnew1 普通用户

谢谢分享

1 月前

提示：请文明发言取消回复

lei521 普通用户

这个文件估计很大吧

11 月前登录以回复
gongrong2025 普通用户

评论就可以下载了么

9 月前登录以回复
hanchuan 普通用户

感谢大佬

9 月前登录以回复
q2783885020 普通用户

感谢打捞呀

8 月前登录以回复
cxn007 普通用户

i see see

8 月前登录以回复
rose 普通用户

想要下载

8 月前登录以回复
1093908463 普通用户

111

7 月前登录以回复
aigcypy 普通用户

我要成为榜一大哥

6 月前登录以回复
mhnew1 普通用户

谢谢分享

1 月前登录以回复

腾讯Ai数字人，1种实时高质量口型同步模型，支持直播流（附MuseTalk整合包）

五、使用方法

功能特性

bbox_shift 调整张嘴大小

总结

评论(9)

提示：请文明发言取消回复

排行榜

MathType (数学公式编辑器) v7.8.0 中文破解版

【灵狐剪辑永久版】AI视频剪辑利器，智能混剪＋自动去重，小白可操作（附教程＋安装包）

Office AI 助手智能AI办公工具软件-长期免费支持公文排版）

思维导图 XMind 2024 v24.01.14362 中文破解版

IDM下载器 (Internet Download Manager) v6.42.7 中文破解版

Deep Freeze (冰点还原) v8.71.020.5734 中文破解版

一键AI脱衣 – ComfyUI 工作流分享

免费Ai唱歌生成软件！多种声音选择，且免费

万兴亿图图示 (Wondershare EdrawMax) v13.0.2.1071 中文破解版

点源卡证通-ver1.0.42-身份证等卡证免费拼版工具免费使用无需注册亲测好用

Replay强大且易于使用的AI翻唱工具，适合各种水平的用户尝试和使用

多角色文本AI语音生成软件EmotiVoice-Plus离线整合包

打印机局域网共享工具一键修复系统更新造成的打印机无法共享报错709 连接失败

Microsoft Office 专业增强版 2024 简体中文批量授权版_2024年11月更新版

星海SVIP神器v4.0 解锁版

WPS Office 2023 v12.8.2.18205 专业增强版 – 流行国产办公软件

office2024绿色精简版-永久激活

NeuCo AI – 全新声音克隆AI工具，无需训练，一键翻唱任意歌手任意歌曲

公众号文章下载工具，一键保存公众号所有历史文章

【PDFCommander v1.18.1】1.2.0永久免费的PDF万能水印删除工具，去水印、换颜色、删文本

腾讯Ai数字人，1种实时高质量口型同步模型，支持直播流（附MuseTalk整合包）

五、使用方法

功能特性

bbox_shift 调整张嘴大小

总结

相关文章

评论(9)

提示：请文明发言 取消回复

排行榜

提示：请文明发言取消回复