跳到主要内容

🟢  超全项目合集

构建数字人的思路可以分为三步:

  • 构铸血肉 —— 创建数字人形象
  • 创造感官 —— 文本转音频,音频与形象结合让数字人“开口说话”
  • 注入灵魂 —— 输入领域知识,实现智能对话

因此我们根据不同的领域整理了众多优秀项目,总有一款适合你!

领域功能名称链接备注更新时间
造型输入真人照片,生成数字人照片MINISTER AIhttps://mst.xyz/home免费stable23/08/07
造型输入指令生产图片Midjourneyhttps://discord.com/invite/midjourney可以免费试用23/08/07
音频声音克隆,例如生成翻唱so-vits-svchttps://github.com/svc-develop-team/so-vits-svc开源23/08/07
音频文本转语音,并支持音乐和简单音效barkhttps://huggingface.co/spaces/suno/bark开源23/08/07
音频AI翻唱变声DDSP-SVChttps://github.com/yxlllc/DDSP-SVC开源,低配置电脑可用23/08/07
视频输入图片,文字/音频生成数字人说话视频DIDhttps://bittly.cc/studioDI可以免费试用。https://www.learnprompt.pro/docs/Images/start23/08/07
视频1. 输入照片与文本,生成数字人视频;2. 输入真人视频,生产数字人视频HeyGenhttps://app.heygen.com/收费23/08/07
视频输入音频与色彩空间为SDR的视频,使原视频中的人说出目标内容Video Retalkinghttps://github.com/OpenTalker/video-retalking开源23/08/07
视频输入音频与色彩空间为SDR的视频,使原视频中的人说出目标内容Wav2Liphttps://github.com/Rudrabha/Wav2Lip开源23/08/07
视频输入音频与图片,生成数字人说话视频SadTalkerhttps://github.com/OpenTalker/SadTalker开源,同时支持直接安装Windows应用:https://www.bilibili.com/video/BV1gW4y1o7FC/23/08/07
视频输入文本,选择人物模板生成口播视频kreadoaihttps://www.kreadoai.com/免费。网站还支持AI抠图等功能23/08/07
视频一张图片换成视频换脸Roophttps://github.com/s0md3v/roop开源,https://colab.research.google.com/drive/157RluIDQnvjQy9UBFXL8U5Q-UwgZPqAK23/08/07
数字人应用可灵活组合出不同的应用场景:虚拟主播、现场推销货、商品导购、语音助理、远程语音助理、数字人互动、数字人面试官及心理测评、贾维斯、HerFayhttps://github.com/TheRamU/Fay开源23/08/07

接下来我们会挑选出一些项目,演示如何构建出自己的数字人。