所有文章
Stable Diffusion AnimateDiff | 最火文本生成视频插件
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视频剪辑的训练,它能够调整图像生成过程,生成一系列与训练视频剪辑相似的...
AI虚拟主播数字人技术实现Wav2Lip
本篇是关于AI主播虚拟人的Wav2Lip技术实现与评测,后续还会有其他的相关技术实现与评测。本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合语音(这里的核...
Insanely Fast Whisper:超快的Whisper语音识别脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2语音转录模型的超快速能力。通过使用Transformers和Optimum技术,可以在不到10分钟内转录300分钟(5小时)...
TTS,一个奇妙的AI工具
0. 简介 TTS是一个将文本变换成语音的AI工具。在自媒体盛行的今天,很多人尝试制作视频发到自媒体平台上,通过获得流量的方式实现直接或间接变现。有部分人天...
爆火的“女孩的一生”,plus版教程它来了
animatediff和LCM的酷炫组合:制作炸裂的视频就是这么简单! 嘿,动画和视频制作的小伙伴们,今天我们来聊聊怎样用animatediff和LCM(Lower Complexity Model...
数字人:从科幻走向现实的技术革命
数字人,这一曾被视为科幻领域独有的概念,如今正逐渐走入我们的日常生活。随着科技的飞速发展,尤其是人工智能、虚拟现实、增强现实等技术的突破,数字人已...
【语音识别】OpenAI语音力作Whisper
一、介绍 Whisper 是一系列用于自动语音识别 (automatic speech recognition,ASR) 的预训练模型,它由来自于 OpenAI 的 Alec Radford 等人于2022年9月...
「语音转换新速度」— 探秘Whisper JAX的70倍速提升
在AI的众多分支中,语音识别技术的突破性进展尤为引人瞩目。由Sanchit Gandhi开发的Whisper JAX就是这一创新旅程中的新星。它是OpenAI的Whisper模型的JAX版本...
AI数字人:重构人货场的新力量
随着人工智能技术的飞速发展,生成式AI正在深刻改变着电商行业的运作模式。AI数字人作为生成式AI的一个重要应用领域,正在逐渐成为电商人货场重构的主导力量...
什么是极限、导数、微分与积分(通俗易懂)
想象一下,你正在开车穿越一片风景如画的乡村。随着你逐渐踩下油门,车速开始增加。你的目光时而注视前方的道路,时而瞥向仪表盘上跳动的速度指针。这个简单...