所有文章 | 第 2 页

Stable Diffusion AnimateDiff | 最火文本生成视频插件

AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型，通过大量短视频剪辑的训练，它能够调整图像生成过程，生成一系列与训练视频剪辑相似的...

所有文章

1年前 (2024)

本篇是关于AI主播虚拟人的Wav2Lip技术实现与评测，后续还会有其他的相关技术实现与评测。本文主要实现图片说话（如下图的蒙娜丽莎）、视频融合语音（这里的核...

AI 视频

1年前 (2024)

项目简介这篇内容介绍了OpenAI的Whisper Large v2语音转录模型的超快速能力。通过使用Transformers和Optimum技术，可以在不到10分钟内转录300分钟（5小时）...

所有文章

1年前 (2024)

0. 简介 TTS是一个将文本变换成语音的AI工具。在自媒体盛行的今天，很多人尝试制作视频发到自媒体平台上，通过获得流量的方式实现直接或间接变现。有部分人天...

所有文章

1年前 (2024)

animatediff和LCM的酷炫组合：制作炸裂的视频就是这么简单！嘿，动画和视频制作的小伙伴们，今天我们来聊聊怎样用animatediff和LCM（Lower Complexity Model...

所有文章

1年前 (2024)

数字人，这一曾被视为科幻领域独有的概念，如今正逐渐走入我们的日常生活。随着科技的飞速发展，尤其是人工智能、虚拟现实、增强现实等技术的突破，数字人已...

AI 视频

1年前 (2024)

一、介绍 Whisper 是一系列用于自动语音识别 (automatic speech recognition，ASR) 的预训练模型，它由来自于 OpenAI 的 Alec Radford 等人于2022年9月...

所有文章

1年前 (2024)

在AI的众多分支中，语音识别技术的突破性进展尤为引人瞩目。由Sanchit Gandhi开发的Whisper JAX就是这一创新旅程中的新星。它是OpenAI的Whisper模型的JAX版本...

所有文章

1年前 (2024)

随着人工智能技术的飞速发展，生成式AI正在深刻改变着电商行业的运作模式。AI数字人作为生成式AI的一个重要应用领域，正在逐渐成为电商人货场重构的主导力量...

AI 视频

1年前 (2024)

想象一下，你正在开车穿越一片风景如画的乡村。随着你逐渐踩下油门，车速开始增加。你的目光时而注视前方的道路，时而瞥向仪表盘上跳动的速度指针。这个简单...

所有文章

1年前 (2024)