免费开源的超长AI视频模型：一句话轻松制作120秒精彩视频

发布时间: 2024-04-19分类:共享资源/Free热度: 4453

近日，由Picsart AI Research团队联合发布的StreamingT2V模型可生成长达2分钟(1200帧)的高质量视频,超越了之前的Sora模型。这一开源模型不仅可以生成更长时长的视频,还能与SVD、animatediff等其他模型无缝兼容,为开源视频生成领域带来新的突破。

亮点总结:

免费在线试玩：【点击进入】目测在线人太多需要排队

自己本地搭建教程：

1.安装并安装 Python 3.10 and CUDA >= 11.6 环境【Python 3.10 】、【Cuda 下载】

2.克隆开源项目至本地：

git clone https://github.com/Picsart-AI-Research/StreamingT2V.git

cd StreamingT2V/

3.安装必备的环境：

conda create -n st2v python=3.10

conda activate st2v

pip install -r requirements.txt

4.（可选）如果您的系统上缺少 FFmpeg，请安装 FFmpeg

conda install conda-forge::ffmpeg

5. 从HF 下载模型权重并将它放在 t2v_enhanced/checkpoints目录下

6.文本转视频

cd t2v_enhanced

python inference.py--prompt="A cat running on the street"

如要使用其他基本模型，请添加--base_model=AnimateDiff参数。用于python inference.py --help更多选项

7.图片转视频

cd t2v_enhanced

python inference.py--image=../__assets__/demo/fish.jpg--base_model=SVD

所有测量均使用 NVIDIA A100 (80 GB) GPU 进行。当帧数超过 80 时，采用随机混合。对于随机混合，chunk_size和的值overlap_size分别设置为 112 和 32。