篮球买球下单平台本来 50 步才能生成 1 条视频-押注篮球的app

押注篮球的app

押注篮球的app

新闻

篮球买球下单平台本来 50 步才能生成 1 条视频-押注篮球的app

发布日期:2025-01-04 05:04    点击次数:99

篮球买球下单平台本来 50 步才能生成 1 条视频-押注篮球的app

提速 8 倍!

速率更快、截止更好的混元视频模子——FastHunyuan来了!

新模子仅用1 分钟就能生成5 秒长的视频,比之前提速8 倍,要领也从 50 步减少到了6 步,以致画面细节也更传神了。

和平淡速率的混元‍对比一下,本来 50 步才能生成 1 条视频,而当前新模子在调换的时候里不错生成8 条:

再来望望和 Sora 的画濒临比,不错看到 Fast-Hunyuan 和 Sora 两者的截止王人更传神一些,一稔、生果和山岭的细节也格外明晰。

以致在一些物理细节的走漏上,Fast-Hunyuan 比 Sora 还强,比如底下拿取柠檬的视频:

更伏击的是,Fast-Hunyuan 的代码也开源了,这下无须为 Sora 的订阅费和名额发愁了。

询查团队来自加州大学圣地亚哥分校(UCSD)的Hao AI实践室,他们主要专注机器学习算法和散播式系统的询查。

混元官方账号还稀奇发博感谢了他们:

有网友看完后直呼,混元才是最佳的开源视频模子。

始创性的视频 DiT 蒸馏配方

团队是若何作念到 8 倍提速的情况下还能擢升视频明晰度呢?

底下就沿途来看一下 Fast-Hunyuan 的本领旨趣——

领先,他们开辟了全新的视频 DiT 蒸馏配方。

具体来说,他们的蒸馏配方基于阶段一致性(Phased Consistency Model, PCM)模子。

在尝试使用多阶段蒸馏后发现截止莫得权贵校正,最终他们遴选保执单阶段诞生,与原始 PCM 模子的建设相通。

其次,团队使用了 OpenSoraPlan 中的MixKit 数据集进行了蒸馏。

为了幸免在测验进程中开动文本编码器和 VAE,团队还预处分了所少见据,用来生成文本镶嵌和 VAE 潜在变量。

在推理阶段,用户不错通过 FSDP、序列并行和遴选性激活查验点进行可推广测验,模子不错近乎线性推广到 64 个 GPU。测试代码在 Python 3.10.0、CUDA 12.1 和 H100 上开动。

最低硬件要求如下:

40 GB GPU 内存,每个 GPU 配备 lora

30 GB GPU 内存,每 2 个 GPU 配备 CPU 卸载和 LoRa。

此外,他们还统一了预测算潜变量和预测算文本镶嵌,用户不错把柄我方的硬件要求遴选不同的微调神态来实施高唱,也救济图像和视频的羼杂微调。

模子已于 2024 年 12 月 17 日发布了 v0.1 版块。

曩昔的开辟筹画还包括添加更多蒸馏轮番(如散播匹配蒸馏)、救济更多模子(如 CogvideoX 模子)以及代码更新(如 fp8 救济、更快的加载和保存模子救济)等等。

One More Thing

除了加快模子,混元还预报了群众王人格外期待的图像到视频生顺利能。

最快1 月份,也即是下个月就不错看到!期待住了。

GitHub:https://github.com/hao-ai-lab/FastVideo

HuggingFace:https://huggingface.co/FastVideo/FastHunyuan

参考蚁合:

[ 1 ] https://x.com/TXhunyuan/status/1869282002786292097

—  完  —

点这里� � 热情我,牢记标星哦~

一键三连「共享」、「点赞」和「在看」

科技前沿理会日日邂逅 ~