歸藏的AI工具箱 2024年12月19日
可灵1.6:最强图生视频模型!写实和风格化只要它就够了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

可灵1.6版本被誉为当前最强的图生视频模型,在写实和风格化视频生成方面均表现出色。尤其在风格化视频生成上,其能力远超其他模型,能处理复杂的运动和纹理。通过对比测试,可灵1.6在文本响应度、物理世界理解和画面质量上都有显著提升。它不仅能准确理解用户提示词,还能在视频中展现逼真的物理效果和丰富的画面细节。此外,可灵1.6在处理非写实内容和独特风格化图片方面也表现出色,为内容创作者提供了强大的工具。

🚀可灵1.6在风格化视频生成方面表现卓越,能处理复杂的运动和纹理,远超其他模型, 尤其在非写实内容的处理上,展现了强大的学习能力。

🎬文本响应度显著提升,对运动、时序动作及运镜提示词的理解更加精准,例如能准确实现“希区柯克变焦”等复杂镜头效果,即使在风格化图片中也能有效识别内容。

🥩物理世界理解和真实感大幅增强,例如能准确模拟刀切牛排的动作,包括手部动作、肉的反馈以及切开后肉的材质和大小保持一致,体现了对物理规则的深刻理解。

🖼️画面质量显著提升,尽管分辨率未提高,但运动部分明显增多,画面细节更加丰富,例如在柿子树的场景中,逆光、雪花及远山等细节都得到了精细呈现,展现了强大的画面表现力。

原创 歸藏的 AI 工具箱 2024-12-19 17:20 北京

前几天刚测试完可灵的视频Lora模型功能,1.6就又要发布了。 

试完之后我可以说可灵1.6就是现在的最强图生视频模型。

前几天刚测试完可灵的视频Lora模型功能,1.6就又要发布了。 

试完之后我可以说可灵1.6就是现在的最强图生视频模型。 

常见写实内容强就算了,风格化图片的视频生成才是重点,这个真是断档的强,写实视频其他模型多抽卡也行,风格化这个表现的表现其他模型抽卡都不好搞,后面会介绍风格化的部分。 

先来看看全面的文生和图生对比测试,刚好跟Sora测试的视频还在就多跑了一份1.6,对比可以说非常明显了。 

 

文本响应度提升:对对运动、时序类动作、运镜提示词的响应明显变强,比如下面这个内容,镜头推进这个是基本的他搞得不错,强的是希区柯克变焦这个词,我试过很多都不行,它居然搞定了,而且这还是风格化的图片,本身内容识别就困难。 

图生视频、提示词:镜头推近,希区柯克变焦,太阳缓慢升起,飘落得红叶,流动的云雾 

 

物理世界理解和真实感提升:这个其实有一个很好的例子就是前几天Veo的那个切牛肉的例子,这个例子有两个递进的难点,首先是刀要切下去,切下去的时候手部动作和肉的反馈,这个之前1.5可以搞定,也是除了Veo唯二搞定的。 

第二个难点是切出去的肉需要拿刀扒拉过去,扒拉过去之后肉的大小和材质不能发生变化,这个前几天没有一个可以做到,这次1.6表现的很好,我甚至都没抽卡,一次就出了。 

文生视频、提示词:一双手在木制切菜板上熟练地切割一块完美烹饪的牛排,淡淡的蒸汽从牛排上升起。 

 

最后就是画面质量的提升:这个也很明显,1.6虽然分辨率没有提升,但是整体画面中运动的部分明显增多,如果是文生的话可以看到画面明显变得丰富了很多,比如下面这个柿子树,逆光效果还有阳光下的雪花,还有远处的山脉和镜头移动后附近的灌木细节都很明显。 

文生视频、提示词:冬天,孤零零的柿子树在白雪皑皑的山坡上独占鳌头,雪花围绕着饱经风霜的树干飘舞,远处的群山在冬雾中若隐若现,宛如中国传统绘画中的笔触。 

 

基础的测试就是上面的部分,我在测试中突然试了一下 2D 图片后发现,可灵 1.6 跑高风格化图生视频质量高的离谱,来看看完整的测试视频。 


其实由于写实视频素材很多,所以视频模型写实做的好是正常的,但是风格化其实很难搞,不同的风格化图片运动方式都不一样,之前很多视频模型处理风格化图片出现违和的 3D 化也是这个原因。 

而且风格化或者说非写实内容其实对内容创作成本节省也更大,渲染或者绘制内容的成本要比真人演出高很多,所以这部分的能力提升对创作者帮助非常大。 

先来看一下非写实内容,这里指的是类似一些偏 3D 的但是现实中没有的场景或者事物运动,比如这个龙在吐息的场景,可以看到龙的毛发被风吹动的时候每一根都在动而且很合理,龙须也是一样的,说明一些非现实内容,的运动方式他也学习的很好。 

另外就是一些奇怪的姿势和艺术化表达,比如下面这个例子,这个图片画出来的时候我都无法想象她应该怎么动,而且角色大部分的装饰和其他身体部位是没有露出的,结果出来的时候我都傻了,可灵不止动起来了,运动幅度还很大,自己脑补的配饰和肢体都跟原来的画面风格非常相似。 

最后是画面笔触和纹理非常独特的一些风格图片,比如下面这个雪天的小女孩,整体的笔触非常的特别,运动的时候就需要模型补全这种非常独特的笔触,可灵的雪花运动幅度都很大,而且后面新出现的雪花也保持了已有的风格。 

昨天尝试玩可灵 1.6 之后我还说相较于死气沉沉的大语言模型领域,图片和视频的进步太令人欣喜了,每周、每个月都有肉眼可见的进步。 

可灵这次 1.6 进步之大我觉得叫 2.0 也不过分,但是他们依然只把版本号往前提了0.1,说明他们对于自己能力和模型相当自信,无法想象可灵 2.0 该是什么样的表现。 

我现在还记得可灵 1.0 发布的那个下午和我看到演示时激动的场景,短短半年时间他们让这种场景出现了很多次,真的很强。 

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

可灵1.6 图生视频 AI模型 风格化视频 视频生成
相关文章