cnBeta全文版 09月12日
字节跳动Seedream 4.0横空出世,文生图编辑实力碾压
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

字节跳动发布的Seedream 4.0图像创作模型在“文生图”和“图像编辑”两大榜单上均登顶第一,展现了强大的实力。该模型集成了生成图像与图像编辑功能,支持原生4K分辨率,并可一次上传多达10张参考图进行融合创作。Seedream 4.0不仅在图像生成上效果惊人,尤其在中文文字渲染方面表现优异,碾压了GPT-4o和Gemini 2.5 Flash。其强大的知识和推理能力,使其能够同时进行图像生成和解方程等复杂任务。Seedream 4.0还支持连续生图,可用于动画和视频制作,并能生成信息图表,极大地提升了创作效率和学习体验。

🌟 **强大的多模态创作与编辑能力**:Seedream 4.0首次将“生成图像”和“图像编辑”(SeedEdit 3.0)整合到单体模型中,实现了文本到图像生成与图像编辑功能的无缝结合。其原生4K分辨率和一次最多上传10张参考图的能力,为用户提供了前所未有的创作自由度和灵活性,能够轻松实现多图融合、老照片修复、3D手办生成等创意玩法。

📝 **中文文字渲染的显著优势**:在文字生成方面,Seedream 4.0表现尤为突出,尤其在中文文字渲染效果上,能够生成清晰、准确且富有设计感的文字,其效果碾压了GPT-4o和Gemini 2.5 Flash等模型,满足了用户在图像中添加高质量中文文字的需求。

🧠 **卓越的知识与推理能力**:Seedream 4.0不仅是图像生成工具,还具备强大的知识理解和推理能力。它能够一边生成图像,一边进行复杂的逻辑运算,例如解方程、生成清晰的冰激凌配方图、以及比较建筑特点等,显示出其在理解和应用信息方面的深度。

🎬 **赋能内容创作与视频制作**:该模型强大的“连续生图”能力,使得用户能够通过输入剧情描述,自动生成多个关键画面帧,为动画和视频制作提供了极大的便利。这使得个人用户也能轻松制作Vlog、创意短片,将故事脚本转化为视觉呈现,极大地提高了内容创作的效率。

📊 **信息可视化与教程制作新体验**:Seedream 4.0能够将枯燥的文字知识转化为直观的信息图表,如牛顿第二定律的科普图,极大地提升了学习效率。同时,它还能根据草图和中文描述,生成制作教程图,例如牛肉汉堡的制作步骤,并支持手账风格,为内容创作和教育领域带来了新的可能性。

Google Nano Banana一夜爆火之后,各种邪修玩法儿,至今让全网意犹未尽。等距视角、多图合成、老照片修复、3D手办.......创意脑洞大开,全网玩疯。


谁曾想,短短半个月后,大洋彼岸就杀出来了一个最强逆袭者!

就在刚刚,字节跳动发布的豆包·图像创作模型Seedream 4.0,一举拿下了Artificial Analysis“文生图”和“图像编辑”两大榜单的第一。




一键创作+编辑,原生4K分辨率,一次最多上传10张参考图。

如今,全网的画风是这样子的——





左右滑动查看

有网友随手扔了一张糊到爹妈都不认的图,Seedream 4.0直出一张超清版的,简直是废片秒变神作。



生图不仅是它的强项,Seedream 4.0还具备了超强的知识和推理能力。

就比如,一边生图,一边解方程;生成的冰激凌配方图,逻辑清晰;一键比较建筑特点,美观且要点明了......





左右滑动查看

这是因为,Seedream 4.0首次将“生成图像”和“图像编辑”(SeedEdit 3.0),全部整合到单体模型中。

相较于上一代,4.0版本生成文字清晰又准确,尤其是在中文文字渲染上,效果碾压GPT-4o、Gemini 2.5 Flash。

比如,我们想把下面这听饮料上面的字换成“新智元”。


Seedream 4.0给出的结果,不仅光影正确,而且字体也很有设计感。


相比之下,GoogleNano Banana生成的,除了“新”字之外,可以说是是驴唇不对马嘴。


更多对比如下:





左右滑动查看

可以说,Seedram 4.0的横空出世,一夜之间掩盖了Google“香蕉”所有光芒。

现在,打开“火山方舟体验中心”,就可以免费体验4K高清多模态生图了!



点击【阅读原文】即可直达,传送门:https://www.volcengine.com/experience/ark?launch=seedream

一手实测,更适合中国宝宝

多图融合,是最常见的一种玩法儿。

不论是“双人同框”,还是每日穿搭、模仿火柴人动作草图等等,Seedream 4.0可以全部拿捏。

甚至,一次上传10张参考图,它都能以正确的逻辑融合成一张图。

十图无缝合成,生成专属OOTD

就比如,今日份OOTD穿搭,Seedream 4.0就能直接帮你承包了。


让图1女孩穿上图2的穿搭

上传一张个人照片,再淘一张穿搭图,上身效果如何,几秒就能get了。

令人惊艳的是,照片生成的太自然了,人物一致性非常高,肉眼根本辨别不出是AI生成的。


再换一套简约风格的,果然人美穿啥都好看。


接下来加大难度,一次上传八张图片:一张主角,五张配饰,外加一只杜宾和一辆吉普汽车。

为了让图像呈现得更加美观,提示要求男子站在汽车一旁,狗紧挨着男主。


图1的男子穿上第2、3、4、5、6张图的穿搭,站在第八张图汽车前,第七张图小狗站在男人身旁

不得不说,Seedream 4.0理解力一绝,还能准确地给男主穿上衣服,戴上配饰。


随便一个pose模板,Seedream 4.0便可以让任何人做出相同的动作。

一位古装女子和一位画上的皇帝,做图3的摆拍,那会是怎样的效果?


将图1、图2合进一张图里,参考图3姿势

快看,这张合照堪称“天作之合”,真是挑不出一点毛病,比拍照还真。


再比如,自己想要一张和霉霉合照,Seedream 4.0就可以帮你实现愿望。


图1和图2女生合拍,两人表现自然一些,背景是上海东方明珠夜景

上传两张图后,一句话,即可无缝合成。

可以看到,照片中人物的衣服、头发颜色等细节非常一致,而且动作自然,没有出现人物失真的情况。


现场手绘一个“火柴人”,就让犬夜叉和杀生丸来一个打斗摆拍。


让图1和图2两个人,模仿图3的姿势

没想到,就这么随笔一画,让Seedream 4.0就让动漫人活灵活现了。


还有3D物理世界小人,Seedream 4.0也可让其动作1:1复刻。


图1女生做图2的动作

连续生图,淘汰制片人?

想连续做动画或视频,缺少灵感?

Seedream 4.0还具备了强大的“连续生图”的能力,只要输入剧情描述,AI即可自动生成多个关键画面帧。

最后,再借助AI视频工具,合成动态视频。

从故事脚本到视觉呈现,一个人即可轻松搞定Vlog、创意短片,从此制作效率翻倍。

举个栗子,你可以让名画中的人,在同一时空下相遇。


图1的梵高和图二的蒙娜丽莎,在图3的一家酒吧里偶遇,然后两人在图4露天小餐馆畅谈,需要环境的局部特写,比如酒馆的光影,酒杯特写等。

梵高和蒙娜丽莎在一家酒吧偶遇后,两人又去户外小餐馆畅聊。


动漫连载,下一个宫崎骏是你

我们再来做一个动漫连环画,上传一张有人物角色的照片。


然后,若是想要指定的画面,把所有故事分镜的脚本扔给Seedream 4.0。

保持封面参考图的绘画风格和封面的主体,下面每句话帮忙生成一句故事分镜(一共5个分镜):

1. 夏日清晨,小女孩背着绣小熊的布包,牵着卷毛小狗从家门口出发,门廊竹席上还放着没喝完的绿豆汤。

2. 两人走到公园长椅旁,小狗突然追着粉蝴蝶跑远,小女孩举着刚摘的狗尾草。

3. 路过野菊花丛,小女孩蹲下来摘小黄花,小狗叨起一朵送到她手边,花瓣上还有露珠。

4. 听到远处卖冰粉的叫卖声,小女孩牵着小狗跑过去,买了碗红糖冰粉,用小勺子喂小狗尝了口。

5. 突然下起小雨,小女孩拉着小狗躲进公园的木亭子,小狗缩在她脚边,用脑袋挨着她。

不一会儿工夫,五个分镜全部出来了。画面效果非常惊艳,而且人物画面全部保持一致。






左右滑动查看

电影分镜,堪比好莱坞大片

一直以来,人们都难以相信,一款AI工具如何能砸掉制片人的饭碗?

当你真正体验之后,就会惊叹这就是现实!

接下来,上传一张女主和一张男主的照片,任何人就可以直接拍出一部短剧。


prompt:参考图片形象,生成三种影视分镜:第一幕女主去买帽子;第二幕转角遇到了图2的帅气男子;第三幕男主向女主表达爱慕,两人微笑。复古风格。

第一幕:女主去买帽子。

值得一提的是,在第一幕画面生成中,Seedream 4.0还整了一个高难度——镜面。

可以看到,女主表情和镜子中一致,包括帽子、耳钉、珍珠项链、衣服等等,和原图保持高度一致。


第二幕,女主出门转角,偶遇到了男主。

这一幕中,Seedream 4.0放大了视角,营造了一种“魔法版”的偶遇,逼真还原了男女主。


第三幕,男主向女主表达爱慕。

注意看,这里的镜头又被拉近,男女主之间的甜蜜溢出了屏幕,一根羽毛成为了他们之间爱情的见证。


是不是感觉情节太过精彩,还没有看够。不如,接下来的故事,就由你们来续写~

创意玩法,脑洞大开

除了多图融合、连续生图,Seedream 4.0还有各种本领。

比如,让它取出汉堡的所有馅料,只保留顶部和底部的面包片。而且,两个面包片之间空隙间隔,要与原来的一致。


Remove all the ingredients from the burger and keep only the top and bottom buns. Leave a gap between them, keeping the same spacing as if the fillings were still inside.

一个只有面包,没有夹层的汉堡就闪现了。


它还可以生成一个可爱小狗的桌面手办。


根据草图,生成对应主体的立体搪胶手办,摆放在深色电脑桌上

除了图片的生成和编辑外,Seedream 4.0还拥有智能——它真的理解图片上的内容。

比如让它推断生成,一张上海东方明珠照片12个小时后的样子。


12个小时后,城市展示的景色

模型不仅正确推断出12小时后是夜景,而且建筑物的细节、角度等也都非常完美的还原。

补全后的4k图像真的是相当清晰。


再比如,给它一个时间,然后问1分钟之后会显示什么。


Seedream 4.0也能正确推断出相应的时间,而且其他参数也都没有随意改动。

草图建模也不在话下。

设计师有福了。


根据草图,设计出完整建筑,并上色

可以看到,模型不仅完美还原出建筑的设计细节以及外部材料的质感,为了方便展示顶部的设计,它甚至还改变了视角。

简直太贴心了。


还可以反过来玩,将建筑转换成模型,而且是不同的角度。

这都需要模型进行很多推理。


把建筑做成不同视角的全景模型,白色的背景,微缩模型,需要四张,不同角度,分别是鸟瞰图、顶视图、侧视图、仰视图


最近还流行的一种玩法是制作教程。

比如让Seedream 4.0生成一张牛肉汉堡制作步骤教程图,绘制在手账本上。

可以看到最后的教程步骤清晰,实用性很高。


彩铅手账风格,出一个牛肉汉堡制作步骤教程图,步骤说明要中文,女生手写可爱字体,绘制在一个手账本上

更进一步的应用是制作信息图表。

这个应用不仅好玩儿,还更有教育意义——一下子把枯燥的文字知识变成图表,让学习的效率指数型上升。

举个栗子:牛顿第二定律。


提示词:“牛顿第二定律”信息图表,包括科普文字、示意图和基础物理公式,分列进行排版

太香了。上学时要是有这东西,我的成绩绝对还能上升两个层次。

一键接入API

当然,作为一家云平台,火山引擎也支持API接入,面向开发者解锁更多玩法。


在火山引擎拿到自己的API KEY后,只需点击上图中的API接入,就可以看到调用的示例代码。


在红框内换成自己的API KEY后,直接复制代码放到终端即可。

大家看一下Seedream 4.0文生图的质量。

生成3张女孩和奶牛玩偶在游乐园开心地坐过山车的图片,涵盖早晨、中午、晚上


除了文生图外,API还支持图生图、多图融合、组图输出等多种玩法,大家可以自己去体验。


查看评论

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Seedream 4.0 字节跳动 文生图 图像编辑 AI 人工智能 深度学习 多模态 中文文字渲染 内容创作 视频制作 信息图表 火山方舟
相关文章