众所周知 openai 现在并没有开放,但是只有官网上的那些图来证明他们自己宣称的可以完美呈现文本的内容,似乎并不那么可信。于是,推特上的一位 Openai 的员工发了一个帖子,可以让大家把想测试的内容发到评论区,然后他来替大家生成相关的图像。
那么 Dalle3 经受住了这轮来自网友的脑洞考验么?
下面的内容是这个帖子的重点摘要:
三:人物面部手部不再出错
它在绘制人物和手部方面表现相当出色(终于)。
四:擅长混合真实照片和虚构元素
它在混合照片逼真和虚构元素方面表现出色。这里是平地球的冰墙以及天使升入天堂的照片。
五:擅长极繁和古典艺术
创作极繁艺术和古典艺术确实非常有趣。
六:乐高积木也很擅长
这是一个核电厂的乐高套装。
乐高核聚变发电厂。
七:完美呈现梦中场景
我做了一个梦,所以我尝试在 DALL·E-3 中重新创作它。结果差不多吻合。
八:一些宗教场景
以下是一些与圣经和哥白尼的概念相关的内容。
以下是网友们的脑洞:
"在上海和纽约之间开启虫洞门户的就职典礼。纽约在门户内,上海在门户外。"
"吉卜力工作室动画风格,在乌托邦城市的阳光下骑自行车,文字写着 - 欢迎来到未来"。
它无法完全复制个体风格,但我告诉它要匹配水彩 / 丙烯 / 手绘效果。我没有时间去调整和不断提示,所以这是它为透明度创建的所有 4 个图像。
(来自逗砂的吐槽:连吉卜力的风格都不可以吗?😂)
用它来画 UI 会怎么样。例如,'由苹果公司的产品设计师设计的食品配送应用程序的 iOS UI 的'探索'选项卡上的表现如何?"
没有取得很好的结果,但没有时间更好地引导它,所以这是我第三次尝试的结果。它主要给我提供了从上面拍摄的营销照片,似乎让它感到困惑,或者说有太多文本细节,以至于无法准确抓住事物。
这个我也很好奇,但是作者说自己要回去上班了,就没再回复这条。
"夜晚繁忙的城市旁边有一个大湖,建筑物上的红色霓虹灯拍在湖面上反射出来 - 标牌上的文字写着'建造',具有绘画感,插图风格,细节丰富"。
这里的问题是倒影中的文字是正的,虽然 Dalle3 可以正确的呈现文字,但是它好像分不清倒影。
总结
对于经典的风格表现的很好,但是对于稍微现代点跟个人关系大的就不行了,连吉卜力都没法呈现。
可以很好的呈现文字,但是对于倒影中的文字就不行了。
UI 呈现的不是设计稿,风格都是写实的,这点还不如 MJ,MJ 灵感工具还好用些。
很重要的准备呈现特定的数目的人物目前还不知道效果如何。
至于很好的呈现手和脸,这个不是早就解决了么?
最后插播一条广告,模型师忠忠10 月 15 日将会在深圳举办一个模型师大会,我也会参加,想去的可以点击这里了解
10 月 15 日炼丹大会深圳场第一波嘉宾揭秘:麦橘与逗砂两位重磅大咖即将登场分享
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。