今天中午 MJ 终于发布了它训练了 9 个月的第六代文生图模型 V6,这段时间里 SD 都开始卷 AI 视频了,但是 MJ 却慢吞吞的不知道在干嘛。这段时间里 dalle3 给了惊人的自然语言式文生图,完全摒弃了提示词那套。SD 在开源和可控性上遥遥领先切入了文生图的商业化落地领域。那么一直号称秉持 “中道” 的 MJ 在这半年里没有太多的动作。
这次的 V6 可以给大家带来些什么呢?
官方通告
V6 提示词入门模板
这是一个探索 V6 的入门模板,适用于多个主题。
如果你愿意,你可以将 V6 视为有四个可选部分。这完全取决于你的提示内容以及对你作为艺术家来说什么是有意义的。
[典型场景] [回调细节] [设置细节] [氛围或美学]
[典型场景]
在合适的情况下,使用第一句话中的原型概念来概括地设置场景。这里有一个对具体性的恰当平衡点。句子不必很长。你稍后会添加细节。
✅ 好的:三个朋友坐在公园的长椅上。
✅ 更好的:三个不同的朋友坐在公园的长椅上。
( 没有用“不同的
”,Midjourney 会决定他们的一般外观,他们可能看起来相似。)
✅ 最佳,具体化:三个不同的最好的朋友紧挨着坐在公园的长椅上。
( 没有“最好的朋友
”和“紧挨着坐
”,我们得到的是更通用的氛围。)
[回调细节]
在适合的提示中,使用对场景设置中使用的同一词语的回调来添加细节。这意味着字面上重复这些词语,以在你在第一句中设置的内容和你现在正在写的细节之间创建联系。
❌ 不太好,没有使用回调:詹妮弗在中间,一个穿着牛仔裤和背心的金发白人女性。
❌ 不太好,没有使用简单句子:中间,穿着牛仔裤和绿色背心的是那位白人朋友。
✅ 更好,它使用了简单句子和对“朋友”的回调:中间的朋友是一个快乐的金发白人女性,穿着牛仔裤和绿色背心。
[场景 / 背景 / 背景 / 环境的细节]
在合适的情况下,添加有关设置或背景的细节,放在提示的末尾。
❌ 不太好,对于 V6 来说有点模糊,可能有效:有活橡树和鸽子。
✅ 更好,更清晰一些:人行道上有一些鸽子。背景中有一些活橡树。
✅ 最佳,具体化:长椅前的人行道上有两只鸽子。在背景中,空荡荡的公园里有一些古老的活橡树。
如果你开始看到事物变得不连贯,准备好将具体内容回退或从提示中删除。..
[氛围或美学]
在提示的最后添加有关图像氛围 / 美学的细节。它可以随你喜欢的长度。请注意,没有太多视觉语义内容的词在画布上不会有任何作用。
❌ 不太好:照片。
✅ 更好:彩色摄影。
✅ 最佳,具体指出灵感来源,如摄影师的名字或出版物:受《南方生活》杂志启发的彩色摄影。
❌ 不太好:艺术。
✅ 更好:数字艺术。
✅ 最佳,使用形容词并具体指出灵感来源,如艺术家或艺术类型 / 流派 / 体裁 / 媒介:受 Krenz Cushart 和 Tom Bagshaw 启发的时尚数字艺术。
⭐ 示例结果
如果对你来说探索它是有意义的,这里有一个使用模板的示例结果。由于 V6 对自然语言非常聪明,没有强制性的指导原则,但在编写复杂的提示时,有些人可能会喜欢将模板作为他们自己的发现和探索的起点。
三个不同的最好的朋友紧挨着坐在公园的长椅上。中间的朋友是一个快乐的金发白人女性,穿着牛仔裤和绿色背心。右边的朋友是一个严肃的非洲裔美国男性,穿着燕尾服。左边的朋友是一个笑着的印度女性,穿着橙色的印度传统服饰。由 Krenz Cushart 和 Tom Bagshaw 创作的时尚数字艺术。--v 6.0
V6 是 Midjourney 提示的一场革命
V6 运行在语义和自然语言上,每个/imagine
与之前版本相比都有巨大的内存容量,这意味着提示可以长且详细。你可以控制构图,设置多个主题,并添加文本。
要激活 V6,请输入/settings
并从版本下拉菜单中选择它。
1️⃣ 现在提示长度可达 350+ 词。
画布上的连贯性与提示使用可用内存的方式有关。在 V5 中,只有前 15-20 个词对画布有强烈的影响,在我们用尽内存并看到词语影响下降之前。
在 V6 中,我们获得了大量额外的内存,所以可以说我们有 350 到 500 个词,甚至更多。提示如何使用可用内存似乎与词语的语义内容有关。
例如,这个 15 个词的短语 - "the the the the the an an an an an this this this this this
" - 没有特定的语义内容,看起来使用了我们可用内存的很小一部分。但同样的 15 个词用来生动描述三个牛仔意味着,鉴于我们剩余的内存,渲染第四个牛仔将是一个挑战。
所以,V6 并没有一个固定的提示长度,而是有一个“语义上限”,这将对每个提示有不同的影响。让我们探索一下!
在 V5 中,我们倾向于使用原型。我们让 Midjourney 选择它想要呈现图像的方式,因为它自己的决定会更连贯,而我们试图控制的尝试会被忽略。
在 V6 中,我们仍然给 Midjourney 一个原型,但现在我们努力用自然语言表达的细节来控制 Midjourney 的渲染。
3️⃣ 你可以使用语言来控制构图,在画布上放置想要的东西。
在 V5 中,介词短语通常不被理解。在 V6 中,它们几乎总是被理解。这令人震惊。现在我们有了可靠的介词短语,很容易将事物相互定位以及与摄像机的关系。
我们如何控制构图?这里有一个起点:更可靠的方法是用短语描述一个通用图像,然后从画布的焦点开始填充细节。在确定了焦点之后,围绕它填充细节。
厨房桌子上有三个装满水果的篮子。
中间的
篮子里装着绿苹果。
左边的
篮子装满了草莓。
右边的
篮子里满是蓝莓。
背景是
一面空的蓝绿色墙,上面有一个圆形窗户。
这真是太酷了。要在你的图像中添加文字,把你想要打印的词放在“引号”里,并确保你的提示包含一个语义上合理的地方来打印这些文字。
使用像这样的短语:说,印在...上,标题为,铭刻着,标记为,标记着,品牌着,压花着,雕刻着,盖章着,装饰着,用脚本书写着,用字母书写着等。
你也可以在事物上印刷文字,如:演讲气泡,便利贴,书籍封面,海报,标志,T 恤,杯子,广告牌,报纸,杂志,贺卡,信封,车牌,日历,票据,产品包装,名片等。
要让文字或字母单独出现,有时添加“typography design”(字体设计)短语到提示中会有帮助。如果你想要画布其他地方为空白,可以探索使用“isolated on a white background”(孤立在白色背景上)这样的短语。
用马克笔在便利贴上写的“Hello World!”
/imagine
,并将容易混合的图像移动到提示的末尾。在 V6 alpha中,如果你的提示相当复杂,你可能会注意到细节模糊或不连贯。
以下是探索解决连贯性问题或缺乏清晰度问题的三种策略。在对连贯性感到绝望之前,检查你的网格是否有成功的结果。记住,如果网格中有 1 或 2 张可用的图片,意味着你有一个好的提示!
最可靠的方法,去掉细节。 连贯性问题有时与提示用完内存有关。因此,检查提示并重写它,去掉不必要的细节。
有时,添加关键细节。 有时添加具体性有助于提高连贯性。给不协调的手和胳膊一些事情做,比如手放在臀部上,或手拿着咖啡杯。给不协调的脸一个情绪,比如笑或看起来平静。同时做 A 和 B 更强。
如果你有足够的 GPU 分钟数,追求连贯性。 找到网格中最连贯的图像,多次放大它,直到你找到一个具有你想要的连贯性的图像。同时做 A + B + C 是最强的方法。
两只鸽子
”不起作用,试试“一对鸽子
”。这对每个提示的效果都不同。你不能告诉 Midjourney“<URL> 但把它变成油画”或使用 remix 并告诉 Midjourney“但在她的头发上放更多的花”。但是一个单独的直接 /imagine 可以像指令一样编写,它可能会运行得很好。
点击这些将其展开到全尺寸。只要你的长宽比协调一致,你就可以将简单场景组织成面板。
剪贴画中的一个灯,放在空白背景上。图像周围有一个薄金色的边框或框架。
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。