今天早上推特上一个 midjourney 的重度用户发了一条这样的推特,总结了 MJ 接下来的几个发展方向,这个并不是 MJ 的官方发布的,但是这些信息在 MJ discord 上每周的公开会议里确实都有提及。
这些内容包括:
Inpainting 也就是图片的修改编辑功能。
这个最是 Dalle2 最先推出,然后又成为了 SD 的基础功能。
Outpainting ("zoom-out" feature) 就是图片扩展功能。
这个也是去年Dalle2 最先推出,然后又成为了 SD 的基础功能。
Image to Text using /describe 图片到文本的识别
这个有很多第三方的工具去识别图像里的提示词,但是这个功能真的可行么?MJ 的私密功能其实就是为了让大家看不到提示词才设计的。反向获取目前没有哪个工具敢做,因为可能会危及到社区的一些创作者的权益。
Higher Res Images (v6) 更高的分辨率,在 v6 算法
其实在此之前也有很多工具可以去拓展生成图片的分辨率,V6 的分辨率是通过这种方式去扩展,还是在生成的过程就提升了这个目前不可知。其实现在的分辨率如果不是用于印刷,其实基本是够用的。
Text Support (write words in images, v7/v8) 支持在图片中写文字
这个要到v7/v8 算法才支持了,可能类似于 Adobe firefly 里的一个功能。如何能够很好的在画面中呈现文字,以及去掉不该出现的文字,一直是一个重要的需求点,这个在 Adobe firefly 可以看到,但是做的其实很一般,希望 MJ 的文字功能能够惊艳到大家,不过这个功能排在了 v7 和 v8 还是需要等挺长时间的。
Mobile Experience 移动端的服务,可能有自己的 APP?
MJ 一直没出 APP,但是之前冒充 MJ 的 APP 倒是出过,官方这次终于打算自己做移动端了。但是也没有说明具体的时间点。
Web UI (bye discord?) 告别 discord,把功能迁移到网站。
MJ 目前已经有 1000w 用户,这是一个非常可怕的数字。目前在 Discord 上的运营和生成已经有点不堪重负,MJ 经常间歇性崩溃,速度也越来越慢。脱离出 Discord 是必然的事情,只不过这个时间是什么时候还未可知。
Real-Time Drawing 实时绘图
这个不是很懂具体指的是什么。
APIs for tool building 发布 API 用于工具的构建。
这个开放 API 的传言已经感觉很久了,但是 MJ 并没有什么动静,也没有时间表。这个必然是大家最期待的一个功能。因为目前来说单纯从模型的效果,MJ 必然是最优秀的,模型网站 https://civitai.com/ 上有很多大家反向训练的 MJ 的模型,不过都是细分的风格,在效果上肯定是比不上原生的。如果 MJ 能够开放 API 那么必然会有很多第三方的应用和服务构建在 MJ 的模型上。
开源 VS 闭源:Midjourney 与 stable dfiffusion 的战争
MJ 现在仍然是最受欢迎的 AI 图像生成工具,但是我们从 google trends 可以看出 SD 的发布对 MJ 产生了很大的影响,而且单独的 SD 搜索已经说明不了问题了,因为现在的 SD 已经成为了一个生态。在这个开源生态上有着类似 controlnet 和 lora 模型, 这样优秀的功能和插件,这是 MJ 再好的模型都无法替代的。
现在 MJ 的社群里面也出现了对此不满的声音,比如下面这个:
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。