Midjourney 的下一步:脱离 Discord,开放 Api,加入编辑功能
2023-03-28 20:52
AIGC研修社
2023-03-28 20:52
订阅此专栏
收藏此文章


今天早上推特上一个 midjourney 的重度用户发了一条这样的推特,总结了 MJ 接下来的几个发展方向,这个并不是 MJ 的官方发布的,但是这些信息在 MJ discord 上每周的公开会议里确实都有提及。

这些内容包括:

   Inpainting 也就是图片的修改编辑功能。

这个最是 Dalle2 最先推出,然后又成为了 SD 的基础功能。


   Outpainting ("zoom-out" feature) 就是图片扩展功能。

这个也是去年Dalle2 最先推出,然后又成为了 SD 的基础功能。


   Image to Text using /describe  图片到文本的识别

这个有很多第三方的工具去识别图像里的提示词,但是这个功能真的可行么?MJ 的私密功能其实就是为了让大家看不到提示词才设计的。反向获取目前没有哪个工具敢做,因为可能会危及到社区的一些创作者的权益。


   Higher Res Images (v6) 更高的分辨率,在 v6 算法

其实在此之前也有很多工具可以去拓展生成图片的分辨率,V6 的分辨率是通过这种方式去扩展,还是在生成的过程就提升了这个目前不可知。其实现在的分辨率如果不是用于印刷,其实基本是够用的。


   Text Support (write words in images, v7/v8) 支持在图片中写文字

这个要到v7/v8 算法才支持了,可能类似于 Adobe firefly 里的一个功能。如何能够很好的在画面中呈现文字,以及去掉不该出现的文字,一直是一个重要的需求点,这个在 Adobe firefly 可以看到,但是做的其实很一般,希望 MJ 的文字功能能够惊艳到大家,不过这个功能排在了 v7 和 v8 还是需要等挺长时间的。


   Mobile Experience 移动端的服务,可能有自己的 APP?

MJ 一直没出 APP,但是之前冒充 MJ 的 APP 倒是出过,官方这次终于打算自己做移动端了。但是也没有说明具体的时间点。


   Web UI (bye discord?) 告别 discord,把功能迁移到网站。

MJ 目前已经有 1000w 用户,这是一个非常可怕的数字。目前在 Discord 上的运营和生成已经有点不堪重负,MJ 经常间歇性崩溃,速度也越来越慢。脱离出 Discord 是必然的事情,只不过这个时间是什么时候还未可知。


   Real-Time Drawing 实时绘图

这个不是很懂具体指的是什么。


   APIs for tool building 发布 API 用于工具的构建。

这个开放 API 的传言已经感觉很久了,但是 MJ 并没有什么动静,也没有时间表。这个必然是大家最期待的一个功能。因为目前来说单纯从模型的效果,MJ 必然是最优秀的,模型网站 https://civitai.com/ 上有很多大家反向训练的 MJ 的模型,不过都是细分的风格,在效果上肯定是比不上原生的。如果 MJ 能够开放 API 那么必然会有很多第三方的应用和服务构建在 MJ 的模型上。


开源 VS 闭源:Midjourney 与 stable dfiffusion 的战争

MJ 现在仍然是最受欢迎的 AI 图像生成工具,但是我们从 google trends 可以看出 SD 的发布对 MJ 产生了很大的影响,而且单独的 SD 搜索已经说明不了问题了,因为现在的 SD 已经成为了一个生态。在这个开源生态上有着类似 controlnet 和 lora 模型, 这样优秀的功能和插件,这是 MJ 再好的模型都无法替代的。

现在 MJ 的社群里面也出现了对此不满的声音,比如下面这个:

我自从 V3 版本起就成为 MJ 的会员了。我每个月支付 40 美元,以便能够无限制地访问该服务,但访问受到严格限制。
我尝试在我的硬件上使用 Stable Diffusion 了 2 天,所提供的控制量是 MJ 遥不可及的,这让 MJ 提供的服务显得有些可笑。我对我所支付的价格感到不满,因为我认为运行这种技术需要更多的成本。我们为什么不能像 ControlNet、in/outpainting、动态提示等等一样拥有这些东西呢?我很想听听开发人员的意见,而不是管理员的意见。
你如何证明这是合理的?我不会离开这项服务。我认为它们都有优点和缺点。但我不再觉得我需要无限制地使用它。
其实这位同学的困扰我也有,我大概是从 2022 年的 5 月就开始使用 MJ 了,一直以来都觉得 MJ 才是最优秀的 AI 绘画生成工具。但是 controlnet 的出现让 MJ 变得不那么性感了。
我在思考为什么 MJ 不提供 SD 类似的功能?
MJ 是一家公司,而 SD 只是一个开源的程序,MJ 在法律上的限制会比 SD 要大很多,所以哪怕类似垫图这样的功能,它都故意让生成的图片与原图不那么吻合。这并不是技术上无法实现,这存在大量的法律上的风险。
但是,对于用户来说。MJ 如果只在泛专业人群上做工具,这些人很可能尝鲜后就不再续费了。而真正需要长时间使用这个工具的视觉创意类的从业者,目前 MJ 的可控性方面远远不能满足他们。这些人必然会转移到 SD 或者其他工具平台。
所以,未来的路 Midjourney 将会怎么走?我们拭目以待吧。

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

相关Wiki
AIGC研修社
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开