Midjourney 的下一步：脱离 Discord，开放 Api，加入编辑功能

2023-03-2820:52

AIGC研修社

2023-03-28 20:52

AIGC研修社

2023-03-28 20:52

收藏文章

订阅专栏

今天早上推特上一个 midjourney 的重度用户发了一条这样的推特，总结了 MJ 接下来的几个发展方向，这个并不是 MJ 的官方发布的，但是这些信息在 MJ discord 上每周的公开会议里确实都有提及。

这些内容包括：

Inpainting 也就是图片的修改编辑功能。

这个最是 Dalle2 最先推出，然后又成为了 SD 的基础功能。

Outpainting ("zoom-out" feature) 就是图片扩展功能。

这个也是去年Dalle2 最先推出，然后又成为了 SD 的基础功能。

Image to Text using /describe 图片到文本的识别

这个有很多第三方的工具去识别图像里的提示词，但是这个功能真的可行么？MJ 的私密功能其实就是为了让大家看不到提示词才设计的。反向获取目前没有哪个工具敢做，因为可能会危及到社区的一些创作者的权益。

Higher Res Images (v6) 更高的分辨率，在 v6 算法

其实在此之前也有很多工具可以去拓展生成图片的分辨率，V6 的分辨率是通过这种方式去扩展，还是在生成的过程就提升了这个目前不可知。其实现在的分辨率如果不是用于印刷，其实基本是够用的。

Text Support (write words in images, v7/v8) 支持在图片中写文字

这个要到v7/v8 算法才支持了，可能类似于 Adobe firefly 里的一个功能。如何能够很好的在画面中呈现文字，以及去掉不该出现的文字，一直是一个重要的需求点，这个在 Adobe firefly 可以看到，但是做的其实很一般，希望 MJ 的文字功能能够惊艳到大家，不过这个功能排在了 v7 和 v8 还是需要等挺长时间的。

Mobile Experience 移动端的服务，可能有自己的 APP？

MJ 一直没出 APP，但是之前冒充 MJ 的 APP 倒是出过，官方这次终于打算自己做移动端了。但是也没有说明具体的时间点。

Web UI (bye discord?) 告别 discord，把功能迁移到网站。

MJ 目前已经有 1000w 用户，这是一个非常可怕的数字。目前在 Discord 上的运营和生成已经有点不堪重负，MJ 经常间歇性崩溃，速度也越来越慢。脱离出 Discord 是必然的事情，只不过这个时间是什么时候还未可知。

Real-Time Drawing 实时绘图

这个不是很懂具体指的是什么。

APIs for tool building 发布 API 用于工具的构建。

这个开放 API 的传言已经感觉很久了，但是 MJ 并没有什么动静，也没有时间表。这个必然是大家最期待的一个功能。因为目前来说单纯从模型的效果，MJ 必然是最优秀的，模型网站 https://civitai.com/ 上有很多大家反向训练的 MJ 的模型，不过都是细分的风格，在效果上肯定是比不上原生的。如果 MJ 能够开放 API 那么必然会有很多第三方的应用和服务构建在 MJ 的模型上。

开源 VS 闭源：Midjourney 与 stable dfiffusion 的战争

MJ 现在仍然是最受欢迎的 AI 图像生成工具，但是我们从 google trends 可以看出 SD 的发布对 MJ 产生了很大的影响，而且单独的 SD 搜索已经说明不了问题了，因为现在的 SD 已经成为了一个生态。在这个开源生态上有着类似 controlnet 和 lora 模型，这样优秀的功能和插件，这是 MJ 再好的模型都无法替代的。

现在 MJ 的社群里面也出现了对此不满的声音，比如下面这个：

我自从 V3 版本起就成为 MJ 的会员了。我每个月支付 40 美元，以便能够无限制地访问该服务，但访问受到严格限制。

我尝试在我的硬件上使用 Stable Diffusion 了 2 天，所提供的控制量是 MJ 遥不可及的，这让 MJ 提供的服务显得有些可笑。我对我所支付的价格感到不满，因为我认为运行这种技术需要更多的成本。我们为什么不能像 ControlNet、in/outpainting、动态提示等等一样拥有这些东西呢？我很想听听开发人员的意见，而不是管理员的意见。

你如何证明这是合理的？我不会离开这项服务。我认为它们都有优点和缺点。但我不再觉得我需要无限制地使用它。

其实这位同学的困扰我也有，我大概是从 2022 年的 5 月就开始使用 MJ 了，一直以来都觉得 MJ 才是最优秀的 AI 绘画生成工具。但是 controlnet 的出现让 MJ 变得不那么性感了。

我在思考为什么 MJ 不提供 SD 类似的功能？

MJ 是一家公司，而 SD 只是一个开源的程序，MJ 在法律上的限制会比 SD 要大很多，所以哪怕类似垫图这样的功能，它都故意让生成的图片与原图不那么吻合。这并不是技术上无法实现，这存在大量的法律上的风险。

但是，对于用户来说。MJ 如果只在泛专业人群上做工具，这些人很可能尝鲜后就不再续费了。而真正需要长时间使用这个工具的视觉创意类的从业者，目前 MJ 的可控性方面远远不能满足他们。这些人必然会转移到 SD 或者其他工具平台。

所以，未来的路 Midjourney 将会怎么走？我们拭目以待吧。

【免责声明】市场有风险，投资需谨慎。本文不构成投资建议，用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。