2 月 16 日那天深夜我恰巧还没入睡,第一时间经历了 Open AI 突然放个大招,以及围观了 Sam 在社交媒体上与粉丝互动,使用 Sora 即时生成视频,和一众围观群众颅内高潮,High 到早上才睡着。
这几天被各种 Sora 相关的自媒体内容狂轰乱炸,大量碎片化的、噱头唬人的、以及缺乏深度思考的各种观点泛滥。老实说,目前看到 Sora 相关的自媒体信息都有些应激性疲乏,基本不会点击打开任何介绍 Sora 的媒体文章。
但不管如何,目前尚未看到严谨、深度、硬核的分析文章,需要出现一篇至少达到张俊林老师的《通向 AGI 之路:大型语言模型(LLM)技术精要》这篇文章的质量水平,以及微软研究院出品的,类似《Sparks of Artificial General Intelligence: Early experiments with GPT-4》这篇论文水准的研究报告。
除此之外,应该围绕 OpenAI 发布的 Sora 技术报告《Video generation models as world simulators》为第一研究资料,以及所引用的 32 篇相关论文,并由此展开。至于 Meta 首席 AI 科学家,Yann LeCun 在 X 上对 Sora 的各种抨击言论,在其没有发表 Sora 的深度报告之前,也不必放在心上,没有必要被国内的信息二道贩子,搬运过来制造焦虑获取流量,因为99% 的媒体信息都是噪音。
因此,在全球科研界尚未弄清楚 Sora 的完整技术原理,以及将其复现成功的窗口期,我梳理了 Sora 背后引用的 32 篇论文,从思维导图到 32 篇论文每一页的全局展开,当前该版本有助于对诸技术路线形成全局基本认识,避免当前普遍存在的碎片化交流与泛泛而谈。
眼下对于任何人,这一模型都值得进一步深度研究,因此构建一个深度研究的基础空间,方便各位读者Do Your Own Research,有助于各位读者在颠覆性模型的诞生初期,构建一个硬核干货的研究基础,与各类泛泛而谈的兴趣爱好者拉开距离,避免被不具备深度思考能力的平庸之辈拉低认知,导致你错过当前的最优深度学习窗口期;
https://boardmix.cn/app/share/CAE.CMuUng0gASoQYAg7FqOjIkUItryBrwOqqzAGQAE/GJhP9X
点击链接加入 boardmix 中的文件「Sora 深度研究空间 -1.0 版本」,当前版本将会随着研究内容的展开而逐步按版本迭代;
模块 1:展示 32 篇引用论文,包括论文链接
模块 2:将 32 篇论文进行平铺展示,预览全局主题
模块 3:将 32 篇论文中的每一页展开,构成论文内容全局展开,可以通过缩放快速预览论文的详情内容
one more thing......
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。