

作者|星奈
编辑|方奇
媒体|AI 大模型工场


应用落地加速
2023 年是大模型狂飙的一年,截至目前,国内已发布约 200 个大模型,超 20 个大模型获得审批。
近日,网易有道(“子曰”大模型)、蚂蚁集团(百灵大模型)、昆仑万维(“天工”大模型)、美团(模型)、知乎(“知海图 AI”模型)、月之暗面(moonshot)、金山办公(WPS AI)、好未来(MathGPT 大模型)等公司的 AI 大模型成为第二批获批产品,陆续面向全社会开放服务。
大模型在 C 端落地速度不断加快,当然,不容忽视的是,垂直领域应用正在成为大模型的主战场。
随着大模型技术逐步成熟,在医疗、金融、教育等领域,“行业大模型”开始涌现,围绕各行业不同需求,搭建大模型基础设施,“大模型 + 行业”正在成为行业增长新引擎。
IDC 预测未来大模型将带动新的产业和服务应用范式,垂直场景示范推广进入跑马圈地阶段,企业需加快建设人工智能统一底座,融合专家知识图谱,打造可面向跨行业服务的“元能力引擎”。
无论是阿里云推出的八大行业模型“全家桶”还是科大讯飞对 AI 助手的全力打造,无一不在显示大模型在垂直领域的落地应用和产业化进程正在加速推进。
大模型的价值在于应用。这些大模型结合行业特性和需求在多样化的实际应用场景中赋能智能经济与智能社会的发展。
大模型引发算力需求爆发
随着 AIGC 技术的突破与发展,信息社会进入了以大模型为主导的新阶段,自今年以来,国内大模型领域热潮不减,大模型公司纷纷组队入局、大模型技术重塑千行百业。大模型时代的到来带来算力需求的爆发式增长,与此同时,摩尔定律的失效和全球可持续发展目标下对绿色低碳的要求,我们不得不重新思考算力产业发展的思路。
随着大模型时代的深入发展,城市新型数字化基础设施的整体架构将演进为‘算粒’+‘电粒’双粒协同。“双粒”由世纪互联创始人陈升提出,其核心在于引入分布式概念,通过把分布于城市的异构、异属、异地的“算粒”聚合协同,与超大规模 IDC“微巨互联”,构建大模型时代的新算力基础设施,推动算力产业创新发展。“电粒”是将柔性直流网络引入到城市中,以数据中心、充电桩和换电站为负荷,同时以数据中心作为电粒单元对外提供低压直流电网服务。
依托大模型新时代的人工智能新算力、边缘节点“电粒”实现微巨互联,形成“双粒”联动的新型市政基础设施。“双粒”协同的城市新型基础设施建设目标旨在通过打造“算粒”+“电粒”两类承载节点的新型绿色智算数据中心,构建城市算力网络 + 中压直流环网的两张超互联网络,引入家庭 + 产业园区的两类第二连接,促进区域绿色智能发展。
商业化与生成式 AI 监管的矛盾
随着大模型不断向人类思维方式演进,其所带来的潜在风险也在不断增加。
大模型幻觉、深度伪造等安全问题逐渐凸显,这些技术一旦被错误地应用于金融、法律、医疗、社交媒体等领域,对社会和经济将产生不可估量的影响。
实际上,对人工智能的监管问题一直都没有解决,其中商业化和 AI 监管之间的矛盾是阻碍监管落地的重要因素。近日,OpenAI 首席科学家 Ilya Sutskever 罢免首席执行官 Altman 和公司总裁 Greg Brockman 的大戏在全球上演,这场闹剧的背后是激进的商业化战略与生成式人工智能监管不可调和的矛盾。
都说人类有两种智慧,即发明技术的智慧和把握技术发展方向的智慧。保持平衡,让 AI 造福人类。
今年 7 月,国家网信办等 7 部门近日发布《生成式人工智能服务管理暂行办法》,对生成式人工智能(AI)技术应用划定清晰边界,实行包容审慎和分类分级监管,确保科学监管和鼓励发展并行。
10 月政府相关部门又发布了《全球人工智能治理倡议》,呼吁抓住机遇,正视风险,公平开放,并在全球范围加强治理和合作。11 月初,世界各国等在伦敦签署了《布莱切利宣言》。
未来,大模型的发展既需要“仰望星空”也需要“脚踏实地”。

通义千问
10 月 31 日,阿里云召开 2023 年云栖大会,阿里云 CTO 周靖人在现场公布了云计算基础能力的最新进展,升级了人工智能平台,并发布千亿级参数规模的大模型通义千问 2.0,以及一站式模型应用开发平台阿里云百炼,阿里云已初步建成 AI 时代全栈的云计算体系。
目前,阿里云已开源通义千问 7B、14B 版本,下载量突破百万。通义千问 72B 模型即将开源,将成为中国参数最大的开源模型。
阿里云还大力支持第三方大模型发展。11 月 6 日,李开复博士带队创办的 AI2.0 公司零一万物正式开源发布首款预训练大模型 Yi-34B,模型开放商用申请,已在阿里云魔搭社区 ModelScope 首发。
魔搭社区现已聚集 2300 多款 AI 模型,吸引 280 万名 AI 开发者,AI 模型下载量突破 1 亿,成为中国规模最大、开发者最活跃的 AI 社区。
周靖人表示,面向智能时代,阿里云将通过从底层算力到 AI 平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵 AI 时代最开放的云。
科大讯飞
10 月 24 日,科大讯飞 1024 开发者节如约而至,讯飞星火认知大模型 V3.0 正式亮相,七大能力持续提升,整体超越 ChatGPT,医疗领域超越 GPT-4。星火 V3.0 升级启发式对话、AI 人设功能,打造更个性化的 AI 助手。
每个人都拥有 AI 助手的时代正在到来。这一次,讯飞星火面向行业进一步升级智能编程助手 iFlyCode2.0,面向科研人员推出星火科研助手;面向学生群体,推出 AI 心理伙伴,关爱青少年的心理健康,首次发布启发互动式英语 AI 答疑辅学并落地讯飞 AI 学习机中;面向每个家庭,发布讯飞星火医疗大模型,打造每个人的 AI 健康助手。
每个行业都有专属大模型的时代正在到来。讯飞联合行业龙头共同发布 12 个行业大模型,加速产业落地。
自主创新的大模型算力平台已经启动。讯飞联合昇腾生态共同发布“飞星一号”大模型算力平台,并启动对标 GPT-4 的更大参数规模的星火大模型训练。
科大讯飞董事长刘庆峰表示,2024 年上半年讯飞星火将对标 GPT-4。
文心一言
10 月 17 日,百度世界大会 2023,正式发布文心一言 4.0,李彦宏表示,这是迄今为止最强大的文心大模型,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着显著提升,综合能力“与 GPT-4 相比毫不逊色”。
据了解,自文心一言 3 月发布至今,文心大模型 4.0 训练算法效率提升 3.6 倍,周均训练有效率超过 98%,推理性能提升 50 倍。
同时,百度十余款 AI 原生应用也同步亮相。搜索、如流、地图、网盘、文库等 b 百度“全家桶”在大模型的加持下完成 AI 化。
公开数据显示,文心一言面向全社会开放一个多月,用户规模达到 4500 万,开发者 5.4 万,场景 4300 个,应用 825 个,插件超过 500 个。飞桨和文心生态愈加繁荣,已凝聚 800 万开发者,服务 22 万家企事业单位,基于飞桨创建了 80 万个模型。
腾讯混元
10 月 26 日,腾讯混元开放文生图功能。
腾讯官方称,目前已有超过 180 个业务接入腾讯混元大模型,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。来自零售、教育、金融、医疗、传媒、交通、政务等多个行业的客户,通过腾讯云调用腾讯混元 API,应用领域涉及智能问答、内容创作、数据分析、代码助手等多个场景。
据了解,今年 9 月首批通过备案后,腾讯混元大模型也已经面向 C 端用户陆续开放体验,用户通过小程序或网页端,就能与腾讯混元对话。
昆仑万维
10 月 30 日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B 系列,并配套开源 600GB、150B Tokens 的超大高质量开源中文数据集。
All in AGI 与 AIGC 是昆仑万维的战略。4 月 17 日,昆仑万维发布国产大语言模型——「天工 3.5」,并启动邀请测试。
5 月 19 日,北京市经济和信息化局公布第一批《北京市通用人工智能产业创新伙伴计划成员名单》。昆仑万维凭借在 AIGC 领域的前沿探索和投资布局,成为第一批模型伙伴和投资伙伴。8 月 23 日,昆仑万维发布国内第一款 AI 搜索产品——天工 AI 搜索。
天工 Skywork-13B 系列大模型的开源标志着昆仑万维持续投资 AGI 生态的决心。
百川智能
10 月底,百川智能发布 Baichuan2-192K 大模型,上下文窗口长度高达 192K,一次可输入 35 万字超越 Claude2,是目前全球最长的上下文窗口。
今年 9 月 25 日,百川智能已开放了 Baichuan 2-53B 的 API 接口,正式进军 To-B 领域,开启商业化进程。Baichuan2-53B 是百川智能发布的第 6 款大模型,自 4 月 10 日成立以来,百川以平均每 28 天推出一个大模型的惊人速度持续创新。
值得注意的是,10 月 17 日,百川智能宣布已完成 A1 轮战略融资,融资金额 3 亿美元,阿里、腾讯、小米等科技巨头及多家顶级投资机构均参投了本轮融资。
智谱 AI
10 月 27 日,智谱 AI 推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品。
据悉,新的 ChatGLM3 包括 ChatGLM3-1.5B(15 亿)、3B 和 6B 参数三种,在多模态理解、代码模块、网络搜索等能力上升级明显。同时,ChatGLM3 基于集成自研 AgentTuning 技术,在智能规划和执行上比 ChatGLM-2 提升 1000%。另外,ChatGLM3 相较于目前最佳的开源模型,实现推理速度提升了 2-3 倍,推理成本降低一倍,每千 tokens 仅 0.5 分,成本最低。
在全新升级的 ChatGLM3 赋能下,生成式 AI 助手智谱清言已成为国内首个具备代码交互能力的大模型产品(Code Interpreter),可支持图像处理、数学计算、数据分析等使用场景。
智谱 AI 脱胎于清华大学计算机系知识工程研究室团队,瞄准 AI 大模型研发落地。自 2019 年成立至今共完成四轮融资,今年 10 月官方宣布年内累计融资额超过 25 亿元人民币,截至目前,智谱 AI 公司估值已超过 100 亿元,是国内 AI 领域独角兽企业。
结语
1、本榜单欢迎其他机构参与大模型工场每月榜单评选支持单位,诚邀其他媒体提供更综合内容支持。
2、由于数据限制,本榜单 IT 桔子数据机构,天眼查对榜单也做出来贡献。
3、中国大模型 TOP10 将在年底评选,敬请期待,欢迎联系。微信:XXZ2100_

■ 科大讯飞星火 京东 ▍产业大模型案例
■ 商汤日日新、腾讯,昆仑万维 ▍ 金融大模型案例
■ 盘古大模型,中国电信,医联 ▍医疗大模型案例
■阅文大模型,腾讯音乐大模型 ▍ 文娱大模型案例
■知乎,360 大模型,火山引擎 ▍ 教育大模型案例
■ 网易,金山办公大模型 ▍ 更多行业大模型案例
上次介绍科大讯飞大模型链接


本文由大模型领域垂直媒体「AI 大模型工场」
原创出品,未经许可,请勿转载。
/
欢迎提供新的大模型商业化落地思路
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
