腾讯混元,大模型的下一个巨星?
2023-09-1415:04
NFT 营销工场
2023-09-14 15:04
NFT 营销工场
2023-09-14 15:04
收藏文章
订阅专栏




作者|星奈

编辑|方奇

媒体|AI 大模型工场



腾讯混元大模型虽迟但到。


在 2023 腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。


最近,以文心一言、百川智能为代表的大模型,已经面向社会开放,一周后,腾讯混元才姗姗来迟,正式公开内测。不同于其他大模型厂商,腾讯在大模型探索中有着自己的初心和坚持。


“不着急”是腾讯做大模型带给我们最直接的感受。马化腾曾明确表态:“腾讯不急于做半成品”。


“不着急”背后是腾讯在落地实践上的坚持,此次混元的亮相,让我们看到了大模型落地各行业的更多可能性。


AI 大模型工场了解到,微信已经上线“腾讯混元助手”小程序,支持 AI 问答 / 绘画,图标类似太极阴阳图案 AI,目前需要注册手机号排队等待内测。





全链路技术自研,从零到两万亿



腾讯集团副总裁蒋杰介绍,腾讯混元大模型从第一个 token 开始从零训练,掌握了从模型算法到机器学习框架,再到 AI 基础设施的全链路自研技术。


目前腾讯混元的参数规模超千亿,预训练语料超 2 万亿 tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。


蒋杰自信地表示:“正因为我们掌握了全链条技术,所以有信心在未来不断升级这一技术体系,以应对外部环境的各种变化。”


在大模型赛道上,国内外参赛选手并不在少数,但拥有全链路自研能力的大模型厂商屈指可数。


在全球范围内,除了谷歌、微软、亚马逊、阿百度、腾讯、华为等具有强大软硬件支撑的厂商,其他大模型厂商很难做到全链路自研。


腾讯混元全链路自研,无疑给大模型赛场扔下了一枚重磅炸弹。



据悉,混元大模型参数量超千亿,具备多轮对话能力,内容创作能力,逻辑推理能力,搜索增强和知识图谱。训练数据更新至今年 7 月份,未来会不断更新迭代。


从 2021 年开始,腾讯先后推出千亿和万亿参数的 NLP 稀疏大模型,打破 CLUE 三大榜单记录,实现在中文理解能力上的新突破。


目前,业界大模型在场景中的应用依然有限,主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行了一系列自研创新,提高了模型可靠性和成熟度。


针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了 30% 至 50%;通过强化学习的方法,让模型学会识别陷阱问题;通过位置编码优化,提高了超长文的处理效果和性能;提出思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。


此外,腾讯还自研了机器学习框架 Angel,使训练速度相比业界主流框架提升 1 倍,推理速度比业界主流框架提升 1.3 倍。


得益于全链路自研技术,腾讯混元大模型能够理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话。除此之外,它还能进行文学创作、文本摘要、角色扮演等内容创作,做到充分理解用户意图,并高效、准确的给出有时效性的答复。


上海财经大学校长刘元春认为:“借助于全链路自研,中国将不断积累大模型相关人才和技术,逐渐形成体系化的产业链、人才链、技术链和创新链,最终走出一条发展通用人工智能的中国路径,助力我们在数字技术的创新上取得突破性进展。”




腾讯混元大模型,更看重“实用性”



蒋杰表示:“我们研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中。”


“实用性”贯穿腾讯探索大模型的始终。


官方将混元大模型定义为:“从实践中来,到实践中去”的实用级大模型。


目前混元已接入超过 50 个腾讯业务和产品测试,并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ 浏览器等业务和产品,混元大模型正逐步成为腾讯公司的业务智能底座。


大会上,蒋杰展示了腾讯会议、腾讯文档、腾讯广告等多个业务,在接入腾讯混元大模型后的实际应用情况。



比如腾讯会议基于混元大模型打造了 AI 小助手,只需要简单的自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要。据实测,在指令理解、会中问答、会议摘要、会议待办项等多个方面,混元大模型均获得较高的用户采纳率。


 

此外,腾讯混元在产业场景的应用不断落地。


腾讯推出了“腾讯云 MaaS 服务”,在腾讯云行业大模型精选商店中,提供混元大模型,同时上架 20 多种行业最新、最流行的开源通用大模型,以及覆盖金融、文旅、零售、政务、医疗、教育等 20 多个领域的行业大模型。



腾讯将大模型与腾讯的行业解决方案、企业级应用结合,在生产、营销、售后服务、办公等多个环节,实现能力提升,达至降本增效。


在智能生产方面,以创新方式破解场景痛点。例如,在能源领域,腾讯通过训练电力视觉大模型,一个模型可以有效适应不同电网场景,具有高检出率、低误检率、支持少样本训练、泛化能力强的优势,助力电网生产经营和减负增效。


在智能营销方面,提升服务效率。在营销中,新一代的腾讯企点智能客服,基于行业模型,结合客户业务需求进行训练与精调,可以提供更精准、更详细的回答,复杂问题的解决率,比之前提升了 30%。同时,销售人员用自然语言提问,就可以实现准确的商业分析,几秒钟可以获取一份 PPT,不再需要花费大量的时间,学习复杂的软件、制作看板。


最近,腾讯云也全面接入 Llama 2、Bloom 等 20 多个主流模型,和混元一样,都支持直接部署调用。客户可以根据实际需求,基于混元、也可以基于开源模型,打造自己专属的行业大模型。


腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生表示:“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点带来了全新的思路。大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值。”


在大模型狂飙的近 300 天里,各大企业各展神通,腾讯混元姗姗来迟,能否成为国产大模型的新巨星,我们拭目以待。



AIGC 大模型工场已经组织了非常精准的「AI 大模型垂直社群」,覆盖超 1000 位 AIGC 圈,百度大模型业务负责人,京东大模型业务负责人,腾讯大模型业务人,阿里云大模型技术负责人,科大讯飞大模型公关,商汤大模型业务,阅文大模型公关,360 大模型公关负责人都在群里啦,欢迎大模型业务负责人加入。请加微信 fqq2000nian,注明真实身份。


数据支持天眼查,大模型独家合作账号

— END —

监制 / 刘老师
编辑 / AIGCCCCC
视觉 / 大模型
微博 / @AI 大模型工场
TG/AI  Marketing Field

  


大模型应用创业者,你怎么看

■ 百度文心一言,阿里通义千问   ▍通用大模型案例

                 ■ 科大讯飞星火 京东  ▍产业大模型案例

■ 商汤日日新、腾讯,昆仑万维   ▍ 金融大模型案例

■ 盘古大模型,中国电信,医联 ▍医疗大模型案例

■阅文大模型,腾讯音乐大模型 ▍ 文娱大模型案例

■知乎,360 大模型,火山引擎 ▍ 教育大模型案例

■  网易,金山办公大模型   ▍    更多行业大模型案例



上次介绍科大讯飞大模型链接





本文由大模型领域垂直媒体「AI 大模型工场」

原创出品,未经许可,请勿转载。 

/

欢迎提供新的大模型商业化落地思路

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

专栏文章
查看更多
数据请求中

推荐专栏

数据请求中

一起「遇见」未来

DOWNLOAD FORESIGHT NEWS APP

Download QR Code