​当大模型,开始“平民化”
AGI创新实验室
2023-09-26 17:53
订阅此专栏
收藏此文章
作者 | 金旺
出品 | 锌产业
年初大模型刚刚热闹起来,和智能家居领域一些朋友聊天时,当时大家聊得最多的是——大模型要如何在智能家居行业落地。
中国企业一个很重要的特性就是「务实」。
或许很多技术并不是由国内企业或研究机构最先研究出门道的,但要说产业化速度,国内企业毫不逊色。
那么,大模型究竟要怎么用到智能家居领域呢?
大家讨论来讨论去,最后发现,大(语言)模型在智能家居、乃至整个 C 端的应用,最契合的还是与智能语音交互结合。
毕竟,大模型(LLM)仍是自然语言处理(NLP)技术的一种。
而 NLP 是智能语音交互三大核心技术(ASR、NLP、TTL)中最重要的一环,也是决定语音交互智能与否最重要的那项技术。
大模型在 C 端的“平民化”应用,从强语音交互产品开始。 
这其中,亟需新技术补充弹药的小度、天猫(精灵)们,终于等到了一波新机会。

      01       

智能音箱的盛世与衰落

论及消费级强语音交互产品,最为人熟知的,就是智能音箱。
无论是国外的苹果、谷歌、亚马逊,还是国内的百度、阿里、华为、小米,都曾将智能音箱作为一个核心产品来大手笔投入。
亚马逊自不必说,作为智能音箱全球热潮的始作俑者,亚马逊研发语音交互技术的团队在 2017 年超 5000 人,在 2018 年更是达到了万人规模。
也正是由于亚马逊这样大手笔的投入,截至 2019 年 1 月,Alexa 已经有超过 70000 项技能,搭载亚马逊 Alexa 的智能硬件已经超过 1 亿台
这样的规模,引得不怎么涉足硬件领域的谷歌,也基于 Google Asistant 推出了智能音箱。
当时还没退休的亚马逊创始人贝索斯甚至多次指出,要将 Alexa 打造成亚马逊继电商、Prime、AWS 后的第四大支柱产业
国内智能语音技术热潮更疯狂,尤其是在智能音箱领域。早在 2017 年国内智能音箱市场混战时,曾一度涌现出上百家智能音箱厂商,也造就了中国智能音箱“百箱大战”的惨烈局面。
在智能音箱市场即将触顶的 2019 年,全球智能音箱销量达到了1.47 亿,其中中国智能音箱市场出货量5200 万台
中国市场占去了全球三分之一的智能音箱出货量。
从 Strategy Analytics 的 2019 年 Q4 全球统计数据来看,全球 3、4、5 位分别为阿里、百度、小米,仅排在亚马逊、谷歌之后,而上榜前六的厂商,均为全球科技巨头。
然而,智能语音技术并没有想象得那么好做。
一边是消费者既享受着价格战带来的平民级 AI 产品,又因智能音箱不智能而苦不堪言
另一边是科技巨头既要大手笔投入推动技术研发,又要兼顾安全风险
亚马逊就曾因在全球雇佣数千人团队为 Alexa 做数据标注,引发了 2019 年全社会关注的智能音箱“监听”事件。
智能音箱生意在走过第一个疯涨的五年后,最终开始转头向下,销量一路下滑。
就最近两年来看,即便当初一年要办多场智能音箱新品发布会的百度和阿里,现在也很少会花精力单独为某款智能音箱出世举办大型发布会。
一则是头部效应已经成形,二则是智能音箱已经盛世不再
行业从业者能够明显感受到的是,智能音箱赛道已经不再性感、不再有趣。
直到大模型的出现。

02

旧瓶装新酒

2022 年年底,ChatGPT 问世,两个月破亿活跃用户,刷新了最快用户增长纪录,也引起了全球的关注。
红杉沈南鹏是在 ChatGPT 发布前见到位于硅谷的 OpenAI 团队,之后便开始在 AI 领域下重注。
在 ChatGPT 发布前三个月,红杉已经在官网上发布了名为《Generative AI: A Creative New World》的文章,文章中预言,生成式 AI 将在未来进入到每个人的工作、娱乐、生活中
在 ChatGPT 正式问世后,也就是 2023 年年初的两个月里,无论是国内媒体,还是 AI 领域的投资人、从业者,都开始高度关注着大洋彼岸这款产品的问世、成长。
越来越多投资圈、科技圈大佬亲自跑到硅谷,只为亲身感受这波 AI 浪潮,探究背后究竟有无逆天机遇。 
出门问问创始人李志飞,也是在 2023 年年初亲身到硅谷考察后,决心要做大模型。
在上一个智能语音技术狂潮的智能音箱百箱大战中,出门问问也曾做过智能音箱,而且是其中明星创业团队之一。
只不过后来在巨头价格战的挤压下,出门问问和其他大多数创业团队一样,在国内将这块业务早早转向了 B 端市场。
之后,李志飞和他的出门问问,依然一直留在智能语音技术这片热土上。

大模型的出现,让李志飞们嗅到了机会,只是,2023 年的大模型还存在一个公认的缺陷——「编瞎话」。
这一特性决定了大模型最先商业化落地的场景,会有这样两个特性:
第一,对自然语言处理技术有强需求
第二,场景容错率要高
这其实也是过去这些年人工智能技术商业化落地普遍存在的两个需求。
语音助手在智能手机没有得到广泛应用,却催生了智能音箱这一「新物种」,正是因为后者对自然语音处理技术有较强的需求; 
产业性需求更高的 AI 质检,即便已有落地应用,仍需要有人工做二次复判,而娱乐性更强的下棋机器人却更容易直接落地,正是因为后者的场景容错率更高。

再看如今的大模型赛道。
虽然行业大模型潜力巨大,也通过具身智能带火了人形机器人,然而,一位机器人领域资深从业者告诉锌产业,将大模型与机器人技术结合,现在仍处于探索阶段。
在解决大模型边界问题(什么时候开始编瞎话)之前,没人敢将搭载大模型的机器人批量应用到工厂核心业务中。
因而,当 ChatGPT 问世后,最先用到大模型的,同样是是兼具上述两个特性的搜索引擎。
微软不惜 130 亿美元投资 OpenAI,盘活了微软 Bing 搜索引擎,也让搜索引擎市场有了新的变数。 
与此同时,智能音箱,成了具备上述两个特性,也极度渴望新变数的另一类消费产品。

 03 

登船 AIGC

2023 年,经历了三年销量下行后的智能音箱市场,重新燃起了生机。
2023 年 2 月 9 日,距离百度大模型——文心一言正式发布还要 35 天,然而,小度已经等不及文心一言发布,在这一天正式官宣将融合文心一言能力打造面向智能设备场景的大模型——小度灵机。
彼时,小度官方称,小度灵机将会应用到小度全系产品中
之后我们看到,小度陆续对外公布了「小度灵机」的测试结果,并率先应用到了 5 月发布的小度手机上,成了小度首款面向教育领域的智能手机最大的亮点。 

今年 7 月在接受媒体采访时,小度科技 CEO 景鲲再次强调,“我们会将大模型的能力逐步应用到小度更多产品上,并会针对使用场景不断调优。 ”
不过,景鲲也指出,“它短期内不会有太大改变,3 个月、6 个月后,可能还是原来那些服务。
阿里的语音交互系统接入大模型,同样是在阿里大模型发布之前。
2023 年 4 月 11 日,在这一年的阿里云峰会上,阿里正式对外发布大模型通义千问,当时还是阿里 CEO 的张勇称,未来阿里旗下所有产品将接入通义千问。
实际上,在阿里通义千问大模型发布之前,网上就已经出现了接入大模型的天猫精灵的内测视频,官方当时确认了这一消息,并称这背后的是“个性化大模型。”
阿里大模型在天猫精灵智能音箱上对外的内测招募是在通义千问大模型发布之后,与此同时,天猫精灵在今年 4 月对外发布了首款搭载大模型的消费级产品——智能眼镜
相较于百度、阿里,小米大模型正式对外亮相要更晚一些。
2023 年 8 月 14 日,在今年雷军年度演讲上,雷军对外公布了小米大模型研发近况,并宣布小爱同学正式接入小米 AI 大模型
随后,接入大模型的小爱同学正式开启邀请,当时邀测的主要是多个型号的智能手机,以及小米 Sound 智能音箱。 
至此,国内音箱三巨头再次齐上阵,一并跨入了 AIGC 新战场

       04       

当大模型,开始“平民化”

2023 年,“百模大战”溢于纸面。
在经历了第一波通用大模型之战后,如今更多团队寻找实际场景进行大模型的应用落地。 
鲜为人知的是,大模型并不是什么新鲜事物,阿里通义、百度文心、华为盘古等现在市面上知名度较高的这些大模型,早几年就已经在各公司内部立项推进,甚至尝试进入应用场景。
例如,华为盘古大模型早在 2021 年就与中科院上海药物研究所合作训练出了盘古药物分子大模型,并用在了药物研发上。
ChatGPT 更多是让大模型从幕后走到台前,并成为人工智能几条技术路线中出奇制胜的一条路线。 
在进入实际应用侧时,大模型又一分为二,有了面向商业领域(To B)的行业大模型,以及面向消费市场(To C)的大模型和 AIGC。
就在上周,天猫精灵换上了一个新的主品牌——未来精灵,这一品牌的掌舵人彭超用一场线上发布会宣告了天猫精灵全面驶入 AIGC 新时期。
迅速卷入这一战场的不只有天猫精灵,甚至不只有 BAT 在内的几家大厂,国内学术圈、产业圈众多大佬都已经跑步入场。
只不过,如今已经拥有亿级市场保有量的智能音箱,必将又一次成为大模型的绝佳试验场。
而在智能音箱上的普及应用,也将是大模型这一人工智能技术再一次直面数亿挑剔的民众。
更值得关注的或许是:
在经历过亚马逊“监听”事件全球热议后,这一次,大佬们能多留些精力兼顾隐私安全问题。

更多科技产业技术、故事、趋势,欢迎关注我们👇

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

AGI创新实验室
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开