谷歌将推出接管电脑的人工智能技术

2024-10-28 11:43

SinoDAO

2024-10-28 11:43

来源链接

订阅此专栏

收藏此文章

谷歌研发的“贾维斯”能直接接管浏览器，替你搞定所有网络任务，而它的对手竟是 ChatGPT。

据三位直接知情人士透露，谷歌（Google）正在开发一种人工智能，能够接管用户的网页浏览器，帮助完成诸如收集资料、购买商品或预订航班等任务。

据悉，该产品的代号为“Project Jarvis（贾维斯项目）”，其功能与 Anthropic 公司本周发布的一款产品类似。

其中两位知情人士表示，谷歌计划最早在 12 月预览这一产品，届时还将发布其下一代旗舰大型语言模型 Gemini（双子座），该模型将为这款产品提供技术支持。

这些计划仍处于暂定状态，未来可能会发生变化。

代号“贾维斯”的这款产品名字来源于《钢铁侠》中托尼·斯塔克的 AI 助手。其开发时间表显示，尽管谷歌研究人员发明了许多底层 AI 技术，但公司在人工智能领域仍面临来自初创企业的强劲竞争。

例如，谷歌近期仍在研发具备“推理能力”的 AI，而 OpenAI 已在 9 月推出了类似的 AI 推理功能，这一进展得益于他们从谷歌聘请了一位 2022 年帮助发明推理方法的研究员。

这一竞争压力导致谷歌的 Gemini 聊天机器人严重落后于 ChatGPT，众多企业客户纷纷转向使用 OpenAI 的语言模型，使得谷歌的 Gemini 模型难以赶超。上周，为提高 AI 开发效率，谷歌将负责 Gemini 聊天机器人的团队转移至其主要 AI 部门 DeepMind。根据《The Verge》上周五的报道，下一代 Gemini 模型预计将在 12 月发布。

AI 开发者们正积极推动“代理”技术（agent），即无需人工监督就能完成复杂任务的 AI 系统，作为行业发展的下一步。企业软件公司如 Salesforce、Microsoft 和 Workday 等，正竞相使用 OpenAI 及其他公司的语言模型开发 AI 代理，以实现简单业务任务的自动化，尽管这些代理技术仍在实验阶段。

谷歌和 Anthropic 正试图将“代理”概念进一步延伸，研发可直接与用户电脑或浏览器交互的软件。OpenAI 也在过去一年中积极开发类似软件。据两位知情人士透露，谷歌的“贾维斯”代理与 Anthropic 推出的产品类似，能够通过频繁截取电脑屏幕截图来分析当前界面内容，并根据用户指令采取行动，比如点击按钮或在文本框中输入信息。

不过，这两家公司代理软件在功能上存在重要差异。Anthropic 表示，其产品可以操作用户电脑上安装的不同应用程序，而谷歌的贾维斯则仅能操作网页浏览器，并且专为 Chrome 浏览器进行了优化。

退换鞋子

三位消息人士称，至少目前，Jarvis 主要面向希望自动化日常网络任务的普通消费者。例如，在今年春季谷歌开发者大会上，首席执行官桑达尔·皮查伊（Sundar Pichai）暗示，未来版本的 Gemini 或许可以自主执行多项操作，帮助用户完成退换鞋子的任务。

相比之下，Anthropic 则将其智能代理定位为可以帮助软件工程师和其他办公人员提高工作效率的工具，尽管 Anthropic 也表示，人们可以将其用于规划与朋友的日常出行等个人事务。

Anthropic 展示了一款实验性的计算机助手，能够处理工作和个人任务。

据两位消息人士透露，谷歌可能会首先将 Jarvis 发布给一小部分早期测试用户，以帮助识别和解决其缺陷。目前，这款智能助手的操作速度较慢，因为模型在执行每个操作前需要花费几秒钟进行思考。

谷歌需要说服用户，相信其 AI 助手能够安全处理他们的个人数据，包括登录密码和信用卡信息。这些信息对于 AI 助手访问不同网站、根据客户需求完成任务或进行购买至关重要。

众所周知，大型语言模型（LLM）偶尔会给出错误答案。例如，谷歌在搜索引擎中使用 LLM 驱动的对话式回答时，最初就出现过不少明显错误。（The Information）

来源链接

【免责声明】市场有风险，投资需谨慎。本文不构成投资建议，用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

数据请求中

数据请求中

在 App 打开

推荐专栏