从追求吞吐到防范尾部风险:为什么金融系统需要专属的 AI Harness?
2026-04-3017:34
Cobo
2026-04-30 17:34
Cobo
2026-04-30 17:34
收藏文章
订阅专栏

过去两年,关于 AI 智能体的讨论几乎都围绕模型能力展开——推理能力、代码能力、榜单排名。然而,在真实系统中,模型从来不是孤立存在的,它只是执行链路中的一个组件。从模型理论上能做什么,到系统最终稳定产出什么,中间隔着一整层工程结构:提示策略、工具调用、记忆管理、执行环境以及反馈机制。

这道鸿沟,决定了 AI 商业落地的生死。

这一点可以用 LangChain 工程师 Viv Trivedy 提出的一个简单公式来概括:

     Agent = Model + Harness

在这个等式里,大模型决定了智能的下限与可能性,而包裹在模型外面的 Harness(脚手架 / 系统框架),才真正决定了执行的上限与最终结果。

这在工程实践中被反复验证:同一个 Claude Opus 模型,在原生环境下可能表现平平;但在定制的 Harness 下,Viv 团队仅通过调整系统结构,就将其性能排名从前 30 拉升到了前 5。

正如 HumanLayer 在其关于 Harness Engineering 的文章中总结的:很多时候,问题不在模型本身,而在系统的配置方式。

任务如何拆解、状态如何维护、输出如何验证,这些结构性设计往往比模型本身更关键。很多被感知为智能涌现的现象,本质上是系统协调能力的结果。

Coding Harness 究竟解决了什么问题?

目前最成功的 Agent 集中在代码领域。

从工程角度看,Coding Harness 解决的,是模型无法持续工作的问题。

模型更像一个间歇性工作的组件:它会遗忘上下文、丢失状态、输出不稳定,也可能在任务尚未完成时提前结束。它擅长单步推理,但很难独立推进长链路任务。

Harness 的作用,在于将模型的离散输出组织为一个可持续运转的闭环,从而实现高吞吐的自动执行。

这依赖一整套协同机制:外部存储维持状态,上下文管理保证推理连续,执行环境负责运行代码,验证回路捕获错误,任务规划组织流程,循环控制防止提前停止。执行、反馈和记忆被连接起来,形成一个可以自我推进的闭环。

这些机制共同打通了执行、反馈与记忆三条关键链路,把原本断断续续的人机协作流程,重构为一个可以持续运转的自动化闭环系统,从而实现稳定、长时间、高吞吐的自主执行。

从这个视角看,很多看似繁琐的设计(沙盒、验证机制等),本质上是在减少对人工干预的依赖。因为在自动化的 Loop 里,每一次等待人工确认,都是极其昂贵的时间损耗。

只有把人类从具体的执行流中剥离出去,系统才能真正实现高吞吐的自我推进、自我纠错和自我维持。

从 Coding Harness 到金融级 Harness:从追求吞吐到防范

在软件工程的语境中,这套设计能够成立,有一个隐含前提:代码世界的错误是可逆的。

系统崩溃了可以重启,错误代码可以修复,状态可以恢复。在这样的前提下,最优策略自然是快速迭代——执行、失败、修复、再执行。Coding Harness 本质上是在为模型构建一个「允许犯错的实验室」,将模型原本间歇性的推理能力组织为一个可持续运转的闭环,以支撑长链路任务。吞吐的提升,来自系统对错误的吸收能力。

但这一前提,在金融系统中并不成立。

一笔交易一旦签名并广播,便进入不可回滚的结算流程。没有安全的重试空间,也无法恢复到执行之前的状态。错误不再是过程的一部分,而是最终结果。原本用于提升系统鲁棒性的机制,尤其是重试,在这里会改变性质,因为每一次额外尝试,都是新的风险暴露,同时伴随着持续累积的执行成本(如 Gas)。

软件世界依赖 Fail Fast,通过试错不断逼近最优解;而在金融环境中,系统更关心的是如何降低出错的概率。

因此,金融级 Harness 的设计重点,是通过系统架构的设计,直接把「不安全的岔路」从 AI 的行动菜单里物理剔除。与其事后补救,不如从源头压缩不确定性,让 AI 的处境变得极度「简单」。

只有当不可逾越的安全边界被前置、并固化为系统的基础设施后,大模型不再需要兼职做风控,也不必在判断「这笔交易合不合法」上虚耗宝贵的算力,只需要在绝对安全的轨道里,专注做它最擅长的事:计算时机、优化参数、寻找最高的策略收益。

金融级 Harness:围绕约束设计

在这一约束导向的框架下,金融 Harness 不再主要用于提升执行能力,而是用于限制执行行为。以 Cobo 的 Agentic Wallet 为例,其核心逻辑在于通过三层结构压缩 AI 的出错空间,确保任何输出在进入不可逆阶段之前都已经被约束在可控范围内。


1. Recipe(技能库):从源头限制「可做的事情」

第一步,是收紧执行空间。

在 CAW 中,所有金融操作都被封装为经过审计、不可篡改的 Recipe(技能库)。这种机制通过将操作限制在预定义的路径内,将 AI 的行为从自由拼装逻辑收敛到了有限的选择空间。简而言之,AI 可以在策略层自由思考,但在协议层的执行必须严格保持在验证过的安全边界之内。

2. 动态 Pact:从持续访问到一次性契约

第二层发生在权限本身。

传统系统倾向于给智能体持续的资金访问能力,比如一个长期绑定余额的钱包。这种设计效率很高,但风险也一直存在。

CAW 引入了一次性任务契约(Pact)。每一个 Pact 都基于具体上下文生成(由 Recipe 与用户意图共同决定),明确限定金额、范围和时间窗口。任务结束后,权限立即失效。权限在这里变成了一种瞬时状态,而非长期能力。风险也因此被限制在局部。

3. 意图对齐:拦截合法的错误交易

一笔签名正确、余额充足的交易,在商业逻辑上仍可能违背用户初衷。为了解决这一层隐蔽风险,CAW 引入了人机协同机制,在资金划转前,系统将底层调用指令(CallData)转译为可读的自然语言,并推送至用户终端。只有在用户明确批准后 ( 当人类阅读业务意图并点击「Approve」时 ),资金才会实际转移,从而确保 AI 无法独自绕过人类意图。

AI 负责提出方案,人类负责做最终判断。只有当两者一致时,交易才会发生。

结语:约束作为基础设施

随着模型能力逐渐收敛、Harness 体系走向成熟,AI 系统逐渐趋于标准化。差异不再主要体现在模型本身,而是转移到边界设计:系统允许做什么,在什么条件下可以执行,以及如何约束这些行为。在大多数行业中,约束往往被视为效率的代价;但在低容错环境中,它是系统得以运行的前提。没有约束,系统甚至无法进入执行阶段。

这也是为什么,缺乏严密 Harness 的 AI 更像实验工具,而嵌入约束体系中的 AI 才具备生产价值。

以 Cobo CAW 为代表的金融 Harness 方案,将复杂的风控与密码学能力抽象并外化,就像云计算标准化了算力获取方式一样,安全与约束也开始成为可组合、可复用的能力。这使得机构和开发者无需重复构建底层体系,就可以将 AI 引入资金流转,同时将资源集中在真正产生差异的部分——策略、工具和业务创新。

在这样的语境中,约束不再是限制,而成为执行得以发生的条件。

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

专栏文章
查看更多
数据请求中

推荐专栏

数据请求中

一起「遇见」未来

DOWNLOAD FORESIGHT NEWS APP

Download QR Code