龙虎棋牌IOS/安卓版手机APP官网下载 如何构建卓越99%东谈主的Harness Engineer

来源:龙虎棋牌2026世界杯官方最新版 作者: 发布时间: 浏览:176

自2026年头以来,对于AI编码的征询迟缓发生变化。

昔时的重心是使用哪个模子、编写什么指示词以及凹凸文不错多长。天然,这些事情仍然很紧迫。

然则,从主要参与者的实践中不错了了地看出,仅靠这些无法处分历久、高质地和抓续运行的问题。

大概六个月前,我仅使用Claude.md运行一个名目。

要是你写下编码商定、目次结构和技能栈,AI时常会按预期使命。至少在一运转是这么。

问题在名目变大后运转出现。

质地互异:即使使用疏浚的指示"添加API端点",文献摈弃和诞妄处理细节也可能因会话而异。

会话断开:当你要求他们连续昨天的使命时,你得到的杀青忽略了以前的推断打算决策。

技巧添加失败:在添加了20多个技巧(如/write-test)后,管制履行端正和先决条款变得难以管制。

换句话说,Claude的markdown只不外是一个"央求"。

莫得机制来检测违纪。

莫得机制来耀眼轨则何时变得逾期。

要是你录用给他们一个历久任务,一个诞妄意味着他们将不得不重新运转。

这里的问题不单是是指示词的编写方式。

骨子上,这源于AI智能体运行的环境莫得被正确推断打算这一事实。

因此,自2026年头以来引起关怀的一个见识是Harness Engineering。

Harness Engineering是什么?

什么是harness?

Harness是一匹迅速一稔的"马具",由缰绳、马鞍和笼头构成——一套齐全的器具,用于教育一匹普遍但不能瞻望的动物朝着正确的方上前进。

Harness Engineering是什么?

Harness Engineering是对于推断打算允许AI智能体牢固、自主运行的"环境自身"。

就像你用马具抑制马一样,思法是抑制AI并教育它朝着正确的方上前进!

• AI模子就像马。它们很普遍,但不知谈我方要去那儿。

• Harness是一套缰绳、马鞍和笼头。它代表教育AI朝着正确方上前进的环境、敛迹和器具的总数。

把柄Michael Hashimoto的说法,2026世界杯博亚体育(中国)官方平台方针是"创建一个恶臭AI智能体失败再次发生的环境"。

我不知谈咫尺是否有平素的行业公认术语,但我依然运转称之为"Harness Engineering"。它的理念是,每当你发现智能体犯错时,你花时辰推断打算一个处分决策,使智能体永久不会再犯相通的诞妄。

进化的真正体验:

AI智能体抑制依然资历了三个阶段。

咱们将回来每个阶段变得可能的事情和清寒的东西。

第一阶段:CLAUDE.md时期(指示词工程,2023年头)

在名目根目次摈弃一个CLAUDE.md文献,并在其中写入你的技能栈和编码商定。仅此一项就权贵改善了AI的输出。

CLAUDE.md

技能栈

• Next.js 15(App Router)

• TypeScript 5.x

• Prisma + PostgreSQL

商定

• 组件必须放在src/components/中

• API路由必须放在src/app/api/中

• 类型界说必须鸠合在src/types/中

当今不错作念什么:AI了解技能栈并生成恰当商定的代码。

清寒什么:轨则只是"央求"。会话末端时先前的凹凸文丢失了。当多东谈主开荒时,Claude.md的评释因智能体而异。

第二阶段:AGENTS.md时期(凹凸文工程)

CLAUDE.md变得太大,龙虎棋牌(中国)无法在单个文献中管制。这导致引入了差异轨则的成就.claude/rules/。

AGENTS.md算作跨器具的绽开圭臬开荒,是一种声明性形容智能体指示(读取哪些文献、使用哪些器具等)的机制。

其特色是不依赖于任何特定器具,不错被Claude Code之外的智能体器具援用。

project/

├── CLAUDE.md # 名目范围的计谋(保抓简易)

├── AGENTS.md # 智能体指示(跨器具圭臬)

└── .claude/

└── rules/

├── architecture.md # 架构敛迹

├── testing.md # 测试计谋

└── security.md # 安全要求

当今不错作念什么:轨则的关怀点差异。咱们不错将智能体援用的凹凸文中的信息量抑制在最低必要水平。AGENTS.md允许咱们无论使用什么器具齐能圭臬化对智能体的指示。

清寒什么:即使轨则被写下来,也莫得方针强制履行它们。会话之间的挂念丢失问题仍然莫得处分。技巧履行措施留给智能体,导致质地不一致。

第三阶段:Harness Engineering(2025年底于今)

意志到只是界说轨则是不够的,咱们集成了履行、考据和挂念机制。这即是harness。

Harness不取代凹凸文工程;它包含凹凸文工程。

CLAUDE.md和AGENTS.md齐是harness的一部分。harness设立在这些层之上:技巧、钩子、挂念和考据轮回。

要是不将这三个见识视为对立的思法,而是算作醒见地焦点的升沉,就更容易诱导它们。

Harness之前和之后

这清楚了履行疏浚任务"添加用户身份考据API"时有无harness的区别。

之前:仅CLAUDE.md

指示:"杀青用户身份考据API"

根除:

• 在src/app/api/auth/route.ts中杀青了JWT身份考据 ← 正常

• 以明文记载密码 ← 安全违纪

• 诞妄响应样式与现存API不一致 ← 商定违纪

• 未包含测试 ← 未达到圭臬

• 忽略了先前决定使用NextAuth.js进行身份考据的计谋 ← 凹凸文一语气性丢失

在五个托福效用中,唯唯独个莫得问题。

开云2026世界杯中国官网

即便如斯,问题也只是在东谈主工审查时才被发现。

指示:"杀青用户身份考据API"

履行的抑制:

[挂念] 从progress.md读取先前的决策 → 证据聘任了NextAuth.js

[技巧] 解任/add-feature使命流,按以下端正杀青:类型界说 → 逻辑 → API → 测试

[钩子] 文献保存时自动使用Biome样式化代码

[钩子] 立即检测console.log语句和安全违纪模式

[反馈] 任务完成前运行类型查验 + 测试 → 0个类型诞妄,系数测试通过

[挂念] 更新progress.md用于下次会话

根除:

使用NextAuth.js杀青(响应先前的决策) ← 正常

恰当安全要求 ← 正常

颐养诞妄响应样式 ← 正常

达到测试掩饰率圭臬 ← 正常

更新经过文献 ← 正常

区别很明显。莫得harness,操作是"但愿取得好的输出"。有了harness,结构被推断打算为"恶臭差的输出"。

论断

Harness Engineering是为有用使用AI智能体而推断打算环境。

诚然指示词工程是"如何建议央求"的艺术,但harness工程是"如何使其使命"的艺术。

在施行期骗中,后者的紧迫性正在稳步加多。

• 轨则由机器强制履行,而不是通过央求。

• 挂念应该外部化而不是存储在AI中。

• 推断打算时应假定不错收复,而不是假定不会失败。

• 方针是创建团队不错重用的结构,而不是依赖个东谈主的明智机灵。

在AI智能体时期,所需的可能

不是编写更长的指示词,而是

创建更好的harness。

关怀 AI拉呱

要是这篇内容对你有启发,宽饶关怀「AI拉呱」,获取更多 AI 前沿知悉、实战教程与趋势解读。

下期在看

下期将连续带来该主题的进阶拆解与实操案例龙虎棋牌IOS/安卓版手机APP官网下载,建议先储藏本文,幸免错过更新。