
自2026年头以来,对于AI编码的征询迟缓发生变化。
昔时的重心是使用哪个模子、编写什么指示词以及凹凸文不错多长。天然,这些事情仍然很紧迫。
然则,从主要参与者的实践中不错了了地看出,仅靠这些无法处分历久、高质地和抓续运行的问题。
大概六个月前,我仅使用Claude.md运行一个名目。
要是你写下编码商定、目次结构和技能栈,AI时常会按预期使命。至少在一运转是这么。
问题在名目变大后运转出现。
质地互异:即使使用疏浚的指示"添加API端点",文献摈弃和诞妄处理细节也可能因会话而异。
会话断开:当你要求他们连续昨天的使命时,你得到的杀青忽略了以前的推断打算决策。
技巧添加失败:在添加了20多个技巧(如/write-test)后,管制履行端正和先决条款变得难以管制。
换句话说,Claude的markdown只不外是一个"央求"。
莫得机制来检测违纪。
莫得机制来耀眼轨则何时变得逾期。
要是你录用给他们一个历久任务,一个诞妄意味着他们将不得不重新运转。
这里的问题不单是是指示词的编写方式。
骨子上,这源于AI智能体运行的环境莫得被正确推断打算这一事实。
因此,自2026年头以来引起关怀的一个见识是Harness Engineering。
Harness Engineering是什么?
什么是harness?
Harness是一匹迅速一稔的"马具",由缰绳、马鞍和笼头构成——一套齐全的器具,用于教育一匹普遍但不能瞻望的动物朝着正确的方上前进。
Harness Engineering是什么?
Harness Engineering是对于推断打算允许AI智能体牢固、自主运行的"环境自身"。
就像你用马具抑制马一样,思法是抑制AI并教育它朝着正确的方上前进!
• AI模子就像马。它们很普遍,但不知谈我方要去那儿。
• Harness是一套缰绳、马鞍和笼头。它代表教育AI朝着正确方上前进的环境、敛迹和器具的总数。
把柄Michael Hashimoto的说法,2026世界杯博亚体育(中国)官方平台方针是"创建一个恶臭AI智能体失败再次发生的环境"。
我不知谈咫尺是否有平素的行业公认术语,但我依然运转称之为"Harness Engineering"。它的理念是,每当你发现智能体犯错时,你花时辰推断打算一个处分决策,使智能体永久不会再犯相通的诞妄。
进化的真正体验:
AI智能体抑制依然资历了三个阶段。
咱们将回来每个阶段变得可能的事情和清寒的东西。
第一阶段:CLAUDE.md时期(指示词工程,2023年头)
在名目根目次摈弃一个CLAUDE.md文献,并在其中写入你的技能栈和编码商定。仅此一项就权贵改善了AI的输出。
CLAUDE.md
技能栈
• Next.js 15(App Router)
• TypeScript 5.x
• Prisma + PostgreSQL
商定
• 组件必须放在src/components/中
• API路由必须放在src/app/api/中
• 类型界说必须鸠合在src/types/中
当今不错作念什么:AI了解技能栈并生成恰当商定的代码。
清寒什么:轨则只是"央求"。会话末端时先前的凹凸文丢失了。当多东谈主开荒时,Claude.md的评释因智能体而异。
第二阶段:AGENTS.md时期(凹凸文工程)
CLAUDE.md变得太大,龙虎棋牌(中国)无法在单个文献中管制。这导致引入了差异轨则的成就.claude/rules/。
AGENTS.md算作跨器具的绽开圭臬开荒,是一种声明性形容智能体指示(读取哪些文献、使用哪些器具等)的机制。
其特色是不依赖于任何特定器具,不错被Claude Code之外的智能体器具援用。
project/
├── CLAUDE.md # 名目范围的计谋(保抓简易)
├── AGENTS.md # 智能体指示(跨器具圭臬)
└── .claude/
└── rules/
├── architecture.md # 架构敛迹
├── testing.md # 测试计谋
└── security.md # 安全要求
当今不错作念什么:轨则的关怀点差异。咱们不错将智能体援用的凹凸文中的信息量抑制在最低必要水平。AGENTS.md允许咱们无论使用什么器具齐能圭臬化对智能体的指示。
清寒什么:即使轨则被写下来,也莫得方针强制履行它们。会话之间的挂念丢失问题仍然莫得处分。技巧履行措施留给智能体,导致质地不一致。
第三阶段:Harness Engineering(2025年底于今)
意志到只是界说轨则是不够的,咱们集成了履行、考据和挂念机制。这即是harness。
Harness不取代凹凸文工程;它包含凹凸文工程。
CLAUDE.md和AGENTS.md齐是harness的一部分。harness设立在这些层之上:技巧、钩子、挂念和考据轮回。

要是不将这三个见识视为对立的思法,而是算作醒见地焦点的升沉,就更容易诱导它们。
Harness之前和之后
这清楚了履行疏浚任务"添加用户身份考据API"时有无harness的区别。
之前:仅CLAUDE.md
指示:"杀青用户身份考据API"
根除:
• 在src/app/api/auth/route.ts中杀青了JWT身份考据 ← 正常
• 以明文记载密码 ← 安全违纪
• 诞妄响应样式与现存API不一致 ← 商定违纪
• 未包含测试 ← 未达到圭臬
• 忽略了先前决定使用NextAuth.js进行身份考据的计谋 ← 凹凸文一语气性丢失
在五个托福效用中,唯唯独个莫得问题。
开云2026世界杯中国官网即便如斯,问题也只是在东谈主工审查时才被发现。
指示:"杀青用户身份考据API"
履行的抑制:
[挂念] 从progress.md读取先前的决策 → 证据聘任了NextAuth.js
[技巧] 解任/add-feature使命流,按以下端正杀青:类型界说 → 逻辑 → API → 测试
[钩子] 文献保存时自动使用Biome样式化代码
[钩子] 立即检测console.log语句和安全违纪模式
[反馈] 任务完成前运行类型查验 + 测试 → 0个类型诞妄,系数测试通过
[挂念] 更新progress.md用于下次会话
根除:
使用NextAuth.js杀青(响应先前的决策) ← 正常
恰当安全要求 ← 正常
颐养诞妄响应样式 ← 正常
达到测试掩饰率圭臬 ← 正常
更新经过文献 ← 正常
区别很明显。莫得harness,操作是"但愿取得好的输出"。有了harness,结构被推断打算为"恶臭差的输出"。
论断
Harness Engineering是为有用使用AI智能体而推断打算环境。
诚然指示词工程是"如何建议央求"的艺术,但harness工程是"如何使其使命"的艺术。
在施行期骗中,后者的紧迫性正在稳步加多。
• 轨则由机器强制履行,而不是通过央求。
• 挂念应该外部化而不是存储在AI中。
• 推断打算时应假定不错收复,而不是假定不会失败。
• 方针是创建团队不错重用的结构,而不是依赖个东谈主的明智机灵。
在AI智能体时期,所需的可能
不是编写更长的指示词,而是
创建更好的harness。
关怀 AI拉呱
要是这篇内容对你有启发,宽饶关怀「AI拉呱」,获取更多 AI 前沿知悉、实战教程与趋势解读。
下期在看
下期将连续带来该主题的进阶拆解与实操案例龙虎棋牌IOS/安卓版手机APP官网下载,建议先储藏本文,幸免错过更新。