重度使用 opencode 后引发的一些关于 agent 的感想
栏目:广告资讯 发布时间:2026-01-05
转载自:https://mp.weixin.qq.com/s/rY5yqB3TE0o7LcnC4vkfpQ作者:PingCAP联合创始人兼CTO黄东旭最近高强度使用了opencode与oh-my-opencode,在一个并不简单的实际任务中,我对Agent系统的认知经历了一次显著的跃迁。任务目标非常明确:为TiKV重新构建一层兼容PostgreSQL协议的SQL接口层,需至少能通过基础测试,包括dvdrental兼容性测试和TPCC简化版。这相当于重写TiDB的

转载自:https://www./link/62b395526e160d2e25c4b910ea419a90 作者:PingCAP 联合创始人兼 CTO 黄东旭

最近高强度使用了 opencode 与 oh-my-opencode,在一个并不简单的实际任务中,我对 Agent 系统的认知经历了一次显著的跃迁。

任务目标非常明确:

为 TiKV 重新构建一层兼容 PostgreSQL 协议的 SQL 接口层,需至少能通过基础测试,包括 dvdrental 兼容性测试和 TPCC 简化版。

这相当于重写 TiDB 的 SQL 层——我清楚这项工作的难度。即便只是让 TPCC 跑通,我们团队当初也耗时约两个月。

最终成果令我震惊:项目地址在此:https://www./link/0f3839dc22ff5ad19a6b74203fac591f。

我原本预估它“能做”,但必然需要大量时间投入与反复调试;结果却出乎意料:仅用一个下午,消耗约 100 多万 token(得益于我是多个 Agent 平台的 Pro Max 用户,全程未额外付费)。

这是我第一次真切意识到:编写代码的成本已趋近于零,哪怕面对数据库、操作系统、编译器这类传统意义上的复杂系统(对当前 AI 而言,其实反而是结构清晰的“简单项目”)。

下面分享这段实践过程中的几点体悟。

Context Engineering 并不是堆 Prompt

在转向 opencode 之前,我已长期使用 Claude Code、Gemini Pro、Codex 等工具。

从表象看,它们都具备 agentic loop + tool use 的 CLI 形态。

坦白讲,底层模型能力本身已无本质差异,均属各家顶尖水准。

但在真实交付质量上,体验落差极为明显。

问题根源不在模型,而在 context engineering。不少人误以为“套壳”毫无技术含量,但我的切身体会是:其中门道极深……

真正高效的 context engineering,是将以下要素持续、结构化、稳定地注入系统:

  • 清晰但不过度琐碎的目标定义(由人设定)
  • 可执行、可追踪的分步计划(由 Agent 拆解)
  • 明确的工程边界与硬性约束(由人划定)
  • 历史决策链与潜在假设(由 Agent 维护)
  • 支撑长上下文不发散的中间状态锚点(由 Agent 构建)

例如,当我切换至 opencode + oh-my-opencode 后,所用模型完全一致,行为却天差地别。同样是 agentic loop、同样支持 tool use,但复杂工程的交付质量完全不在同一维度。

oh-my-opencode 中一个让我倍感舒适的设计是:

它并不迷信“单一大模型最强即最优”,而是将多个一线模型有机整合进统一工作流。这个思路其实不难想到——三个臭皮匠胜过一个诸葛亮,更何况是三位顶级诸葛亮?

实际效果远超预期。

未来的能力天花板,未必取决于单个模型规模的继续膨胀,而更可能来自:多模型(顶级档位)协同 + context engineering + 稳健循环机制的整体架构设计。

不中断,比“更聪明”重要

另一个常被忽视却至关重要的维度是:

无缝连续的工作流(non-interruptive flow)

许多 Agent 系统在 “思考 → 执行 → 报错 → 等待人工确认” 的环节中频繁打断。上下文虽在,但工作流已然断裂。

目前我主要借助 ralph-loop 来缓解这一问题:让 Agent 在一个可控、稳定的闭环中持续推进(持续消耗 token),

人类只需在关键节点介入(通常是最终验收阶段),而非被迫充当“每一步的指令下达者”。

一旦中断大幅减少,变化立竿见影:工程节奏开始逼近真实开发的连续性,人的认知负荷显著降低。事实上,AI 当前已足够聪明,工具也足够成熟,效率瓶颈早已转移到人侧。

给人的界面同样重要

同样是 TUI,opencode 的交互体验明显优于 CC,我认为核心在于一点:

用户需要的是掌控感(sense of control)

优秀的交互设计应始终让人清晰知晓:

  • 系统当前正在做什么(实时展示 thinking 过程与 todo 列表)
  • 它为何如此决策(提供推理依据或上下文引用)
  • 我何时、以何种方式可以介入(明确标注干预入口与时机)

一旦用户陷入“向 Agent 下达指令→等待结果→再下指令”的被动循环,体验注定糟糕。

真正优秀的 Agent 系统,应把复杂性封装在代码逻辑与运行闭环中,

而将决策权、节奏主导权与信任感,通过精巧的界面设计交还给人。

当前最差的体验:Infra

如果必须指出当前体验中最薄弱的一环,

那仍是 infra 层:

  • 沙箱 / 运行时环境配置
  • 数据库及依赖服务的启动与管理
  • 测试环境搭建、fixture 注入、数据初始化
  • 本地开发与 CI 流水线的一致性保障

这些任务高度重复、上下文碎片化、且天然难以被 Agent 理解与调度。即使模型已能把“写代码”这件事做到极致,只要卡在 infra 上,整个工程节奏仍会被强行拖慢。

下一阶段决定体验上限的关键,并非 opencode 这类工具本身,

而是 opencode + infra abstraction 的深度融合。

当沙箱、数据库、测试框架、CI/CD 等全部成为系统可感知、可调度、可版本化的一等公民,而非一堆靠人工拼接的脚本时,Agent 才能真正从“写代码的助手”,进化为“持续驱动工程落地的自主系统”。

opencode for XXX,很快就会到来

程序员或许是最早感知 AGI 来临的群体。无论我们是否愿意接受,“职业写代码”这一角色正加速消亡。但也不必过度焦虑——人类不再靠体力狩猎后,依然会去健身房锻炼;作为一种思维训练与兴趣实践,“古法编程”将持续存在。

但从近期编程 Agent 的演进速度来看,我判断:

  • Context engineering 是高度可迁移的能力
  • 模型能力正快速趋于标准化
  • 更多 token,意味着更强的综合智能

换言之,同样的“食材”(LLM),搭配不同的“厨子”(Claude Code / Open Code),产出截然不同的“菜肴”。而你本人最初输入的 prompt(目标意图)可能从未改变。

我们很快将迎来 opencode for XXX、opencode for YYY 这类垂直领域专用 Agent 系统。

底层模型完全可以一致,但凭借差异化的上下文组织策略,它们将展现出如专业系统般的独特行为范式。

届时,“通用大模型是否足够强”将不再是核心命题,真正决定成败的关键将是:

谁更擅长构建一个长期、稳定、可持续运转的上下文系统。

源码地址:点击下载


# 这类  #   # postgresql  # 数据库  # tidb  # https  # prompt  # agi  # 工作流  # 接口  # 这一  # 闭环  # 多个  # 给人  # 而非  # 的是  # 我是  # 就会  # gemini  # github  # 操作系统  # 工具  # qq  # ai  # claude  # 大模型  # 环境配置  # git  # yy  # sql  # 架构  # for  # 封装  # Token  # 循环 


相关文章: 敲碗10年!Mac系列传将迎来「触控与联网」双革新  摩托车抬头喷技术解密 轻松掌控赛道速度优势  漫威隐藏搭档,找它分分钟做出顶级特效  宫崎英高称魂类游戏并非创新!只是设计理念满足玩家需求  主场加冕!2025耕升杯CS2网咖争霸赛全国总决赛圆满落幕!  盒马、美团参加漫展,差点打起来?  小红书又在搞事情  视听共振,心灵同频!《鸿蒙星光盛典》照亮“在一起”的心路  追觅年终奖加码,创始人俞浩宣布额外奖励全体员工 1 克黄金  北京严查电动自行车非法改装,端掉 18 个“黑窝点”  手机没讯号别再举高高!「重开机」以外的5大必学祕技一览  我说史低立大功! 卡牌肉鸽游戏《杀戮尖塔》Steam在线人数创新高  《GTA6》或有第一人称模式 粉丝从预告片发现线索  要求下架国产游戏?《咒术回战》官方重拳打击侵权山寨手游  《给他爱5》麦克演员屡被报假警 甚至与警察成了朋友  《蟹蟹寻宝奇遇》制作人呼吁类魂游戏别再模仿《黑暗之魂》  R星前总监力挺拉瑞安:不做《博德之门4》值得尊重!  免费格斗游戏《2XKO》2026年1月20日离开抢先体验  Ruby 4.0.0 正式发布,新增 “Ruby Box” 和 “ZJIT”  梅西代言白酒?被吐槽了?!  一加Turbo 6系列官宣1月8日发布 内置9000mAh大电池  荣耀X70荣获2025 CNMO年度评选“硬抗子弹神机”  安全与流畅兼得:ToDesk荣获微软“年度星锐应用”,揭秘远程控制天花板  研究称《马里奥》《耀西》可提升年轻人幸福感  索尼被苹果抛弃!三星为iPhone 18提供图像传感器  小米17 Ultra将登陆全球市场 电池减小 核心性能不变  打城必胜攻略武将选择与战场实战精髓  喜临门更名,一场准备了十余年的科技亮剑  Qwen Code 正式发布 VSCode 插件 & TypeScript SDK  荣耀WIN系列首销日销量超过2.5万台 WIN RT占60%  通义实验室开源 GUI 智能体基座模型:MAI-UI  华硕终于发布RTX 5090D v2显卡!OC版已正式上架:19999元  鸿蒙版今日头条安装量突破2000万!新增创作中心、碰一碰和隔空传送  盒马营销送西瓜,把广州动物园吓沉默了...  快科技2025年度评奖:主板篇  vivo Y500i发布 搭载骁龙4 Gen 2平台 512GB售1799元  该等低价还是直接冲?玩家敲碗Steam纳入「价格追蹤」功能  影石创始人刘靖康再谈“撒钱”争议:的确做的不对,很多人从情感上受到伤害  真我副总裁官宣新款Neo系列 号称“无越级不发布”  化槽点为卖点,这些品牌是懂吸睛的  2025年苹果iOS贡献全球35%移动流量 安卓设备占65%  Xbox玩家实测:删除好友竟能大幅提升游戏流畅度  耐用折叠屏手机推荐:三星GalaxyZ TriFold何以重塑旗舰耐用性标杆?  《哈迪斯新手福音》蓄力大招与战斗诀窍全解析  苹果、高通、联发科9月正面交锋!传三大晶片商首批2奈米SoC同月亮相  这文案,好水水水水水水水啊  神级碎片高效使用指南:战力飙升不是梦!  影之刃3左殇职业材料获取全攻略:从入门到毕业的江湖寻宝之旅  DDR4价格持续暴涨!三星暂缓停产计划 与客户锁定长单  元旦必备!鸿蒙版大众点评全面焕新,本地生活“全能选手”上线! 


相关栏目: 【 广告资讯37196 】 【 广告推广143353 】 【 广告优化89630