转载自:https://www./link/62b395526e160d2e25c4b910ea419a90 作者:PingCAP 联合创始人兼 CTO 黄东旭
最近高强度使用了 opencode 与 oh-my-opencode,在一个并不简单的实际任务中,我对 Agent 系统的认知经历了一次显著的跃迁。
任务目标非常明确:
为 TiKV 重新构建一层兼容 PostgreSQL 协议的 SQL 接口层,需至少能通过基础测试,包括 dvdrental 兼容性测试和 TPCC 简化版。
这相当于重写 TiDB 的 SQL 层——我清楚这项工作的难度。即便只是让 TPCC 跑通,我们团队当初也耗时约两个月。
最终成果令我震惊:项目地址在此:https://www./link/0f3839dc22ff5ad19a6b74203fac591f。
我原本预估它“能做”,但必然需要大量时间投入与反复调试;结果却出乎意料:仅用一个下午,消耗约 100 多万 token(得益于我是多个 Agent 平台的 Pro Max 用户,全程未额外付费)。
这是我第一次真切意识到:编写代码的成本已趋近于零,哪怕面对数据库、操作系统、编译器这类传统意义上的复杂系统(对当前 AI
而言,其实反而是结构清晰的“简单项目”)。
下面分享这段实践过程中的几点体悟。
在转向 opencode 之前,我已长期使用 Claude Code、Gemini Pro、Codex 等工具。
从表象看,它们都具备 agentic loop + tool use 的 CLI 形态。
坦白讲,底层模型能力本身已无本质差异,均属各家顶尖水准。
但在真实交付质量上,体验落差极为明显。
问题根源不在模型,而在 context engineering。不少人误以为“套壳”毫无技术含量,但我的切身体会是:其中门道极深……
真正高效的 context engineering,是将以下要素持续、结构化、稳定地注入系统:
例如,当我切换至 opencode + oh-my-opencode 后,所用模型完全一致,行为却天差地别。同样是 agentic loop、同样支持 tool use,但复杂工程的交付质量完全不在同一维度。
oh-my-opencode 中一个让我倍感舒适的设计是:
它并不迷信“单一大模型最强即最优”,而是将多个一线模型有机整合进统一工作流。这个思路其实不难想到——三个臭皮匠胜过一个诸葛亮,更何况是三位顶级诸葛亮?
实际效果远超预期。
未来的能力天花板,未必取决于单个模型规模的继续膨胀,而更可能来自:多模型(顶级档位)协同 + context engineering + 稳健循环机制的整体架构设计。
另一个常被忽视却至关重要的维度是:
无缝连续的工作流(non-interruptive flow)。
许多 Agent 系统在 “思考 → 执行 → 报错 → 等待人工确认” 的环节中频繁打断。上下文虽在,但工作流已然断裂。
目前我主要借助 ralph-loop 来缓解这一问题:让 Agent 在一个可控、稳定的闭环中持续推进(持续消耗 token),
人类只需在关键节点介入(通常是最终验收阶段),而非被迫充当“每一步的指令下达者”。
一旦中断大幅减少,变化立竿见影:工程节奏开始逼近真实开发的连续性,人的认知负荷显著降低。事实上,AI 当前已足够聪明,工具也足够成熟,效率瓶颈早已转移到人侧。
同样是 TUI,opencode 的交互体验明显优于 CC,我认为核心在于一点:
用户需要的是掌控感(sense of control)。
优秀的交互设计应始终让人清晰知晓:
一旦用户陷入“向 Agent 下达指令→等待结果→再下指令”的被动循环,体验注定糟糕。
真正优秀的 Agent 系统,应把复杂性封装在代码逻辑与运行闭环中,
而将决策权、节奏主导权与信任感,通过精巧的界面设计交还给人。
如果必须指出当前体验中最薄弱的一环,
那仍是 infra 层:
这些任务高度重复、上下文碎片化、且天然难以被 Agent 理解与调度。即使模型已能把“写代码”这件事做到极致,只要卡在 infra 上,整个工程节奏仍会被强行拖慢。
下一阶段决定体验上限的关键,并非 opencode 这类工具本身,
而是 opencode + infra abstraction 的深度融合。
当沙箱、数据库、测试框架、CI/CD 等全部成为系统可感知、可调度、可版本化的一等公民,而非一堆靠人工拼接的脚本时,Agent 才能真正从“写代码的助手”,进化为“持续驱动工程落地的自主系统”。
程序员或许是最早感知 AGI 来临的群体。无论我们是否愿意接受,“职业写代码”这一角色正加速消亡。但也不必过度焦虑——人类不再靠体力狩猎后,依然会去健身房锻炼;作为一种思维训练与兴趣实践,“古法编程”将持续存在。
但从近期编程 Agent 的演进速度来看,我判断:
换言之,同样的“食材”(LLM),搭配不同的“厨子”(Claude Code / Open Code),产出截然不同的“菜肴”。而你本人最初输入的 prompt(目标意图)可能从未改变。
我们很快将迎来 opencode for XXX、opencode for YYY 这类垂直领域专用 Agent 系统。
底层模型完全可以一致,但凭借差异化的上下文组织策略,它们将展现出如专业系统般的独特行为范式。
届时,“通用大模型是否足够强”将不再是核心命题,真正决定成败的关键将是:
谁更擅长构建一个长期、稳定、可持续运转的上下文系统。
源码地址:点击下载
# 这类
# 堆
# postgresql
# 数据库
# tidb
# https
# prompt
# agi
# 工作流
# 接口
# 这一
# 闭环
# 多个
# 给人
# 而非
# 的是
# 我是
# 就会
# gemini
# github
# 操作系统
# 工具
# qq
# ai
# claude
# 大模型
# 环境配置
# git
# yy
# sql
# 架构
# for
# 封装
# Token
# 循环
相关文章:
敲碗10年!Mac系列传将迎来「触控与联网」双革新
摩托车抬头喷技术解密 轻松掌控赛道速度优势
漫威隐藏搭档,找它分分钟做出顶级特效
宫崎英高称魂类游戏并非创新!只是设计理念满足玩家需求
主场加冕!2025耕升杯CS2网咖争霸赛全国总决赛圆满落幕!
盒马、美团参加漫展,差点打起来?
小红书又在搞事情
视听共振,心灵同频!《鸿蒙星光盛典》照亮“在一起”的心路
追觅年终奖加码,创始人俞浩宣布额外奖励全体员工 1 克黄金
北京严查电动自行车非法改装,端掉 18 个“黑窝点”
手机没讯号别再举高高!「重开机」以外的5大必学祕技一览
我说史低立大功! 卡牌肉鸽游戏《杀戮尖塔》Steam在线人数创新高
《GTA6》或有第一人称模式 粉丝从预告片发现线索
要求下架国产游戏?《咒术回战》官方重拳打击侵权山寨手游
《给他爱5》麦克演员屡被报假警 甚至与警察成了朋友
《蟹蟹寻宝奇遇》制作人呼吁类魂游戏别再模仿《黑暗之魂》
R星前总监力挺拉瑞安:不做《博德之门4》值得尊重!
免费格斗游戏《2XKO》2026年1月20日离开抢先体验
Ruby 4.0.0 正式发布,新增 “Ruby Box” 和 “ZJIT”
梅西代言白酒?被吐槽了?!
一加Turbo 6系列官宣1月8日发布 内置9000mAh大电池
荣耀X70荣获2025 CNMO年度评选“硬抗子弹神机”
安全与流畅兼得:ToDesk荣获微软“年度星锐应用”,揭秘远程控制天花板
研究称《马里奥》《耀西》可提升年轻人幸福感
索尼被苹果抛弃!三星为iPhone 18提供图像传感器
小米17 Ultra将登陆全球市场 电池减小 核心性能不变
打城必胜攻略武将选择与战场实战精髓
喜临门更名,一场准备了十余年的科技亮剑
Qwen Code 正式发布 VSCode 插件 & TypeScript SDK
荣耀WIN系列首销日销量超过2.5万台 WIN RT占60%
通义实验室开源 GUI 智能体基座模型:MAI-UI
华硕终于发布RTX 5090D v2显卡!OC版已正式上架:19999元
鸿蒙版今日头条安装量突破2000万!新增创作中心、碰一碰和隔空传送
盒马营销送西瓜,把广州动物园吓沉默了...
快科技2025年度评奖:主板篇
vivo Y500i发布 搭载骁龙4 Gen 2平台 512GB售1799元
该等低价还是直接冲?玩家敲碗Steam纳入「价格追蹤」功能
影石创始人刘靖康再谈“撒钱”争议:的确做的不对,很多人从情感上受到伤害
真我副总裁官宣新款Neo系列 号称“无越级不发布”
化槽点为卖点,这些品牌是懂吸睛的
2025年苹果iOS贡献全球35%移动流量 安卓设备占65%
Xbox玩家实测:删除好友竟能大幅提升游戏流畅度
耐用折叠屏手机推荐:三星GalaxyZ TriFold何以重塑旗舰耐用性标杆?
《哈迪斯新手福音》蓄力大招与战斗诀窍全解析
苹果、高通、联发科9月正面交锋!传三大晶片商首批2奈米SoC同月亮相
这文案,好水水水水水水水啊
神级碎片高效使用指南:战力飙升不是梦!
影之刃3左殇职业材料获取全攻略:从入门到毕业的江湖寻宝之旅
DDR4价格持续暴涨!三星暂缓停产计划 与客户锁定长单
元旦必备!鸿蒙版大众点评全面焕新,本地生活“全能选手”上线!
相关栏目:
【
广告资讯37196 】
【
广告推广143353 】
【
广告优化89630 】