2026 年和 Agent 共同生存的我

此文同样通过口述+AI整理+少量修改完成

2026 年 5 月，我发现自己已经很难想象没有 Agent 的日子了。

不是修辞，不是夸张。是每天醒过来，打开电脑，条件反射地打开豆包语音输入，然后开始口述需求，让 AI 去干活。我已经很久没有自己写过一行代码了——除非偶尔需要直接在命令行里操作一下，觉得打字更快的时候。其他时间，我负责想，AI 负责做。

这种感觉很奇怪。你明明是一个人坐在电脑前，但整个工作流里充满了另一个实体的存在。你说话，它执行。你模糊地描述一个想法，它帮你落地成一个能跑的东西。你说「帮我把这个整理成网站」，它就真的去搭框架、写前端、配 GitHub Pages，然后告诉你点哪个按钮、配哪项设置就部署好了。

你开始觉得这件事无比自然，直到你试图跟别人解释。

从聊天框到工作流：我的 AI 路线

回想起来，这条路线其实挺清晰的。

2022、2023 年，用 ChatGPT 聊天。那时候我更多是「玩」，问问问题，让它写点文字，偶尔让它帮忙写一小段 Python。窗口很小，token 也很贵，每次对话都是一个新的开始，没有记忆，没有连续性。

2024 年，Tab 补全来了。Copilot 开始在你写代码的时候默默推下一行，有时候推得好，有时候推得你想把它关掉。但那个感觉第一次让人觉得「AI 确实可以帮你干活」，虽然干的活还不太大。

2025 年，开始用 Cursor，用一些初步的 Agent 工具。让它帮你调整一段代码，重构一个小模块。能干活，但稍微复杂一点就开始兜圈子，碰壁，消耗你大量时间在纠错上。那时候的结论是：能用，但大的活还是得自己来。

然后到了 2025 年底、2026 年初，事情发生了变化。

AI 的能力突然就发生了井喷。不是某个单一能力的提升，是那种「终于能独立完成一件完整的事情」的感觉来了。它不仅能写代码了，它能去理解你的上下文，去自己调用工具，去规划步骤，去处理中间出错的情况。对应的 harness 也好了一大截——工具链终于跟上了模型的能力。

结果就是：它真的能干活了。

我的一天

现在的我，生活中绝大多数时间都在用豆包语音输入。

不是「偶尔用一下」，是「这就是我的输入方式」。想到什么，说出来，AI 理解、拆解、执行。写代码是这样，写文档是这样，做规划是这样，甚至整理自己的想法也是这样。

我自己几乎没有再自己写过代码。只有在命令行里偶尔手动敲一下，因为有些操作直接敲比口述快那么几秒钟。我主要使用桌面端，因为比命令行更美观，cursor也只在看文件时打开。我给了codex和claude code全部的权限。

工作上的事情：我把常见的 Workflow 整理成了 Skill，AI 可以直接一键触发。想搭一个网站？比如说一个随机看本地照片的网页——我说个大概，它帮我立刻生成。之前还写了一篇博客，讲我用 Claude Code 搓了一个 Mac OS 的语音输入工具。

学习上的事情：让它帮我整理论文，一起想论文的 idea。

生活上的事情：做旅游攻略、写摄影策划案、帮我想怎么处理人际交往。

还有一些事情，是我以前想都不敢想的。

比如我把自己从小到大经历过的、对我影响比较大的事情，尽可能都说出来，倒给 AI，然后让它给我做 mental analysis。不是那种「心理测试」，而是真的把我自己当成一个数据集，让 AI 帮我去看里面有没有什么 pattern、什么线索。这种感觉很奇怪，也很有用。

又比如学新技术栈的时候，我不再满足于整理成 Markdown 笔记——我直接让 AI 调研内容、整理结构、接入框架、做成可视化网站，然后部署到 GitHub Pages 上（有coding和pm两个tutorial）。中间涉及的东西我不全懂：GitHub 的配置我已经很久没碰过了，上一次搞还是搭这个博客的时候，当时是到处找教程、东拼西凑弄出来的。但 AI 直接告诉我：去哪个页面、点什么按钮、配哪一项。我不需要「知道怎么做」，我只需要「跟着做」。但很遗憾的是，我觉得现在 AI 的瓶颈不在于 AI，而在于我。这两个博客我让它写好了以后，我自己其实也只看了一部分。它生成的内容实在太多了。

这种感觉怎么形容呢——以前想做一件事，你要穿越一片森林。现在有一个人在你耳边说：往左走三步，绕过那棵树，就到了。森林还在，但你不用迷路了。

说不出口的 10 倍

然后问题来了。

当我想跟我身边的人说「哇，AI 真的帮我提升了不止 10 倍效率」的时候，我发现除了本专业的同学以外，真的很难传递这种感觉。

甚至我会有一种担心：说出来会不会显得爹味很重。

不是别人不感兴趣，而是这中间有一些实实在在的隔阂，我自己也说不太清楚。

比如 Windows。我发现在 Windows 上配置 AI 工具的体验比 Mac 差很多，很多工具链天然就是 macOS-first 的。光这一步，就劝退了很多人。

比如中转站。对于我来说已经很熟悉的东西，但对大多数人来说，「中转站」三个字就意味着要学习一个新的概念、一个新的支付方式、一个新的配置流程。在你还没尝到甜头之前，为了尝到甜头而付出的那一点努力，可能就足以把人挡住。

比如模型素养。我现在对 Claude 和 GPT 各种模型的文字风格已经很熟悉了，知道什么任务给什么模型、怎么调整 prompt、什么时候换一个模型试试。但这是花了几百个小时用出来的直觉，很难几句话说清楚。

我不知道是别人对 AI 的需求没那么明显，还是我「特别擅长使用」。我分不清这中间的区别。

但我隐隐觉得，这可能不是一个「能力」的问题。更可能是一个「门槛」的问题——你只要跨过去了，就会开始疯狂地用。但跨过去之前的那几步，确实不太好走。

还有一种情况更微妙：有些人不是不想用，而是被 AI 伤过。比如某个 Agent 权限开太大，配的模型又不太行，一个误操作就把重要文件删了。这种事情发生一次，足够让人对整个东西产生不信任。我刚上手的时候其实也遇到过类似的，得先交一点学费，才知道什么能交给它、什么不能。但对于大多数人来说，第一次体验如果就是事故，那后面就很难再走进来了。

AI 不只是写代码

说回我自己。我觉得很多人对 AI 的理解还是窄了。

不止是 coding。AI 能做的事情多到你根本不会去想，直到你试着让它做。

我现在让 AI 帮我做时间规划、帮我做个人决策。因为我发现自己的一个特点：擅长感受各种选择的好处和局限性，但让我去权衡、去排序、去最后拍板，这个能力我其实有点弱。纠结、内耗、空转的时间特别多。

然后 AI 来了。它作为一个第三者帮我去拎一下：你现在比较看重哪些因素？每个因素权重是多少？按这个逻辑，应该选哪个。

不是说 AI 代替我做决定。是它帮我减少内耗。它把那些盘旋在脑子里面的想法都摊开，整理成一张表，然后问我说：「这样看，你觉得呢？」

这种感觉，省去的时间可能不是以分钟计的。

怎么用得好

用了这么久，我觉得用好 AI 有几个关键。

第一，知道边界。 你知道 AI 现在能帮你干什么，不能帮你干什么。擅长什么，不擅长什么。擅长的地方让它去飞，不擅长的地方你手动补上。省掉不必要的中间环节，而不是指望它从头到尾包办一切。

第二，能说清楚。 口述需求的能力、做规划的能力。你哪怕表达不清楚，也要知道用 plan mode 之类的手段先把需求明确下来。AI 听不懂模糊的指令，你让它猜，它就会猜错，然后你就得花更多时间纠错。

第三，Plan mode 和提示技巧。 像 plan mode、苏格拉底追问法——怎么引导 AI 思考，或者让 AI 引导你思考。这些技巧本身就是一种重要的 idea，值得花时间去学。

第四，系统环境。 我不得不说，用 Mac 是最优解。Linux 和 Windows 的支持都有差距，有些工具直接就不支持，有些支持的体验也差一截。这不是平台宗教，这是现实。

第五，权限和安全。 很多人不用 AI，其实是因为被伤过。有些 Agent 权限给太大了，配的又是能力不太行的模型，结果一不小心就把电脑里的东西删了——而且是那种删了就找不回来的。所以我现在一条很明确的实践：删除类的、涉及重要文件的操作，绝对不让能力差的模型碰。要么你自己手动做，要么确保你用的模型足够靠谱。说到底，不是什么模型都配拥有 rm -rf 的权限。

不要把生态绑死在一个模型上

我用 AI 这一年多，最大的感受之一是：模型是会变心的。

大半年前我大量用 Gemini，觉得它性价比高。后来它智商莫名其妙降了一截，不是很符合我期望了。接着 Claude 上来了，语言特别好，我特别爱跟它聊天。又过一阵 GPT 5.5 出了，价格适中、能力也稳，于是我又大量切到 GPT 上去。

这个切换过程不是一次两次，而是常态。AI 现在的竞争实在太激烈了，各家模型的能力此消彼长，今天你强明天我好。如果你把自己的工作方式完全绑在一个模型上，那它一旦变弱你就会被拖着走。

所以我觉得一条很重要的实践是：沉淀你自己的 workspace。

把你的 workflow、常用的 prompt、项目的上下文，都用文档的形式沉淀下来。放在一个固定的目录里，让任何一个 AI 模型打开以后读一遍就能知道你是谁、你在做什么、你习惯怎么做。这样不管你今天用的是 Claude 还是 GPT 还是 DeepSeek，它都能接着往下干活，不需要你从头解释一遍。

这件事的好处是，你把模型切换的成本几乎降到了零。想用 SOTA 模型就用 SOTA 模型——甚至可以先用最强的模型把工作流搭好，日常再用中规中矩的模型去执行。你的知识库是你的，不是哪个模型的。生态可以换，但你的积累丢不了。

钱的事

然后是一个我一直想说的点：花钱。

身边很多同学刚开始接触 AI 的时候，会有一种惯性——以前用豆包、用 ChatGPT 都是免费的，现在你跟我说用一次就要花几毛、几块？

分两个问题讲。

第一个是「怎么付」的问题。 用好的国外模型，要么走官方订阅——容易被封号，支付方式也麻烦。要么走中转站——很多人对中转站这个概念本身就抗拒，觉得麻烦、不安全、不知道什么意思。哪怕现在已经有像 CC Switch 这样比较好的工具，配置过程还是会卡住一些人。这没办法，它就是有学习成本。在你还没尝到甜头之前，这点成本就足以让很多人放弃。

第二个是「值不值」的问题。 我现在的体会是：太值了。

国外模型和国产模型之间，可能有 80 分和 90 分的差距。看起来差距不大，对吧？

但实际用起来不是这么回事。对于简单任务——比如写文书、润色文字——80 分和 90 分确实差别不大。但对于编码这种复杂任务来说，80 分和 90 分本质上就是 0 分和 100 分的区别。80 分的代码就是跑不起来，或者有各种隐藏的 bug。

而且还有 token 消耗的问题。同样完成一个需求，80 分模型可能要调用 10 次工具、来回碰壁，一个 90 分模型可能 1 到 2 轮就搞定了。两者虽然单价差很多，但总 token 消耗差更多，所以最后算下来，价格可能差不了那么多。

所以我现在坚持一个原则：重要的任务，用最好的模型。

我不是钱多烧的。是现在的 AI，只有最好模型配上最好的 harness，才能真正带来指数级的效率提升。

我现在一个月下来，Codx 接 Claude 和 GPT 处理专业任务，Hermes 配 DeepSeek 处理日常事务，全部加起来成本可能就几百块。但考虑到它帮我省下来的时间和精力——每天要做的事情那么多，它帮我砍掉了大量执行层面的消耗——我觉得太值了，真的太值了。

一点隐隐的担忧

但这也让我隐约担心一件事：这种效率提升，是付费才能解锁的。

有钱的同学直接开个 200 刀的 Claude 套餐，力大砖飞，什么事都能干。条件有限的同学呢，用 AI 会比较克制，挑选便宜的模型、折腾中转站、花精力在「怎么省钱」而不是「怎么做事」上。便宜的模型干活又容易有 side effect，到处碰壁，带来额外的精力消耗。

久而久之，各自的使用深度和熟练度就会拉开差距。甚至会有人根本不知道「原来 AI 可以这样用」「原来 Agent 可以这么好用」「原来效率可以提到这个程度」。

不是穷和富的问题，是信息差和使用习惯会慢慢累积成新的鸿沟。

所以我想说：如果你对这件事有兴趣，真的可以搞一个 Codex，读一下教程，接入一个 Codex App 玩玩。网页端的 AI 和本地的 AI，体验差别很大。说不定就打开一个新天地了。

教别人什么

实际跟别人聊的时候，我有一个越来越强的感觉：不用一上来就讲 skill、MCP 这些东西。

不是它们不重要。而是我觉得，skills 这种东西会慢慢地被模型自己吞掉。模型一开始可能需要外挂一些文件去告诉它怎么做某件事，但交互多了以后，它会慢慢把那些东西内化成自己的能力。这是一个此消彼长的过程——skill 的重要性可能会下降，模型本身的通用能力会慢慢覆盖掉原来需要 skill 才能做的事。

而且说真的，这些概念对刚接触的人来说有点远。你不用知道 MCP 是什么、skill 怎么写，照样能用 AI 提升效率。对我来说，现在去教别人的时候更想传递的其实就一件事：你可以用 AI 来帮你干活——有这个 mind 在，就已经能往前走很远了。

至于工具选什么？我觉得对大多数人来说，CodeX 或者 Claude Code 的桌面端，配一个中转站，就是目前最折中、最合适的方案。不用折腾太多配置，开箱就能用好的模型。

程序员没有被取代，只是要求更高了

用了这么久 AI，我反而越来越觉得：程序员远没到被取代的时候。

公司内部的项目代码有多错综复杂，进去看过的人都知道。那些盘根错节的依赖、隐式的业务逻辑、历史上留下的各种坑——这些东西的心智负荷，短期内一定是需要人去承担的。AI 能干具体的活，但它没法替你背负整个系统上下文。

说白了，AI 是在干活，但怎么样决策、怎么样指挥，那是人要自己来的。

所以我觉得这个时代对程序员的要求不是降低了，而是更高了。以前你可能会一些八股文、coding 知识、命令行、开发流程，就能接手一般的项目。现在呢？你不仅要懂这些，还要知道怎么用 AI 来把效率提上去——什么时候用哪个模型、怎么描述需求、怎么把零散的操作串成一个 workflow。

这里面的核心，我觉得是一种新的素养：AI 语言知识。

不是说你要去学 prompt engineering 那一套术语。而是你做任何事情之前，脑子里会先过一下：这件事能不能让 AI 帮我调研一下？能不能先让它出个方案我再看？能不能让它帮我把执行层的东西直接跑完？这个 mindset 一旦有了，整个做事的方式都会变得更高效。

这也是我接下来最想重点培养的东西。coding 的知识是必要的，但已经不是全部了。

写到这里我也不知道这篇文章算不算「说清楚了」。

可能就像文章开头说的：这种感觉已经不太容易讲给别人听了。你只有自己踩进来，才知道水有多深，才知道它不是 hype，不是 demo，不是那种「哇好酷」的三分钟热度。

它是生活方式本身。

2026 年，我和 Agent 一起生存。这话听着有点中二，但就是这个意思。

随想

#随想 #AI #agent #vibe coding #ai coding

2026 年和 Agent 共同生存的我

http://baokker.github.io/2026/05/10/2026-年和-Agent-共同生存的我/

作者

Baokker

发布于

2026年5月10日

更新于

2026年5月10日

许可协议

用 Hermes Agent 写了一个小红书博主分析 skill 下一篇