2026 年和 Agent 共同生存的我

此文同样通过口述+AI整理+少量修改完成
2026 年 5 月,我发现自己已经很难想象没有 Agent 的日子了。
不是修辞,不是夸张。是每天醒过来,打开电脑,条件反射地打开豆包语音输入,然后开始口述需求,让 AI 去干活。我已经很久没有自己写过一行代码了——除非偶尔需要直接在命令行里操作一下,觉得打字更快的时候。其他时间,我负责想,AI 负责做。
这种感觉很奇怪。你明明是一个人坐在电脑前,但整个工作流里充满了另一个实体的存在。你说话,它执行。你模糊地描述一个想法,它帮你落地成一个能跑的东西。你说「帮我把这个整理成网站」,它就真的去搭框架、写前端、配 GitHub Pages,然后告诉你点哪个按钮、配哪项设置就部署好了。
你开始觉得这件事无比自然,直到你试图跟别人解释。
从聊天框到工作流:我的 AI 路线
回想起来,这条路线其实挺清晰的。
2022、2023 年,用 ChatGPT 聊天。那时候我更多是「玩」,问问问题,让它写点文字,偶尔让它帮忙写一小段 Python。窗口很小,token 也很贵,每次对话都是一个新的开始,没有记忆,没有连续性。
2024 年,Tab 补全来了。Copilot 开始在你写代码的时候默默推下一行,有时候推得好,有时候推得你想把它关掉。但那个感觉第一次让人觉得「AI 确实可以帮你干活」,虽然干的活还不太大。
2025 年,开始用 Cursor,用一些初步的 Agent 工具。让它帮你调整一段代码,重构一个小模块。能干活,但稍微复杂一点就开始兜圈子,碰壁,消耗你大量时间在纠错上。那时候的结论是:能用,但大的活还是得自己来。
然后到了 2025 年底、2026 年初,事情发生了变化。
AI 的能力突然就发生了井喷。不是某个单一能力的提升,是那种「终于能独立完成一件完整的事情」的感觉来了。它不仅能写代码了,它能去理解你的上下文,去自己调用工具,去规划步骤,去处理中间出错的情况。对应的 harness 也好了一大截——工具链终于跟上了模型的能力。
结果就是:它真的能干活了。
我的一天
现在的我,生活中绝大多数时间都在用豆包语音输入。
不是「偶尔用一下」,是「这就是我的输入方式」。想到什么,说出来,AI 理解、拆解、执行。写代码是这样,写文档是这样,做规划是这样,甚至整理自己的想法也是这样。
我自己几乎没有再自己写过代码。只有在命令行里偶尔手动敲一下,因为有些操作直接敲比口述快那么几秒钟。我主要使用桌面端,因为比命令行更美观,cursor也只在看文件时打开。我给了codex和claude code全部的权限。

工作上的事情:我把常见的 Workflow 整理成了 Skill,AI 可以直接一键触发。想搭一个网站?比如说一个随机看本地照片的网页——我说个大概,它帮我立刻生成。之前还写了一篇博客,讲我用 Claude Code 搓了一个 Mac OS 的语音输入工具。
学习上的事情:让它帮我整理论文,一起想论文的 idea。
生活上的事情:做旅游攻略、写摄影策划案、帮我想怎么处理人际交往。
还有一些事情,是我以前想都不敢想的。
比如我把自己从小到大经历过的、对我影响比较大的事情,尽可能都说出来,倒给 AI,然后让它给我做 mental analysis。不是那种「心理测试」,而是真的把我自己当成一个数据集,让 AI 帮我去看里面有没有什么 pattern、什么线索。这种感觉很奇怪,也很有用。
又比如学新技术栈的时候,我不再满足于整理成 Markdown 笔记——我直接让 AI 调研内容、整理结构、接入框架、做成可视化网站,然后部署到 GitHub Pages 上(有coding和pm两个tutorial)。中间涉及的东西我不全懂:GitHub 的配置我已经很久没碰过了,上一次搞还是搭这个博客的时候,当时是到处找教程、东拼西凑弄出来的。但 AI 直接告诉我:去哪个页面、点什么按钮、配哪一项。我不需要「知道怎么做」,我只需要「跟着做」。但很遗憾的是,我觉得现在 AI 的瓶颈不在于 AI,而在于我。这两个博客我让它写好了以后,我自己其实也只看了一部分。它生成的内容实在太多了。
这种感觉怎么形容呢——以前想做一件事,你要穿越一片森林。现在有一个人在你耳边说:往左走三步,绕过那棵树,就到了。森林还在,但你不用迷路了。
说不出口的 10 倍
然后问题来了。
当我想跟我身边的人说「哇,AI 真的帮我提升了不止 10 倍效率」的时候,我发现除了本专业的同学以外,真的很难传递这种感觉。
甚至我会有一种担心:说出来会不会显得爹味很重。
不是别人不感兴趣,而是这中间有一些实实在在的隔阂,我自己也说不太清楚。
比如 Windows。我发现在 Windows 上配置 AI 工具的体验比 Mac 差很多,很多工具链天然就是 macOS-first 的。光这一步,就劝退了很多人。

比如中转站。对于我来说已经很熟悉的东西,但对大多数人来说,「中转站」三个字就意味着要学习一个新的概念、一个新的支付方式、一个新的配置流程。在你还没尝到甜头之前,为了尝到甜头而付出的那一点努力,可能就足以把人挡住。
比如模型素养。我现在对 Claude 和 GPT 各种模型的文字风格已经很熟悉了,知道什么任务给什么模型、怎么调整 prompt、什么时候换一个模型试试。但这是花了几百个小时用出来的直觉,很难几句话说清楚。
我不知道是别人对 AI 的需求没那么明显,还是我「特别擅长使用」。我分不清这中间的区别。
但我隐隐觉得,这可能不是一个「能力」的问题。更可能是一个「门槛」的问题——你只要跨过去了,就会开始疯狂地用。但跨过去之前的那几步,确实不太好走。
还有一种情况更微妙:有些人不是不想用,而是被 AI 伤过。比如某个 Agent 权限开太大,配的模型又不太行,一个误操作就把重要文件删了。这种事情发生一次,足够让人对整个东西产生不信任。我刚上手的时候其实也遇到过类似的,得先交一点学费,才知道什么能交给它、什么不能。但对于大多数人来说,第一次体验如果就是事故,那后面就很难再走进来了。
AI 不只是写代码
说回我自己。我觉得很多人对 AI 的理解还是窄了。
不止是 coding。AI 能做的事情多到你根本不会去想,直到你试着让它做。
我现在让 AI 帮我做时间规划、帮我做个人决策。因为我发现自己的一个特点:擅长感受各种选择的好处和局限性,但让我去权衡、去排序、去最后拍板,这个能力我其实有点弱。纠结、内耗、空转的时间特别多。
然后 AI 来了。它作为一个第三者帮我去拎一下:你现在比较看重哪些因素?每个因素权重是多少?按这个逻辑,应该选哪个。
不是说 AI 代替我做决定。是它帮我减少内耗。它把那些盘旋在脑子里面的想法都摊开,整理成一张表,然后问我说:「这样看,你觉得呢?」
这种感觉,省去的时间可能不是以分钟计的。
怎么用得好
用了这么久,我觉得用好 AI 有几个关键。
第一,知道边界。 你知道 AI 现在能帮你干什么,不能帮你干什么。擅长什么,不擅长什么。擅长的地方让它去飞,不擅长的地方你手动补上。省掉不必要的中间环节,而不是指望它从头到尾包办一切。
第二,能说清楚。 口述需求的能力、做规划的能力。你哪怕表达不清楚,也要知道用 plan mode 之类的手段先把需求明确下来。AI 听不懂模糊的指令,你让它猜,它就会猜错,然后你就得花更多时间纠错。
第三,Plan mode 和提示技巧。 像 plan mode、苏格拉底追问法——怎么引导 AI 思考,或者让 AI 引导你思考。这些技巧本身就是一种重要的 idea,值得花时间去学。
第四,系统环境。 我不得不说,用 Mac 是最优解。Linux 和 Windows 的支持都有差距,有些工具直接就不支持,有些支持的体验也差一截。这不是平台宗教,这是现实。
第五,权限和安全。 很多人不用 AI,其实是因为被伤过。有些 Agent 权限给太大了,配的又是能力不太行的模型,结果一不小心就把电脑里的东西删了——而且是那种删了就找不回来的。所以我现在一条很明确的实践:删除类的、涉及重要文件的操作,绝对不让能力差的模型碰。要么你自己手动做,要么确保你用的模型足够靠谱。说到底,不是什么模型都配拥有 rm -rf 的权限。
不要把生态绑死在一个模型上
我用 AI 这一年多,最大的感受之一是:模型是会变心的。
大半年前我大量用 Gemini,觉得它性价比高。后来它智商莫名其妙降了一截,不是很符合我期望了。接着 Claude 上来了,语言特别好,我特别爱跟它聊天。又过一阵 GPT 5.5 出了,价格适中、能力也稳,于是我又大量切到 GPT 上去。
这个切换过程不是一次两次,而是常态。AI 现在的竞争实在太激烈了,各家模型的能力此消彼长,今天你强明天我好。如果你把自己的工作方式完全绑在一个模型上,那它一旦变弱你就会被拖着走。
所以我觉得一条很重要的实践是:沉淀你自己的 workspace。
把你的 workflow、常用的 prompt、项目的上下文,都用文档的形式沉淀下来。放在一个固定的目录里,让任何一个 AI 模型打开以后读一遍就能知道你是谁、你在做什么、你习惯怎么做。这样不管你今天用的是 Claude 还是 GPT 还是 DeepSeek,它都能接着往下干活,不需要你从头解释一遍。
这件事的好处是,你把模型切换的成本几乎降到了零。想用 SOTA 模型就用 SOTA 模型——甚至可以先用最强的模型把工作流搭好,日常再用中规中矩的模型去执行。你的知识库是你的,不是哪个模型的。生态可以换,但你的积累丢不了。
钱的事
然后是一个我一直想说的点:花钱。
身边很多同学刚开始接触 AI 的时候,会有一种惯性——以前用豆包、用 ChatGPT 都是免费的,现在你跟我说用一次就要花几毛、几块?
分两个问题讲。
第一个是「怎么付」的问题。 用好的国外模型,要么走官方订阅——容易被封号,支付方式也麻烦。要么走中转站——很多人对中转站这个概念本身就抗拒,觉得麻烦、不安全、不知道什么意思。哪怕现在已经有像 CC Switch 这样比较好的工具,配置过程还是会卡住一些人。这没办法,它就是有学习成本。在你还没尝到甜头之前,这点成本就足以让很多人放弃。
第二个是「值不值」的问题。 我现在的体会是:太值了。
国外模型和国产模型之间,可能有 80 分和 90 分的差距。看起来差距不大,对吧?
但实际用起来不是这么回事。对于简单任务——比如写文书、润色文字——80 分和 90 分确实差别不大。但对于编码这种复杂任务来说,80 分和 90 分本质上就是 0 分和 100 分的区别。80 分的代码就是跑不起来,或者有各种隐藏的 bug。
而且还有 token 消耗的问题。同样完成一个需求,80 分模型可能要调用 10 次工具、来回碰壁,一个 90 分模型可能 1 到 2 轮就搞定了。两者虽然单价差很多,但总 token 消耗差更多,所以最后算下来,价格可能差不了那么多。
所以我现在坚持一个原则:重要的任务,用最好的模型。
我不是钱多烧的。是现在的 AI,只有最好模型配上最好的 harness,才能真正带来指数级的效率提升。
我现在一个月下来,Codx 接 Claude 和 GPT 处理专业任务,Hermes 配 DeepSeek 处理日常事务,全部加起来成本可能就几百块。但考虑到它帮我省下来的时间和精力——每天要做的事情那么多,它帮我砍掉了大量执行层面的消耗——我觉得太值了,真的太值了。
一点隐隐的担忧
但这也让我隐约担心一件事:这种效率提升,是付费才能解锁的。
有钱的同学直接开个 200 刀的 Claude 套餐,力大砖飞,什么事都能干。条件有限的同学呢,用 AI 会比较克制,挑选便宜的模型、折腾中转站、花精力在「怎么省钱」而不是「怎么做事」上。便宜的模型干活又容易有 side effect,到处碰壁,带来额外的精力消耗。
久而久之,各自的使用深度和熟练度就会拉开差距。甚至会有人根本不知道「原来 AI 可以这样用」「原来 Agent 可以这么好用」「原来效率可以提到这个程度」。
不是穷和富的问题,是信息差和使用习惯会慢慢累积成新的鸿沟。
所以我想说:如果你对这件事有兴趣,真的可以搞一个 Codex,读一下教程,接入一个 Codex App 玩玩。网页端的 AI 和本地的 AI,体验差别很大。说不定就打开一个新天地了。
教别人什么
实际跟别人聊的时候,我有一个越来越强的感觉:不用一上来就讲 skill、MCP 这些东西。
不是它们不重要。而是我觉得,skills 这种东西会慢慢地被模型自己吞掉。模型一开始可能需要外挂一些文件去告诉它怎么做某件事,但交互多了以后,它会慢慢把那些东西内化成自己的能力。这是一个此消彼长的过程——skill 的重要性可能会下降,模型本身的通用能力会慢慢覆盖掉原来需要 skill 才能做的事。
而且说真的,这些概念对刚接触的人来说有点远。你不用知道 MCP 是什么、skill 怎么写,照样能用 AI 提升效率。对我来说,现在去教别人的时候更想传递的其实就一件事:你可以用 AI 来帮你干活——有这个 mind 在,就已经能往前走很远了。
至于工具选什么?我觉得对大多数人来说,CodeX 或者 Claude Code 的桌面端,配一个中转站,就是目前最折中、最合适的方案。不用折腾太多配置,开箱就能用好的模型。
程序员没有被取代,只是要求更高了
用了这么久 AI,我反而越来越觉得:程序员远没到被取代的时候。
公司内部的项目代码有多错综复杂,进去看过的人都知道。那些盘根错节的依赖、隐式的业务逻辑、历史上留下的各种坑——这些东西的心智负荷,短期内一定是需要人去承担的。AI 能干具体的活,但它没法替你背负整个系统上下文。
说白了,AI 是在干活,但怎么样决策、怎么样指挥,那是人要自己来的。
所以我觉得这个时代对程序员的要求不是降低了,而是更高了。以前你可能会一些八股文、coding 知识、命令行、开发流程,就能接手一般的项目。现在呢?你不仅要懂这些,还要知道怎么用 AI 来把效率提上去——什么时候用哪个模型、怎么描述需求、怎么把零散的操作串成一个 workflow。
这里面的核心,我觉得是一种新的素养:AI 语言知识。
不是说你要去学 prompt engineering 那一套术语。而是你做任何事情之前,脑子里会先过一下:这件事能不能让 AI 帮我调研一下?能不能先让它出个方案我再看?能不能让它帮我把执行层的东西直接跑完?这个 mindset 一旦有了,整个做事的方式都会变得更高效。
这也是我接下来最想重点培养的东西。coding 的知识是必要的,但已经不是全部了。
写到这里我也不知道这篇文章算不算「说清楚了」。
可能就像文章开头说的:这种感觉已经不太容易讲给别人听了。你只有自己踩进来,才知道水有多深,才知道它不是 hype,不是 demo,不是那种「哇好酷」的三分钟热度。
它是生活方式本身。
2026 年,我和 Agent 一起生存。这话听着有点中二,但就是这个意思。