2026 年，AI 正如何圈占开放网络？

一位银白色头发、红色眼眸沉静的年轻女性，站在一面高耸的等宽代码之墙前，墙在机器那一侧敞开、流动，在人这一侧却封死成一道空白的屏障，雨夜暗处泛着青绿色与红色的霓虹

关于资金：CypherpunkGuide 不投放监控型广告——没有广告网络，没有跟踪像素，也没有软文。运营依靠透明的资金来源：现阶段是读者捐赠，将来会加入订阅以及符合编辑方针的联盟推广。我们面向读者，而非广告主。

开放网络——任何人都能发布、任何人都能顺着链接找到的那张网——这两年被悄悄地围着 AI 重新布了一遍管线。没有人宣布过什么，也没有哪堵墙是一夜砌起来的，变化很容易错过。真正发生的事，写在流量日志里：当 Google 端出 AI 生成的回答，把点击送往站外的搜索占比从约 15% 掉到约 8%（Pew Research，2025）；数千家新闻站点到 2025 年底的一年里，来自搜索的引荐流量掉了约三分之一（Chartbeat 数据，由 Reuters Institute 报告）；而吸走了这份注意力的 AI 工具，送回来的访问只有网页流量的 0.1–0.5%。

所以网络被读得比以往都多——只是读它的不是人，读完也不回到源头。开放网络正在死去吗？这个问题值得停留片刻，因为答案决定了你接下来怎么做：哀悼它，为读它的机器做优化，还是去造一件它们圈不住的东西。”死去”这个词，到头来既太戏剧化，又太让人安心。诚实的诊断要窄得多——它指向建造，而不是怀旧或投降。

说一句我的立场：本站正是按这篇文章最后要推荐的方式发布的——自托管，通过 RSS 和开放社交协议分发，不靠任何单一平台存在。这不是在绕场庆功。这是一次务实的小实验，下文对它的局限会和对它的理由一样坦白。

网络被读得比以往都多——只是读它的不是人
#

变化不在于网络被爬取——它一向被爬取——而在于这一次爬完不再带回一次访问：搜索是一份索引目录，把人引向源头；AI 回答引擎是一处终点，旅程到答案就结束了。全文的论点都在这个区分里，而它很容易被搞错。

把 AI 爬取的纯粹体量当作祸害，是个错误。有些爬虫确实凶猛——一份分析算出，2025 年某个主流 AI 爬虫每带回一名访客，就要抓走两万多个页面——但搜索引擎一向抓得远比它送回来的流量多。抓得多、引荐得少，本是常态，索引就是这样运作的。真正要紧的不是这个比例，而是那条被切断的回路：页面被读了，答案端出去了，读者却从未抵达。

数字把这条断路剥离得很清楚。同一个搜索，有没有 AI 摘要，外链点击相差约一半（从约 15% 降到约 8%），而点开 AI 回答内部引用的用户只有约 1%（Pew Research，2025）。零点击搜索——结束时哪里都没去的那种——在到 2025 年 5 月为止的一年里从约 56% 升到了 69%（Similarweb 数据，经 Search Engine Roundtable）。也得对数据公道：引荐流量整体下滑，是几股力量同时作用的结果——社交平台压制外链、核心算法变动、付费墙、读者转向 App——所以诚实的因果论断，靠”有没有 AI 摘要”这组对照，而不是把每次流失的访问都赖到 AI 头上。

	作为索引目录的网络（搜索）	作为终点的网络（AI 回答）
爬取是为了什么	建索引，把人引向页面	摄取内容，就地合成一段答案
读者得到什么	一串可供访问的源头	一段成品答案；源头可有可无
源头换回什么	一次访问——注意力、订阅者、收入	一条几乎没人点的引用（约 1%）
这笔交易	允许索引，换来被发现	允许摄取，换来约 0.1–0.5% 的引荐

可人们就是在选那个即时答案
#

圈占的故事往往略过一桩难堪事实：大多数人更想要答案，而不是那十条蓝色链接——而他们这么选，并没有错。 任何把读者当成 AI 搜索纯粹受害者的论调，都注定看不懂 AI 搜索为何会赢，也因此很容易被一笑置之。

读者正在离开的那张开放网络，往往让人落地就难受：为搜索优化过的注水文章把答案埋在个人轶事下面，加载时挤来挤去的广告位，Cookie 横幅，订阅弹窗，自动播放的视频。一段把这些全跳过的答案，是日常生活里实打实的改善，不是耍给易受骗者看的把戏。在这一点上诚实，是被人认真对待的代价。

但便利抹不掉随之而来的两件事。第一，那段答案是从别人做的工里拼出来的，而回答引擎既没做那份工，又越来越不为它付费、也不指回去——成本转嫁给了写出底层页面的人，没有任何机制让他们把它收回来。第二，从长远看更具腐蚀性的是那个可持续性悖论：一个把源头饿死的回答框，终将再无新鲜或真实的东西可供概括。到 2025 年中，斯坦福、帝国理工与互联网档案馆的研究者估算，新发布的网站里有 17.6% 完全由 AI 生成——这是大约 35% 由 AI 生成或辅助的网站中的一个子集（由 Gizmodo 报道，2025）；”slop”——AI 大规模生产的低质量内容——被选为 Merriam-Webster 的 2025 年度词。一张越来越多地自己读自己、自己改写自己的网络，是一座镜厅。问题不在于读者想要答案有错，而在于当下这套安排，正在悄悄耗尽一片谁也不来续填的公地。

摆上台面的每一种回应，不是请愿，就是治标
#

眼下摆上桌的几种解法——拦住爬虫、向它们收费、为它们做优化，或是起诉它们——藏着同一个假设：只要说服圈地者、或说服某个新中间人安分守己，掌控权就能回来。每一种就其自身都值得认真对待，而每一种一旦认真对待，都没能把掌控权交还回来。

拦截是本能反应，也是最弱的一招。robots.txt 规则是一句请求，不是一道围栏：它自身没有可靠的法律约束力，财力雄厚的爬虫可以无视它，或者给自己的流量换个标签。最管用的做法是把拦截托付给中间人——Cloudflare 从 2025 年 7 月起对新站点默认拦截 AI 爬虫（Cloudflare）——这确实有效，代价是把那道门挪到了 Cloudflare 那里。

收费是看上去最像解决方案的一种回应，理应给它最有力的陈述。Cloudflare 的”按抓取付费（pay-per-crawl）”市场（2025 年 7 月上线），加上大额授权交易——据报道 Reddit 从 Google 拿到每年约 6000 万美元，News Corp 与 OpenAI 据报签下五年、逾 2.5 亿美元的协议——都不是无足轻重的事。对许多发布者而言，这是机器阅读头一回带来真金白银，是过去只有白白被抓取的地方第一次出现价格信号。麻烦在于结构：按抓取付费在每个站点与每个模型之间装上一座中央收费站，默认了”付钱给守门人就能放行”这条原则，把钱导向少数有议价能力的大发布者，留给独立网络的只是同一种依附的廉价版本。这是带分成的圈占——不妨叫它圈占 2.0——而不是一张发布者能掌控的网络。

为 AI 搜索做优化（即”生成式引擎优化”），是一种已经接受了条款的适应。诉讼是最具体制色彩的路径，确实影响深远：针对 OpenAI 的版权诉讼正在进行——2026 年 1 月，一位法官下令该公司提交两千万条 ChatGPT 日志（National Law Review）；英国竞争监管机构现在允许发布者退出 Google 的 AI 摘要（Press Gazette，2026）；EU AI Act 余下的透明度义务，包括 AI 生成内容的披露规则，将在 2026 年 8 月进入执法阶段。这些都很重要，下一节并非要反对它们。但它们慢，受辖区所限，结果难料——而且每一种都是在请求某个机构授予某样东西，密码朋克早就说过，机构不会出于善意把这样东西给你。

回应	它实际在做什么	诚实的好处	为何它仍是一场请愿
robots.txt 拦截	客气地请爬虫别读	免费、简单，信誉好的爬虫普遍会遵守	单凭它没有法律约束力；凶悍的爬虫会无视它或换标签
按抓取付费／授权	经由 CDN 或交易向机器收费	头一笔真金白银的补偿；一个价格信号	装上新的中央收费站；默认“付钱就放行”；偏袒既得利益者
AI 搜索优化	把内容裁剪成答案框要的样子	在圈占里换来一点曝光	接受了条款；你现在是在为守门人做优化
版权诉讼	为训练／使用提起诉讼	可能重塑授权与披露规则	慢，受辖区所限，结果难料；是在请求机构授予掌控权

开放网络其实早已被圈占过一次——这恰恰是关键所在
#

在哀悼开放网络之前，值得承认它早已被圈占过一回：长达十五年，大多数的”被发现”都经由一个搜索框，大多数的钱都经由一家广告交易所。 AI 没有把一片自由的公地铺出来。它是第二次圈占，正在拿走第一次圈占留给发布者的那一点慰藉——那次引荐来的访问。

这处订正很要紧，因为它能杀死怀旧，而怀旧正是陷阱。目标从来不是恢复 Google 时代的那张网——那本就是别人的收费公路。更有用的那条训诫更古老，早在 1993 年就写下来了：隐私——后来才发现，开放性也一样——不是你向机构请愿来求它授予的东西，因为靠某个机构善意撑着的隐私，机构随时可以收回。密码朋克的结论是把这份保证内建进一套机制里——这正是《密码朋克宣言》的论点，如今被用到了网络本身，而不仅仅是用在传输中的消息上。

最早看清这副形状的人是 Richard Stallman。他 1997 年的故事《阅读的权利》（The Right to Read）设想了一个不远的将来：阅读被按次计费，对文本的获取由拥有那套软件的人掌控——这恰好可以描述这样一张网络：阅读越来越多地不经由你打开的页面，而是经由你查询的某项服务。他对这类服务的反对是精准的，不只是修辞。他论证说，在别人的服务器上做自己的计算”从根本上摧毁了你的计算自由”，因为你拿不到一份托管式 AI 的副本自己跑起来，唯一能用它的方式就是在一台你掌控不了的机器上用。在可靠性上他更是直言不讳——他拒绝把它叫作智能，宁愿称它为 “bullshit generator”（胡话生成器），用他的话说，这是一套”对真假漠不关心地生成输出”的系统。你不必采纳这套激辩，也能保留那个结构性要点，也就是密码朋克的那个要点：一种你跑不动、看不进去、也分叉不了的能力，是攥在别人手里的能力。

“靠某个机构善意撑着的隐私，是机构随时可以收回的隐私。”如今，这话对获取、对“被发现”、对阅读，同样成立。它们当中任何一样，要想经得起时间，就必须成为一套机制的属性，而不是一句承诺。

一条诚实的主权网络复兴路径
#

这条建设性的答案，不是叫你明天就退出主流网络——几乎没人做得到——而是搭一层平行的网络，它的开放性无须任何一家公司点头，从你怎么读，到你怎么发布。这跟寻常那句”去用去中心化网络就好”的劝告不同：它把局限和工具讲得一样直白。

读得有主权先来，因为这是较容易的那一半：

用 RSS 直接订阅源头——这是开放网络幸存下来的那套循环系统。它是你自己掌控的信息流，没有算法替你决定看什么，也没有互动指标在塑造什么东西会被写出来；随着读者寻找出口逃离算法信息流，对它的兴趣正再度回升。
通过 Tor Browser 阅读，以无中介的方式访问网络和 onion 服务。这不是边缘选项：纽约时报、卫报与明镜周刊都为线人运行着 onion 服务。
用本地的、开放权重的模型回答自己的问题——这一步是大多数”万物去中心化”指南都跳过的。如果允许读你数据的唯一智能是跑在别人 GPU 上的前沿模型，那去中心化数据改变不了多少——而那里，如今聚着真正的权力集中。在你自己挑选的索引和信息流上本地跑一个更小的模型，才是让阅读真正有主权、而非只是换了个地方寄放的关键。对模型的主权，和对数据的主权一样要紧。

发布得有主权是较难的那一半，也是更要紧的那一半：

在便宜的虚拟服务器上自托管——一个没有平台能删掉的家。
通过 RSS 和开放社交协议分发——Nostr 与 Fediverse 的 ActivityPub——在那里，你与受众之间的关系，不是某个平台说收回就能收回的。
提供一个 onion 镜像，以防读者需要从不友善的地方来找你。

这一切都有摩擦，假装没有正是过去十年”掌控你自己的平台”这类劝告失去公信力的原因。把局限直白说出来：Fediverse 大约是每月一两百万活跃用户的量级，不是十亿；它是一座城镇，不是一片大陆。IPFS 用实打实的延迟和陡峭的学习曲线换它那份抗审查。自托管首先是时间和技能的特权。这些当中没有一样能替代主流搜索或大型社交平台的触达，谁要是告诉你大迁徙近在眼前，那他多半在卖什么东西。

正因如此，搭起这一层并不能取代政治。反垄断执法、法定授权、英国监管机构刚争来的退出权、公共利益导向的搜索索引、数据信托——这一切都值得去争，代码替代不了其中任何一样。主权网络是那场抗争脚下的地板：当法律迟缓或被俘获时，仍稳得住的那样东西，让你在那段日子里不至于束手无策。密码朋克的主张从来不是说软件能替代集体行动，而是说，你能自己跑起来的权利，并不取决于先把政治这场仗打赢。

这件事在我们这里不是空谈。本站自托管，发到 Nostr 和 Fediverse，无须任何平台许可就能抵达；我们每天在服务器日志里看着会自报身份的 AI 爬虫到来，正如我们在宣言导读里写过的那样。诚实的汇报是：主权网络是一处可以立足的地方，还不是一处能取胜的地方——比我们纯粹为答案框做优化时更小、也更难被找到。把我们自己的利益也摊开来说：一个独立站点被 AI 回答引用是能获益的，我们并不反对这一点。要点不在于拒绝那些机器，而在于拒绝对一条公司说关就能关的渠道的依赖。要做到可被引用；不要被俘获。同一套逻辑贯穿了我们关于 AI 量级监控的其余工作——从《AI 时代的威胁模型》，到《足迹的顽固》里讲的”删除再也够不着模型训练数据”——也贯穿了那些正立在网络门口的身份关卡，见《年龄验证之争》。

层	这一步怎么走	它给你什么	诚实的局限
读——信息流	一个你自己掌控的 RSS 阅读器	没有算法、没有指标的“被发现”	得你自己来策展；没有制造偶遇的引擎
读——访问	Tor Browser + onion 服务	无中介、抗审查的阅读	更慢；有些站点会错待 Tor 流量
读——智能	本地的、开放权重的模型	来自你自己跑的软件、而非一项有日志的服务的答案	比前沿模型更小、更弱
发布——托管	在便宜的 VPS 上自托管	一个没有平台能删掉的家	时间、技能与维护都得你自己扛
发布——触达	Nostr + Fediverse + RSS	一份没有平台拥有的受众纽带	约一两百万活跃的量级，不是大众触达

结语——去建造，别去请愿
#

开放网络不是死于自然原因，而是在被第二次圈占；最诚实的回应，既不是怀旧，也不是适应，而是建造。 搜索是第一次圈占；AI 回答框是第二次，拿走了第一次留下来的那次引荐访问。读者是真的更想要答案，这恰恰是为什么源头那张网络必须以可持续性和主权、而非以情感为由来守护。摆上台面的请愿与治标——拦截、收费、优化、起诉——每一种都留着一个守门人当家。更古老的那条训诫才经得起时间：把开放性内建进谁也收不回的机制里——模型与数据都要——把这件事当作法律与集体行动脚下的地板，而不是它们的替代品。它今年不会在规模上压过答案框。但当那些墙砌完时，它仍是一处可以立足的地方。

要点

祸害是那条断掉的回路，不是爬取本身： 有了 AI 摘要，外链点击大致减半（从约 15% 到约 8%），而点开 AI 回答内部引用的只有约 1% 的人。
这是第二次圈占： AI 出现之前的网络就已经经由一个搜索框和一家广告交易所运转，所以目标不是对 Google 时代的怀旧，而是把开放性内建进谁也收不回的机制里。
读者更想要答案，并没有错——但一个把自己源头饿死的回答框，会撞上可持续性悖论：到 2025 年中，已有约 17.6% 的新站点完全由 AI 生成。
每一种主流解法都留着一个守门人当家： robots.txt 单凭自己没有法律约束力，按抓取付费装上一座中央收费站，优化接受了条款，诉讼又慢又受辖区所限。
主权需要的是模型，不只是数据： 当唯一的智能是别人 GPU 上的前沿模型，把内容去中心化改变不了多少——本地的、开放权重的模型，才是让阅读真正有主权而非只是换了个地方寄放的关键。

常见问题
#

AI 是真的在合上开放网络，还是只是在改变它？
#

两者都有，但准确的论断比”网络正在死去”要窄。网络内容对机器比以往都更容易获取；正在合上的，是通回人、通回生产了这些内容的站点的那条路。有了 AI 回答，外链点击大致减半，而吸走注意力的那些 AI 工具，只送回约 0.1–0.5% 的网页流量。网络被读得比以往都多——只是读它的不是人，读完不会回到源头。”圈占”比”死亡”更贴切：公地还在，但通往它价值的那条路，正被围起来、按次计费。

什么是”按抓取付费”，它能解决问题吗？
#

按抓取付费是一套系统——Cloudflare 于 2025 年 7 月为它上线了市场——让站点向 AI 爬虫收费放行，而不是直接拦截，同时还有大发布者与 AI 公司之间的直接授权交易。比起无偿抓取，这是实打实的改善，也是许多发布者头一回为机器阅读见到钱。但它没有把网络的掌控权交还给发布者：它在每个站点与每个模型之间装上中央收费站，默认了”付钱给守门人就能放行”这条原则，且偏袒有议价能力的大发布者。这是带分成的圈占，不是一张开放的网络。

我该用 robots.txt 拦住 AI 爬虫吗？
#

可以，信誉好的爬虫通常会遵守，但要明白它是什么：一句请求，不是一道围栏。robots.txt 指令单凭自己没有可靠的法律约束力，凶悍的或换了标签的爬虫可以无视它。拦截还会把被真正读到的回答引用的机会一并放弃。比”拦还是放”更经得起时间的姿态，是不再依赖任何一条你掌控不了的单一渠道——发布在你与受众的纽带无法被收回的地方，把爬虫策略当作战术，而不是战略。

现实地看，”主权网络”到底是什么？
#

是一组读与发布的方式，不取决于任何一家公司的许可：用 RSS 订阅信息流，用 Tor 和 onion 服务访问，用本地跑的开放权重模型回答问题，用自托管加开放社交协议（Nostr、Fediverse）发布。现实地看，它今天还很小众——Fediverse 大约是每月一两百万活跃用户，自托管要花时间和技能，IPFS 拿延迟换抗审查。它今年不会替代主流搜索或社交。它的价值在于做一套有韧性的平行基础设施——一处可以立足的地方——而不是一个做好了的替代品。

我必须懂技术，才能逃离那张答案框网络吗？
#

不必，至少起步时不必。最省力、回报最高的一步，是把你读的方式夺回来：装一个 RSS 阅读器，直接订阅源头，让算法和答案框不再替你决定什么能抵达你。Tor Browser 是一键下载，用于无中介访问。更技术的那几步——本地跑一个模型、自托管、提供 onion 镜像——是一架你可以随时间往上爬的梯子，不是前提条件。这条原则不需要写代码：优先选开放性内建于设计的工具和协议，而不是那些只是承诺会好好表现的服务。

#	来源	URL	存档
1	Pew Research — clicks fall when an AI summary appears (2025)	https://www.pewresearch.org/short-reads/2025/07/22/google-users-are-less-likely-to-click-on-links-when-an-ai-summary-appears-in-the-results/	https://web.archive.org/web/2025/https://www.pewresearch.org/short-reads/2025/07/22/google-users-are-less-likely-to-click-on-links-when-an-ai-summary-appears-in-the-results/
2	Reuters Institute — Journalism Trends 2026 (Chartbeat ~one-third referral decline)	https://reutersinstitute.politics.ox.ac.uk/journalism-media-and-technology-trends-and-predictions-2026	https://web.archive.org/web/2026/https://reutersinstitute.politics.ox.ac.uk/journalism-media-and-technology-trends-and-predictions-2026
3	Search Engine Roundtable — Similarweb zero-click 56%→69%	https://www.seroundtable.com/similarweb-google-zero-click-search-growth-39706.html	https://web.archive.org/web/2025/https://www.seroundtable.com/similarweb-google-zero-click-search-growth-39706.html
4	Cloudflare — controlling content use for AI training (July 2025)	https://blog.cloudflare.com/control-content-use-for-ai-training/	https://web.archive.org/web/2025/https://blog.cloudflare.com/control-content-use-for-ai-training/
5	Cloudflare — Pay Per Crawl changelog (2025-07-01)	https://developers.cloudflare.com/changelog/2025-07-01-pay-per-crawl/	https://web.archive.org/web/2025/https://developers.cloudflare.com/changelog/2025-07-01-pay-per-crawl/
6	The Decoder — Reddit–Google AI training deal (~$60M/yr)	https://the-decoder.com/reddit-signs-60-million-annual-training-data-deal-with-google/	https://web.archive.org/web/2024/https://the-decoder.com/reddit-signs-60-million-annual-training-data-deal-with-google/
7	Variety — News Corp–OpenAI licensing deal	https://variety.com/2024/digital/news/news-corp-openai-licensing-deal-1236013734/	https://web.archive.org/web/2024/https://variety.com/2024/digital/news/news-corp-openai-licensing-deal-1236013734/
8	Gizmodo — 17.6% of new sites entirely AI-generated (Stanford/Imperial/Internet Archive)	https://gizmodo.com/dead-internet-theory-is-17-of-the-way-to-becoming-reality-study-finds-2000751718	https://web.archive.org/web/2025/https://gizmodo.com/dead-internet-theory-is-17-of-the-way-to-becoming-reality-study-finds-2000751718
9	Merriam-Webster — Word of the Year 2025 (“slop”)	https://www.merriam-webster.com/wordplay/word-of-the-year	https://web.archive.org/web/20251201000000*/https://www.merriam-webster.com/wordplay/word-of-the-year
10	National Law Review — court orders 20M ChatGPT logs (Jan 2026)	https://natlawreview.com/article/openai-loses-privacy-gambit-20-million-chatgpt-logs-likely-headed-copyright	https://web.archive.org/web/2026/https://natlawreview.com/article/openai-loses-privacy-gambit-20-million-chatgpt-logs-likely-headed-copyright
11	Press Gazette — UK CMA publisher opt-out from AI summaries (Jan 2026)	https://pressgazette.co.uk/platforms/google-regulation-uk/	https://web.archive.org/web/2026/https://pressgazette.co.uk/platforms/google-regulation-uk/
12	GNU Project — Richard Stallman, The Right to Read (1997)	https://www.gnu.org/philosophy/right-to-read.en.html	https://web.archive.org/web/2025/https://www.gnu.org/philosophy/right-to-read.en.html
13	stallman.org — Reasons not to use ChatGPT	https://stallman.org/chatgpt.html	https://web.archive.org/web/2025/https://stallman.org/chatgpt.html
14	Tor Project — official site / onion services	https://www.torproject.org/	https://web.archive.org/web/2025/https://www.torproject.org/

网络被读得比以往都多——只是读它的不是人#

可人们就是在选那个即时答案#

摆上台面的每一种回应，不是请愿，就是治标#

开放网络其实早已被圈占过一次——这恰恰是关键所在#

一条诚实的主权网络复兴路径#

结语——去建造，别去请愿#

常见问题#

AI 是真的在合上开放网络，还是只是在改变它？#

什么是”按抓取付费”，它能解决问题吗？#

我该用 robots.txt 拦住 AI 爬虫吗？#

现实地看，”主权网络”到底是什么？#

我必须懂技术，才能逃离那张答案框网络吗？#

相关文章