
关于资金:CypherpunkGuide 不投放监控型广告——没有广告网络,没有跟踪像素,也没有软文。运营依靠透明的资金来源:现阶段是读者捐赠,将来会加入订阅以及符合编辑方针的联盟推广。我们面向读者,而非广告主。
开放网络——任何人都能发布、任何人都能顺着链接找到的那张网——这两年被悄悄地围着 AI 重新布了一遍管线。没有人宣布过什么,也没有哪堵墙是一夜砌起来的,变化很容易错过。真正发生的事,写在流量日志里:当 Google 端出 AI 生成的回答,把点击送往站外的搜索占比从约 15% 掉到约 8%(Pew Research,2025);数千家新闻站点到 2025 年底的一年里,来自搜索的引荐流量掉了约三分之一(Chartbeat 数据,由 Reuters Institute 报告);而吸走了这份注意力的 AI 工具,送回来的访问只有网页流量的 0.1–0.5%。
所以网络被读得比以往都多——只是读它的不是人,读完也不回到源头。开放网络正在死去吗?这个问题值得停留片刻,因为答案决定了你接下来怎么做:哀悼它,为读它的机器做优化,还是去造一件它们圈不住的东西。”死去”这个词,到头来既太戏剧化,又太让人安心。诚实的诊断要窄得多——它指向建造,而不是怀旧或投降。
说一句我的立场:本站正是按这篇文章最后要推荐的方式发布的——自托管,通过 RSS 和开放社交协议分发,不靠任何单一平台存在。这不是在绕场庆功。这是一次务实的小实验,下文对它的局限会和对它的理由一样坦白。
网络被读得比以往都多——只是读它的不是人#
变化不在于网络被爬取——它一向被爬取——而在于这一次爬完不再带回一次访问:搜索是一份索引目录,把人引向源头;AI 回答引擎是一处终点,旅程到答案就结束了。 全文的论点都在这个区分里,而它很容易被搞错。
把 AI 爬取的纯粹体量当作祸害,是个错误。有些爬虫确实凶猛——一份分析算出,2025 年某个主流 AI 爬虫每带回一名访客,就要抓走两万多个页面——但搜索引擎一向抓得远比它送回来的流量多。抓得多、引荐得少,本是常态,索引就是这样运作的。真正要紧的不是这个比例,而是那条被切断的回路:页面被读了,答案端出去了,读者却从未抵达。
数字把这条断路剥离得很清楚。同一个搜索,有没有 AI 摘要,外链点击相差约一半(从约 15% 降到约 8%),而点开 AI 回答内部引用的用户只有约 1%(Pew Research,2025)。零点击搜索——结束时哪里都没去的那种——在到 2025 年 5 月为止的一年里从约 56% 升到了 69%(Similarweb 数据,经 Search Engine Roundtable)。也得对数据公道:引荐流量整体下滑,是几股力量同时作用的结果——社交平台压制外链、核心算法变动、付费墙、读者转向 App——所以诚实的因果论断,靠”有没有 AI 摘要”这组对照,而不是把每次流失的访问都赖到 AI 头上。
| 作为索引目录的网络(搜索) | 作为终点的网络(AI 回答) | |
|---|---|---|
| 爬取是为了什么 | 建索引,把人引向页面 | 摄取内容,就地合成一段答案 |
| 读者得到什么 | 一串可供访问的源头 | 一段成品答案;源头可有可无 |
| 源头换回什么 | 一次访问——注意力、订阅者、收入 | 一条几乎没人点的引用(约 1%) |
| 这笔交易 | 允许索引,换来被发现 | 允许摄取,换来约 0.1–0.5% 的引荐 |
可人们就是在选那个即时答案#
圈占的故事往往略过一桩难堪事实:大多数人更想要答案,而不是那十条蓝色链接——而他们这么选,并没有错。 任何把读者当成 AI 搜索纯粹受害者的论调,都注定看不懂 AI 搜索为何会赢,也因此很容易被一笑置之。
读者正在离开的那张开放网络,往往让人落地就难受:为搜索优化过的注水文章把答案埋在个人轶事下面,加载时挤来挤去的广告位,Cookie 横幅,订阅弹窗,自动播放的视频。一段把这些全跳过的答案,是日常生活里实打实的改善,不是耍给易受骗者看的把戏。在这一点上诚实,是被人认真对待的代价。
但便利抹不掉随之而来的两件事。第一,那段答案是从别人做的工里拼出来的,而回答引擎既没做那份工,又越来越不为它付费、也不指回去——成本转嫁给了写出底层页面的人,没有任何机制让他们把它收回来。第二,从长远看更具腐蚀性的是那个可持续性悖论:一个把源头饿死的回答框,终将再无新鲜或真实的东西可供概括。到 2025 年中,斯坦福、帝国理工与互联网档案馆的研究者估算,新发布的网站里有 17.6% 完全由 AI 生成——这是大约 35% 由 AI 生成或辅助的网站中的一个子集(由 Gizmodo 报道,2025);”slop”——AI 大规模生产的低质量内容——被选为 Merriam-Webster 的 2025 年度词。一张越来越多地自己读自己、自己改写自己的网络,是一座镜厅。问题不在于读者想要答案有错,而在于当下这套安排,正在悄悄耗尽一片谁也不来续填的公地。
摆上台面的每一种回应,不是请愿,就是治标#
眼下摆上桌的几种解法——拦住爬虫、向它们收费、为它们做优化,或是起诉它们——藏着同一个假设:只要说服圈地者、或说服某个新中间人安分守己,掌控权就能回来。 每一种就其自身都值得认真对待,而每一种一旦认真对待,都没能把掌控权交还回来。
拦截是本能反应,也是最弱的一招。robots.txt 规则是一句请求,不是一道围栏:它自身没有可靠的法律约束力,财力雄厚的爬虫可以无视它,或者给自己的流量换个标签。最管用的做法是把拦截托付给中间人——Cloudflare 从 2025 年 7 月起对新站点默认拦截 AI 爬虫(Cloudflare)——这确实有效,代价是把那道门挪到了 Cloudflare 那里。
收费是看上去最像解决方案的一种回应,理应给它最有力的陈述。Cloudflare 的”按抓取付费(pay-per-crawl)”市场(2025 年 7 月上线),加上大额授权交易——据报道 Reddit 从 Google 拿到每年约 6000 万美元,News Corp 与 OpenAI 据报签下五年、逾 2.5 亿美元的协议——都不是无足轻重的事。对许多发布者而言,这是机器阅读头一回带来真金白银,是过去只有白白被抓取的地方第一次出现价格信号。麻烦在于结构:按抓取付费在每个站点与每个模型之间装上一座中央收费站,默认了”付钱给守门人就能放行”这条原则,把钱导向少数有议价能力的大发布者,留给独立网络的只是同一种依附的廉价版本。这是带分成的圈占——不妨叫它圈占 2.0——而不是一张发布者能掌控的网络。
为 AI 搜索做优化(即”生成式引擎优化”),是一种已经接受了条款的适应。诉讼是最具体制色彩的路径,确实影响深远:针对 OpenAI 的版权诉讼正在进行——2026 年 1 月,一位法官下令该公司提交两千万条 ChatGPT 日志(National Law Review);英国竞争监管机构现在允许发布者退出 Google 的 AI 摘要(Press Gazette,2026);EU AI Act 余下的透明度义务,包括 AI 生成内容的披露规则,将在 2026 年 8 月进入执法阶段。这些都很重要,下一节并非要反对它们。但它们慢,受辖区所限,结果难料——而且每一种都是在请求某个机构授予某样东西,密码朋克早就说过,机构不会出于善意把这样东西给你。
| 回应 | 它实际在做什么 | 诚实的好处 | 为何它仍是一场请愿 |
|---|---|---|---|
| robots.txt 拦截 | 客气地请爬虫别读 | 免费、简单,信誉好的爬虫普遍会遵守 | 单凭它没有法律约束力;凶悍的爬虫会无视它或换标签 |
| 按抓取付费/授权 | 经由 CDN 或交易向机器收费 | 头一笔真金白银的补偿;一个价格信号 | 装上新的中央收费站;默认“付钱就放行”;偏袒既得利益者 |
| AI 搜索优化 | 把内容裁剪成答案框要的样子 | 在圈占里换来一点曝光 | 接受了条款;你现在是在为守门人做优化 |
| 版权诉讼 | 为训练/使用提起诉讼 | 可能重塑授权与披露规则 | 慢,受辖区所限,结果难料;是在请求机构授予掌控权 |
开放网络其实早已被圈占过一次——这恰恰是关键所在#
在哀悼开放网络之前,值得承认它早已被圈占过一回:长达十五年,大多数的”被发现”都经由一个搜索框,大多数的钱都经由一家广告交易所。 AI 没有把一片自由的公地铺出来。它是第二次圈占,正在拿走第一次圈占留给发布者的那一点慰藉——那次引荐来的访问。
这处订正很要紧,因为它能杀死怀旧,而怀旧正是陷阱。目标从来不是恢复 Google 时代的那张网——那本就是别人的收费公路。更有用的那条训诫更古老,早在 1993 年就写下来了:隐私——后来才发现,开放性也一样——不是你向机构请愿来求它授予的东西,因为靠某个机构善意撑着的隐私,机构随时可以收回。密码朋克的结论是把这份保证内建进一套机制里——这正是《密码朋克宣言》的论点,如今被用到了网络本身,而不仅仅是用在传输中的消息上。
最早看清这副形状的人是 Richard Stallman。他 1997 年的故事《阅读的权利》(The Right to Read)设想了一个不远的将来:阅读被按次计费,对文本的获取由拥有那套软件的人掌控——这恰好可以描述这样一张网络:阅读越来越多地不经由你打开的页面,而是经由你查询的某项服务。他对这类服务的反对是精准的,不只是修辞。他论证说,在别人的服务器上做自己的计算”从根本上摧毁了你的计算自由”,因为你拿不到一份托管式 AI 的副本自己跑起来,唯一能用它的方式就是在一台你掌控不了的机器上用。在可靠性上他更是直言不讳——他拒绝把它叫作智能,宁愿称它为 “bullshit generator”(胡话生成器),用他的话说,这是一套”对真假漠不关心地生成输出”的系统。你不必采纳这套激辩,也能保留那个结构性要点,也就是密码朋克的那个要点:一种你跑不动、看不进去、也分叉不了的能力,是攥在别人手里的能力。
“靠某个机构善意撑着的隐私,是机构随时可以收回的隐私。”如今,这话对获取、对“被发现”、对阅读,同样成立。它们当中任何一样,要想经得起时间,就必须成为一套机制的属性,而不是一句承诺。
一条诚实的主权网络复兴路径#
这条建设性的答案,不是叫你明天就退出主流网络——几乎没人做得到——而是搭一层平行的网络,它的开放性无须任何一家公司点头,从你怎么读,到你怎么发布。 这跟寻常那句”去用去中心化网络就好”的劝告不同:它把局限和工具讲得一样直白。
读得有主权先来,因为这是较容易的那一半:
- 用 RSS 直接订阅源头——这是开放网络幸存下来的那套循环系统。它是你自己掌控的信息流,没有算法替你决定看什么,也没有互动指标在塑造什么东西会被写出来;随着读者寻找出口逃离算法信息流,对它的兴趣正再度回升。
- 通过 Tor Browser 阅读,以无中介的方式访问网络和 onion 服务。这不是边缘选项:纽约时报、卫报与明镜周刊都为线人运行着 onion 服务。
- 用本地的、开放权重的模型回答自己的问题——这一步是大多数”万物去中心化”指南都跳过的。如果允许读你数据的唯一智能是跑在别人 GPU 上的前沿模型,那去中心化数据改变不了多少——而那里,如今聚着真正的权力集中。在你自己挑选的索引和信息流上本地跑一个更小的模型,才是让阅读真正有主权、而非只是换了个地方寄放的关键。对模型的主权,和对数据的主权一样要紧。
发布得有主权是较难的那一半,也是更要紧的那一半:
- 在便宜的虚拟服务器上自托管——一个没有平台能删掉的家。
- 通过 RSS 和开放社交协议分发——Nostr 与 Fediverse 的 ActivityPub——在那里,你与受众之间的关系,不是某个平台说收回就能收回的。
- 提供一个 onion 镜像,以防读者需要从不友善的地方来找你。
这一切都有摩擦,假装没有正是过去十年”掌控你自己的平台”这类劝告失去公信力的原因。把局限直白说出来:Fediverse 大约是每月一两百万活跃用户的量级,不是十亿;它是一座城镇,不是一片大陆。IPFS 用实打实的延迟和陡峭的学习曲线换它那份抗审查。自托管首先是时间和技能的特权。这些当中没有一样能替代主流搜索或大型社交平台的触达,谁要是告诉你大迁徙近在眼前,那他多半在卖什么东西。
正因如此,搭起这一层并不能取代政治。反垄断执法、法定授权、英国监管机构刚争来的退出权、公共利益导向的搜索索引、数据信托——这一切都值得去争,代码替代不了其中任何一样。主权网络是那场抗争脚下的地板:当法律迟缓或被俘获时,仍稳得住的那样东西,让你在那段日子里不至于束手无策。密码朋克的主张从来不是说软件能替代集体行动,而是说,你能自己跑起来的权利,并不取决于先把政治这场仗打赢。
这件事在我们这里不是空谈。本站自托管,发到 Nostr 和 Fediverse,无须任何平台许可就能抵达;我们每天在服务器日志里看着会自报身份的 AI 爬虫到来,正如我们在宣言导读里写过的那样。诚实的汇报是:主权网络是一处可以立足的地方,还不是一处能取胜的地方——比我们纯粹为答案框做优化时更小、也更难被找到。把我们自己的利益也摊开来说:一个独立站点被 AI 回答引用是能获益的,我们并不反对这一点。要点不在于拒绝那些机器,而在于拒绝对一条公司说关就能关的渠道的依赖。要做到可被引用;不要被俘获。同一套逻辑贯穿了我们关于 AI 量级监控的其余工作——从《AI 时代的威胁模型》,到《足迹的顽固》里讲的”删除再也够不着模型训练数据”——也贯穿了那些正立在网络门口的身份关卡,见《年龄验证之争》。
| 层 | 这一步怎么走 | 它给你什么 | 诚实的局限 |
|---|---|---|---|
| 读——信息流 | 一个你自己掌控的 RSS 阅读器 | 没有算法、没有指标的“被发现” | 得你自己来策展;没有制造偶遇的引擎 |
| 读——访问 | Tor Browser + onion 服务 | 无中介、抗审查的阅读 | 更慢;有些站点会错待 Tor 流量 |
| 读——智能 | 本地的、开放权重的模型 | 来自你自己跑的软件、而非一项有日志的服务的答案 | 比前沿模型更小、更弱 |
| 发布——托管 | 在便宜的 VPS 上自托管 | 一个没有平台能删掉的家 | 时间、技能与维护都得你自己扛 |
| 发布——触达 | Nostr + Fediverse + RSS | 一份没有平台拥有的受众纽带 | 约一两百万活跃的量级,不是大众触达 |
结语——去建造,别去请愿#
开放网络不是死于自然原因,而是在被第二次圈占;最诚实的回应,既不是怀旧,也不是适应,而是建造。 搜索是第一次圈占;AI 回答框是第二次,拿走了第一次留下来的那次引荐访问。读者是真的更想要答案,这恰恰是为什么源头那张网络必须以可持续性和主权、而非以情感为由来守护。摆上台面的请愿与治标——拦截、收费、优化、起诉——每一种都留着一个守门人当家。更古老的那条训诫才经得起时间:把开放性内建进谁也收不回的机制里——模型与数据都要——把这件事当作法律与集体行动脚下的地板,而不是它们的替代品。它今年不会在规模上压过答案框。但当那些墙砌完时,它仍是一处可以立足的地方。
常见问题#
AI 是真的在合上开放网络,还是只是在改变它?#
两者都有,但准确的论断比”网络正在死去”要窄。网络内容对机器比以往都更容易获取;正在合上的,是通回人、通回生产了这些内容的站点的那条路。有了 AI 回答,外链点击大致减半,而吸走注意力的那些 AI 工具,只送回约 0.1–0.5% 的网页流量。网络被读得比以往都多——只是读它的不是人,读完不会回到源头。”圈占”比”死亡”更贴切:公地还在,但通往它价值的那条路,正被围起来、按次计费。
什么是”按抓取付费”,它能解决问题吗?#
按抓取付费是一套系统——Cloudflare 于 2025 年 7 月为它上线了市场——让站点向 AI 爬虫收费放行,而不是直接拦截,同时还有大发布者与 AI 公司之间的直接授权交易。比起无偿抓取,这是实打实的改善,也是许多发布者头一回为机器阅读见到钱。但它没有把网络的掌控权交还给发布者:它在每个站点与每个模型之间装上中央收费站,默认了”付钱给守门人就能放行”这条原则,且偏袒有议价能力的大发布者。这是带分成的圈占,不是一张开放的网络。
我该用 robots.txt 拦住 AI 爬虫吗?#
可以,信誉好的爬虫通常会遵守,但要明白它是什么:一句请求,不是一道围栏。robots.txt 指令单凭自己没有可靠的法律约束力,凶悍的或换了标签的爬虫可以无视它。拦截还会把被真正读到的回答引用的机会一并放弃。比”拦还是放”更经得起时间的姿态,是不再依赖任何一条你掌控不了的单一渠道——发布在你与受众的纽带无法被收回的地方,把爬虫策略当作战术,而不是战略。
现实地看,”主权网络”到底是什么?#
是一组读与发布的方式,不取决于任何一家公司的许可:用 RSS 订阅信息流,用 Tor 和 onion 服务访问,用本地跑的开放权重模型回答问题,用自托管加开放社交协议(Nostr、Fediverse)发布。现实地看,它今天还很小众——Fediverse 大约是每月一两百万活跃用户,自托管要花时间和技能,IPFS 拿延迟换抗审查。它今年不会替代主流搜索或社交。它的价值在于做一套有韧性的平行基础设施——一处可以立足的地方——而不是一个做好了的替代品。
我必须懂技术,才能逃离那张答案框网络吗?#
不必,至少起步时不必。最省力、回报最高的一步,是把你读的方式夺回来:装一个 RSS 阅读器,直接订阅源头,让算法和答案框不再替你决定什么能抵达你。Tor Browser 是一键下载,用于无中介访问。更技术的那几步——本地跑一个模型、自托管、提供 onion 镜像——是一架你可以随时间往上爬的梯子,不是前提条件。这条原则不需要写代码:优先选开放性内建于设计的工具和协议,而不是那些只是承诺会好好表现的服务。


