跳过正文

2026 年,AI 正如何圈占开放网络?

·561 字·3 分钟
Cora Aegis
作者
Cora Aegis
隐私是权利;工具是我们行使它的方式。
目录
一位银白色头发、红色眼眸沉静的年轻女性,站在一面高耸的等宽代码之墙前,墙在机器那一侧敞开、流动,在人这一侧却封死成一道空白的屏障,雨夜暗处泛着青绿色与红色的霓虹

关于资金:CypherpunkGuide 不投放监控型广告——没有广告网络,没有跟踪像素,也没有软文。运营依靠透明的资金来源:现阶段是读者捐赠,将来会加入订阅以及符合编辑方针的联盟推广。我们面向读者,而非广告主。

开放网络——任何人都能发布、任何人都能顺着链接找到的那张网——这两年被悄悄地围着 AI 重新布了一遍管线。没有人宣布过什么,也没有哪堵墙是一夜砌起来的,变化很容易错过。真正发生的事,写在流量日志里:当 Google 端出 AI 生成的回答,把点击送往站外的搜索占比从约 15% 掉到约 8%(Pew Research,2025);数千家新闻站点到 2025 年底的一年里,来自搜索的引荐流量掉了约三分之一(Chartbeat 数据,由 Reuters Institute 报告);而吸走了这份注意力的 AI 工具,送回来的访问只有网页流量的 0.1–0.5%。

所以网络被读得比以往都多——只是读它的不是人,读完也不回到源头。开放网络正在死去吗?这个问题值得停留片刻,因为答案决定了你接下来怎么做:哀悼它,为读它的机器做优化,还是去造一件它们圈不住的东西。”死去”这个词,到头来既太戏剧化,又太让人安心。诚实的诊断要窄得多——它指向建造,而不是怀旧或投降。

说一句我的立场:本站正是按这篇文章最后要推荐的方式发布的——自托管,通过 RSS 和开放社交协议分发,不靠任何单一平台存在。这不是在绕场庆功。这是一次务实的小实验,下文对它的局限会和对它的理由一样坦白。

网络被读得比以往都多——只是读它的不是人
#

变化不在于网络被爬取——它一向被爬取——而在于这一次爬完不再带回一次访问:搜索是一份索引目录,把人引向源头;AI 回答引擎是一处终点,旅程到答案就结束了。 全文的论点都在这个区分里,而它很容易被搞错。

把 AI 爬取的纯粹体量当作祸害,是个错误。有些爬虫确实凶猛——一份分析算出,2025 年某个主流 AI 爬虫每带回一名访客,就要抓走两万多个页面——但搜索引擎一向抓得远比它送回来的流量多。抓得多、引荐得少,本是常态,索引就是这样运作的。真正要紧的不是这个比例,而是那条被切断的回路:页面被读了,答案端出去了,读者却从未抵达。

数字把这条断路剥离得很清楚。同一个搜索,有没有 AI 摘要,外链点击相差约一半(从约 15% 降到约 8%),而点开 AI 回答内部引用的用户只有约 1%(Pew Research,2025)。零点击搜索——结束时哪里都没去的那种——在到 2025 年 5 月为止的一年里从约 56% 升到了 69%(Similarweb 数据,经 Search Engine Roundtable)。也得对数据公道:引荐流量整体下滑,是几股力量同时作用的结果——社交平台压制外链、核心算法变动、付费墙、读者转向 App——所以诚实的因果论断,靠”有没有 AI 摘要”这组对照,而不是把每次流失的访问都赖到 AI 头上。

作为索引目录的网络(搜索)作为终点的网络(AI 回答)
爬取是为了什么建索引,把人引向页面摄取内容,就地合成一段答案
读者得到什么一串可供访问的源头一段成品答案;源头可有可无
源头换回什么一次访问——注意力、订阅者、收入一条几乎没人点的引用(约 1%)
这笔交易允许索引,换来被发现允许摄取,换来约 0.1–0.5% 的引荐

可人们就是在选那个即时答案
#

圈占的故事往往略过一桩难堪事实:大多数人更想要答案,而不是那十条蓝色链接——而他们这么选,并没有错。 任何把读者当成 AI 搜索纯粹受害者的论调,都注定看不懂 AI 搜索为何会赢,也因此很容易被一笑置之。

读者正在离开的那张开放网络,往往让人落地就难受:为搜索优化过的注水文章把答案埋在个人轶事下面,加载时挤来挤去的广告位,Cookie 横幅,订阅弹窗,自动播放的视频。一段把这些全跳过的答案,是日常生活里实打实的改善,不是耍给易受骗者看的把戏。在这一点上诚实,是被人认真对待的代价。

但便利抹不掉随之而来的两件事。第一,那段答案是从别人做的工里拼出来的,而回答引擎既没做那份工,又越来越不为它付费、也不指回去——成本转嫁给了写出底层页面的人,没有任何机制让他们把它收回来。第二,从长远看更具腐蚀性的是那个可持续性悖论:一个把源头饿死的回答框,终将再无新鲜或真实的东西可供概括。到 2025 年中,斯坦福、帝国理工与互联网档案馆的研究者估算,新发布的网站里有 17.6% 完全由 AI 生成——这是大约 35% 由 AI 生成或辅助的网站中的一个子集(由 Gizmodo 报道,2025);”slop”——AI 大规模生产的低质量内容——被选为 Merriam-Webster 的 2025 年度词。一张越来越多地自己读自己、自己改写自己的网络,是一座镜厅。问题不在于读者想要答案有错,而在于当下这套安排,正在悄悄耗尽一片谁也不来续填的公地。

摆上台面的每一种回应,不是请愿,就是治标
#

眼下摆上桌的几种解法——拦住爬虫、向它们收费、为它们做优化,或是起诉它们——藏着同一个假设:只要说服圈地者、或说服某个新中间人安分守己,掌控权就能回来。 每一种就其自身都值得认真对待,而每一种一旦认真对待,都没能把掌控权交还回来。

拦截是本能反应,也是最弱的一招。robots.txt 规则是一句请求,不是一道围栏:它自身没有可靠的法律约束力,财力雄厚的爬虫可以无视它,或者给自己的流量换个标签。最管用的做法是把拦截托付给中间人——Cloudflare 从 2025 年 7 月起对新站点默认拦截 AI 爬虫(Cloudflare)——这确实有效,代价是把那道门挪到了 Cloudflare 那里。

收费是看上去最像解决方案的一种回应,理应给它最有力的陈述。Cloudflare 的”按抓取付费(pay-per-crawl)”市场(2025 年 7 月上线),加上大额授权交易——据报道 Reddit 从 Google 拿到每年约 6000 万美元,News Corp 与 OpenAI 据报签下五年、逾 2.5 亿美元的协议——都不是无足轻重的事。对许多发布者而言,这是机器阅读头一回带来真金白银,是过去只有白白被抓取的地方第一次出现价格信号。麻烦在于结构:按抓取付费在每个站点与每个模型之间装上一座中央收费站,默认了”付钱给守门人就能放行”这条原则,把钱导向少数有议价能力的大发布者,留给独立网络的只是同一种依附的廉价版本。这是带分成的圈占——不妨叫它圈占 2.0——而不是一张发布者能掌控的网络。

为 AI 搜索做优化(即”生成式引擎优化”),是一种已经接受了条款的适应。诉讼是最具体制色彩的路径,确实影响深远:针对 OpenAI 的版权诉讼正在进行——2026 年 1 月,一位法官下令该公司提交两千万条 ChatGPT 日志(National Law Review);英国竞争监管机构现在允许发布者退出 Google 的 AI 摘要(Press Gazette,2026);EU AI Act 余下的透明度义务,包括 AI 生成内容的披露规则,将在 2026 年 8 月进入执法阶段。这些都很重要,下一节并非要反对它们。但它们慢,受辖区所限,结果难料——而且每一种都是在请求某个机构授予某样东西,密码朋克早就说过,机构不会出于善意把这样东西给你。

回应它实际在做什么诚实的好处为何它仍是一场请愿
robots.txt 拦截客气地请爬虫别读免费、简单,信誉好的爬虫普遍会遵守单凭它没有法律约束力;凶悍的爬虫会无视它或换标签
按抓取付费/授权经由 CDN 或交易向机器收费头一笔真金白银的补偿;一个价格信号装上新的中央收费站;默认“付钱就放行”;偏袒既得利益者
AI 搜索优化把内容裁剪成答案框要的样子在圈占里换来一点曝光接受了条款;你现在是在为守门人做优化
版权诉讼为训练/使用提起诉讼可能重塑授权与披露规则慢,受辖区所限,结果难料;是在请求机构授予掌控权

开放网络其实早已被圈占过一次——这恰恰是关键所在
#

在哀悼开放网络之前,值得承认它早已被圈占过一回:长达十五年,大多数的”被发现”都经由一个搜索框,大多数的钱都经由一家广告交易所。 AI 没有把一片自由的公地铺出来。它是第二次圈占,正在拿走第一次圈占留给发布者的那一点慰藉——那次引荐来的访问。

这处订正很要紧,因为它能杀死怀旧,而怀旧正是陷阱。目标从来不是恢复 Google 时代的那张网——那本就是别人的收费公路。更有用的那条训诫更古老,早在 1993 年就写下来了:隐私——后来才发现,开放性也一样——不是你向机构请愿来求它授予的东西,因为靠某个机构善意撑着的隐私,机构随时可以收回。密码朋克的结论是把这份保证内建进一套机制里——这正是《密码朋克宣言》的论点,如今被用到了网络本身,而不仅仅是用在传输中的消息上。

最早看清这副形状的人是 Richard Stallman。他 1997 年的故事《阅读的权利》(The Right to Read)设想了一个不远的将来:阅读被按次计费,对文本的获取由拥有那套软件的人掌控——这恰好可以描述这样一张网络:阅读越来越多地不经由你打开的页面,而是经由你查询的某项服务。他对这类服务的反对是精准的,不只是修辞。他论证说,在别人的服务器上做自己的计算”从根本上摧毁了你的计算自由”,因为你拿不到一份托管式 AI 的副本自己跑起来,唯一能用它的方式就是在一台你掌控不了的机器上用。在可靠性上他更是直言不讳——他拒绝把它叫作智能,宁愿称它为 “bullshit generator”(胡话生成器),用他的话说,这是一套”对真假漠不关心地生成输出”的系统。你不必采纳这套激辩,也能保留那个结构性要点,也就是密码朋克的那个要点:一种你跑不动、看不进去、也分叉不了的能力,是攥在别人手里的能力。

“靠某个机构善意撑着的隐私,是机构随时可以收回的隐私。”如今,这话对获取、对“被发现”、对阅读,同样成立。它们当中任何一样,要想经得起时间,就必须成为一套机制的属性,而不是一句承诺。

一条诚实的主权网络复兴路径
#

这条建设性的答案,不是叫你明天就退出主流网络——几乎没人做得到——而是搭一层平行的网络,它的开放性无须任何一家公司点头,从你怎么读,到你怎么发布。 这跟寻常那句”去用去中心化网络就好”的劝告不同:它把局限和工具讲得一样直白。

读得有主权先来,因为这是较容易的那一半:

  1. 用 RSS 直接订阅源头——这是开放网络幸存下来的那套循环系统。它是你自己掌控的信息流,没有算法替你决定看什么,也没有互动指标在塑造什么东西会被写出来;随着读者寻找出口逃离算法信息流,对它的兴趣正再度回升。
  2. 通过 Tor Browser 阅读,以无中介的方式访问网络和 onion 服务。这不是边缘选项:纽约时报、卫报与明镜周刊都为线人运行着 onion 服务。
  3. 用本地的、开放权重的模型回答自己的问题——这一步是大多数”万物去中心化”指南都跳过的。如果允许读你数据的唯一智能是跑在别人 GPU 上的前沿模型,那去中心化数据改变不了多少——而那里,如今聚着真正的权力集中。在你自己挑选的索引和信息流上本地跑一个更小的模型,才是让阅读真正有主权、而非只是换了个地方寄放的关键。对模型的主权,和对数据的主权一样要紧。

发布得有主权是较难的那一半,也是更要紧的那一半:

  1. 在便宜的虚拟服务器上自托管——一个没有平台能删掉的家。
  2. 通过 RSS 和开放社交协议分发——Nostr 与 Fediverse 的 ActivityPub——在那里,你与受众之间的关系,不是某个平台说收回就能收回的。
  3. 提供一个 onion 镜像,以防读者需要从不友善的地方来找你。

这一切都有摩擦,假装没有正是过去十年”掌控你自己的平台”这类劝告失去公信力的原因。把局限直白说出来:Fediverse 大约是每月一两百万活跃用户的量级,不是十亿;它是一座城镇,不是一片大陆。IPFS 用实打实的延迟和陡峭的学习曲线换它那份抗审查。自托管首先是时间和技能的特权。这些当中没有一样能替代主流搜索或大型社交平台的触达,谁要是告诉你大迁徙近在眼前,那他多半在卖什么东西。

正因如此,搭起这一层并不能取代政治。反垄断执法、法定授权、英国监管机构刚争来的退出权、公共利益导向的搜索索引、数据信托——这一切都值得去争,代码替代不了其中任何一样。主权网络是那场抗争脚下的地板:当法律迟缓或被俘获时,仍稳得住的那样东西,让你在那段日子里不至于束手无策。密码朋克的主张从来不是说软件能替代集体行动,而是说,你能自己跑起来的权利,并不取决于先把政治这场仗打赢。

这件事在我们这里不是空谈。本站自托管,发到 Nostr 和 Fediverse,无须任何平台许可就能抵达;我们每天在服务器日志里看着会自报身份的 AI 爬虫到来,正如我们在宣言导读里写过的那样。诚实的汇报是:主权网络是一处可以立足的地方,还不是一处能取胜的地方——比我们纯粹为答案框做优化时更小、也更难被找到。把我们自己的利益也摊开来说:一个独立站点被 AI 回答引用是能获益的,我们并不反对这一点。要点不在于拒绝那些机器,而在于拒绝对一条公司说关就能关的渠道的依赖。要做到可被引用;不要被俘获。同一套逻辑贯穿了我们关于 AI 量级监控的其余工作——从《AI 时代的威胁模型》,到《足迹的顽固》里讲的”删除再也够不着模型训练数据”——也贯穿了那些正立在网络门口的身份关卡,见《年龄验证之争》

这一步怎么走它给你什么诚实的局限
读——信息流一个你自己掌控的 RSS 阅读器没有算法、没有指标的“被发现”得你自己来策展;没有制造偶遇的引擎
读——访问Tor Browser + onion 服务无中介、抗审查的阅读更慢;有些站点会错待 Tor 流量
读——智能本地的、开放权重的模型来自你自己跑的软件、而非一项有日志的服务的答案比前沿模型更小、更弱
发布——托管在便宜的 VPS 上自托管一个没有平台能删掉的家时间、技能与维护都得你自己扛
发布——触达Nostr + Fediverse + RSS一份没有平台拥有的受众纽带约一两百万活跃的量级,不是大众触达

结语——去建造,别去请愿
#

开放网络不是死于自然原因,而是在被第二次圈占;最诚实的回应,既不是怀旧,也不是适应,而是建造。 搜索是第一次圈占;AI 回答框是第二次,拿走了第一次留下来的那次引荐访问。读者是真的更想要答案,这恰恰是为什么源头那张网络必须以可持续性和主权、而非以情感为由来守护。摆上台面的请愿与治标——拦截、收费、优化、起诉——每一种都留着一个守门人当家。更古老的那条训诫才经得起时间:把开放性内建进谁也收不回的机制里——模型与数据都要——把这件事当作法律与集体行动脚下的地板,而不是它们的替代品。它今年不会在规模上压过答案框。但当那些墙砌完时,它仍是一处可以立足的地方。

常见问题
#

AI 是真的在合上开放网络,还是只是在改变它?
#

两者都有,但准确的论断比”网络正在死去”要窄。网络内容对机器比以往都更容易获取;正在合上的,是通回人、通回生产了这些内容的站点的那条路。有了 AI 回答,外链点击大致减半,而吸走注意力的那些 AI 工具,只送回约 0.1–0.5% 的网页流量。网络被读得比以往都多——只是读它的不是人,读完不会回到源头。”圈占”比”死亡”更贴切:公地还在,但通往它价值的那条路,正被围起来、按次计费。

什么是”按抓取付费”,它能解决问题吗?
#

按抓取付费是一套系统——Cloudflare 于 2025 年 7 月为它上线了市场——让站点向 AI 爬虫收费放行,而不是直接拦截,同时还有大发布者与 AI 公司之间的直接授权交易。比起无偿抓取,这是实打实的改善,也是许多发布者头一回为机器阅读见到钱。但它没有把网络的掌控权交还给发布者:它在每个站点与每个模型之间装上中央收费站,默认了”付钱给守门人就能放行”这条原则,且偏袒有议价能力的大发布者。这是带分成的圈占,不是一张开放的网络。

我该用 robots.txt 拦住 AI 爬虫吗?
#

可以,信誉好的爬虫通常会遵守,但要明白它是什么:一句请求,不是一道围栏。robots.txt 指令单凭自己没有可靠的法律约束力,凶悍的或换了标签的爬虫可以无视它。拦截还会把被真正读到的回答引用的机会一并放弃。比”拦还是放”更经得起时间的姿态,是不再依赖任何一条你掌控不了的单一渠道——发布在你与受众的纽带无法被收回的地方,把爬虫策略当作战术,而不是战略。

现实地看,”主权网络”到底是什么?
#

是一组读与发布的方式,不取决于任何一家公司的许可:用 RSS 订阅信息流,用 Tor 和 onion 服务访问,用本地跑的开放权重模型回答问题,用自托管加开放社交协议(Nostr、Fediverse)发布。现实地看,它今天还很小众——Fediverse 大约是每月一两百万活跃用户,自托管要花时间和技能,IPFS 拿延迟换抗审查。它今年不会替代主流搜索或社交。它的价值在于做一套有韧性的平行基础设施——一处可以立足的地方——而不是一个做好了的替代品。

我必须懂技术,才能逃离那张答案框网络吗?
#

不必,至少起步时不必。最省力、回报最高的一步,是把你的方式夺回来:装一个 RSS 阅读器,直接订阅源头,让算法和答案框不再替你决定什么能抵达你。Tor Browser 是一键下载,用于无中介访问。更技术的那几步——本地跑一个模型、自托管、提供 onion 镜像——是一架你可以随时间往上爬的梯子,不是前提条件。这条原则不需要写代码:优先选开放性内建于设计的工具和协议,而不是那些只是承诺会好好表现的服务。

#来源URL存档
1Pew Research — clicks fall when an AI summary appears (2025)https://www.pewresearch.org/short-reads/2025/07/22/google-users-are-less-likely-to-click-on-links-when-an-ai-summary-appears-in-the-results/https://web.archive.org/web/2025/https://www.pewresearch.org/short-reads/2025/07/22/google-users-are-less-likely-to-click-on-links-when-an-ai-summary-appears-in-the-results/
2Reuters Institute — Journalism Trends 2026 (Chartbeat ~one-third referral decline)https://reutersinstitute.politics.ox.ac.uk/journalism-media-and-technology-trends-and-predictions-2026https://web.archive.org/web/2026/https://reutersinstitute.politics.ox.ac.uk/journalism-media-and-technology-trends-and-predictions-2026
3Search Engine Roundtable — Similarweb zero-click 56%→69%https://www.seroundtable.com/similarweb-google-zero-click-search-growth-39706.htmlhttps://web.archive.org/web/2025/https://www.seroundtable.com/similarweb-google-zero-click-search-growth-39706.html
4Cloudflare — controlling content use for AI training (July 2025)https://blog.cloudflare.com/control-content-use-for-ai-training/https://web.archive.org/web/2025/https://blog.cloudflare.com/control-content-use-for-ai-training/
5Cloudflare — Pay Per Crawl changelog (2025-07-01)https://developers.cloudflare.com/changelog/2025-07-01-pay-per-crawl/https://web.archive.org/web/2025/https://developers.cloudflare.com/changelog/2025-07-01-pay-per-crawl/
6The Decoder — Reddit–Google AI training deal (~$60M/yr)https://the-decoder.com/reddit-signs-60-million-annual-training-data-deal-with-google/https://web.archive.org/web/2024/https://the-decoder.com/reddit-signs-60-million-annual-training-data-deal-with-google/
7Variety — News Corp–OpenAI licensing dealhttps://variety.com/2024/digital/news/news-corp-openai-licensing-deal-1236013734/https://web.archive.org/web/2024/https://variety.com/2024/digital/news/news-corp-openai-licensing-deal-1236013734/
8Gizmodo — 17.6% of new sites entirely AI-generated (Stanford/Imperial/Internet Archive)https://gizmodo.com/dead-internet-theory-is-17-of-the-way-to-becoming-reality-study-finds-2000751718https://web.archive.org/web/2025/https://gizmodo.com/dead-internet-theory-is-17-of-the-way-to-becoming-reality-study-finds-2000751718
9Merriam-Webster — Word of the Year 2025 (“slop”)https://www.merriam-webster.com/wordplay/word-of-the-yearhttps://web.archive.org/web/20251201000000*/https://www.merriam-webster.com/wordplay/word-of-the-year
10National Law Review — court orders 20M ChatGPT logs (Jan 2026)https://natlawreview.com/article/openai-loses-privacy-gambit-20-million-chatgpt-logs-likely-headed-copyrighthttps://web.archive.org/web/2026/https://natlawreview.com/article/openai-loses-privacy-gambit-20-million-chatgpt-logs-likely-headed-copyright
11Press Gazette — UK CMA publisher opt-out from AI summaries (Jan 2026)https://pressgazette.co.uk/platforms/google-regulation-uk/https://web.archive.org/web/2026/https://pressgazette.co.uk/platforms/google-regulation-uk/
12GNU Project — Richard Stallman, The Right to Read (1997)https://www.gnu.org/philosophy/right-to-read.en.htmlhttps://web.archive.org/web/2025/https://www.gnu.org/philosophy/right-to-read.en.html
13stallman.org — Reasons not to use ChatGPThttps://stallman.org/chatgpt.htmlhttps://web.archive.org/web/2025/https://stallman.org/chatgpt.html
14Tor Project — official site / onion serviceshttps://www.torproject.org/https://web.archive.org/web/2025/https://www.torproject.org/

相关文章