
关于资金:CypherpunkGuide 不投放监控型广告——没有广告网络,没有跟踪像素,也没有软文。运营依靠透明的资金来源:现阶段是读者捐赠,将来会加入订阅以及符合编辑方针的联盟推广。我们面向读者,而非广告主。
对多数人来说,“数字足迹"最初是以几个按钮的样子出现的。“删除账号”。“停用”。“下载你的数据”。界面给人十足的安心感:点一下,过去就此消失。社交媒体走过约二十年,数十亿人始终相信:按钮上写的,就是它会做的。
事实并非如此。在几乎所有平台上,删除改变的只是"展示什么”,而不是"保留什么"。你的主页从公开视图中消失了,副本却依然存在——在服务器备份里,在每一个收到过你私信的人的收件箱里,在早已售出的数据经纪商记录里。2014年美国 FTC 的一份研究显示,仅一家数据经纪商,就对几乎每一个美国人持有3,000个数据细分。到了2026年,又多出一份更新的副本:大语言模型背后的训练语料。一条已删除的帖子,可以在原文消失很久之后,继续留在模型的权重里。
那么,当你按下删除键时,究竟什么会留下来?还能做些什么?这不是一份"神奇橡皮擦"的使用说明——那种工具并不存在。这是一份从威胁建模出发的自查手册:帮你看清自己的足迹,判断什么才真正要紧,然后把精力花在能切实改变暴露面的地方,而不是花在只图心安的地方。
“删除"只是用户界面上的幻觉#
在多数平台上,删除是一次权限变更,而不是一次销毁。平台不再向公众展示你的内容,往往连你自己也看不到了——但底层记录仍留在你触及不到的系统里。理解"隐而未消"与"真正消失"之间的差距,是打理数字足迹的全部基础。
让"已删除"数据继续存活的蓄水池有四个。在这一点上,任何一份严肃的隐私指南都不会有分歧:
| 蓄水池 | 留存什么 | “删除"能触及吗 | 你的着力点 |
|---|---|---|---|
| 平台备份与日志 | 账号数据,以及你发出的私信(存于对方收件箱) | 不能——按既定期限保留 | 提出擦除请求(部分有效) |
| 数据经纪商 | 已被抓取、出售或转售的记录 | 不能——下游副本比源头活得久 | 逐家申请退出(需反复进行) |
| 影子档案 | 从他人的上传与标注中推断出的关于你的信息 | 不能——不需要你的账号就能建立 | 减少他人能关联到你的信息 |
| 缓存与截图 | 任何引起过注意的内容 | 不能——在你删除之前已被复制 | 事后无解——只能在发布时预防 |
还有一个平台指望你忽略的区别:停用不是删除。 停用只是把主页藏起来,把你的一切原封不动地留在原处,等你哪天回来;只有明确提出删除请求,那场(部分的)清除才会开始。动手之前,先下载属于你自己的存档——你没法清查自己已经看不到的东西。
如果你身处欧盟 GDPR 或加州 CCPA/CPRA 的管辖之下,这里有一根法律杠杆——擦除权与删除权。下文的手册会有针对性地用到它。但请记住:法律权利是一份请求,不是彻底清除的保证,而且它只够得着你能指认出来的数据。至于那些国家强制你交出、根本无从撤回的记录,则会按它们自己的节奏泄露——那是另一道有着自家应对手册的难题:当政府泄露你的数据:2026年分层防御手册。
2026年的新路径——你的帖子已是 AI 训练数据#
有一件事,隐私 SaaS 的宣传页和平台的帮助中心都不会告诉你,因为它卖不动任何删除服务:公开网络的相当一部分早已被采集去训练 AI 模型,而"删掉源头"抹不掉模型已经学到的东西。
公开的帖子、配文、评论和图片,持续被纳入网络规模的大型数据集——其中最著名的是 Common Crawl,多数主要实验室的模型都用它训练过——再被用来训练语言模型与图像模型。一段文字或一张照片,一旦被吸收进模型的权重,就不存在任何能伸进权重内部的"删除"按钮。研究"机器遗忘(machine unlearning)“的学者——也就是研究如何让训练完成的模型忘掉特定数据的那些人——普遍承认,这个问题确实困难,在大规模场景下至今没有解决;唯一可靠的办法,是剔除该数据后重新训练,而模型所有者几乎不会为某个人的请求这么做。另一方面,安全研究者已经实证表明,训练数据的片段可以从大模型中被重新提取出来。这意味着,数据被模型吸收并不是一个逐渐模糊、单向消失的过程,而是一种实实在在的存储形式。
由此引出三个推论,它们会把上一节的认知整个改写:
- 网页存档不只是记忆,更是一台永久化引擎。 Internet Archive 的 Wayback Machine 以及同类爬虫,保存着你早已删除的页面快照——而这些快照本身,又可能被收进未来的数据集。在源头删除,触及不到快照。
- 时机胜过善后。 采集是持续发生的,所以唯一完全有效的控制,是一开始就不发布敏感内容。发布之后的一切防御,都只是部分有效。
- 法律在追赶,但并不均衡。 欧盟《人工智能法案》(EU AI Act)这样的框架已开始规制训练数据与透明度,GDPR 的擦除权也正在模型训练问题上接受检验。这是一条仍在移动的前沿——值得跟踪,还不能依赖。
实际的结论令人不适,却让视野变得清晰:把你公开发布的一切,都当作可能在机器记忆的层面上永久存在的东西来对待。这不是绝望的理由。恰恰因为如此,下文的自查才从威胁建模开始,而不是从一通狂删开始。
贾斯汀·萨科的12小时航班,2026年仍在教我们什么#
要明白永久性为何要紧,看看那个为它定调的案例。2013年12月,企业公关高级总监贾斯汀·萨科(Justine Sacco)在登机前,向当时为数不多的粉丝发出一条品味恶劣的推文,随即踏上了从伦敦飞往开普敦约11小时的航程。
“Going to Africa. Hope I don’t get AIDS. Just kidding. I’m white!” (要去非洲了。希望别染上艾滋。开玩笑啦,我是白人!)
这条推文发给了约170名粉丝。当她的航班落地时,话题标签 #HasJustineLandedYet 已在全球登上趋势榜,陌生人不停刷新页面等她降落,而她已经失去了工作。在全世界完成复制之前,她连删除的机会都没有。
无论你如何评判这条推文——它当年遭到了义愤填膺的审判——真正的教训在于机制,而这套机制从那以后只增不减。一条发给约170名粉丝的消息,几小时内变成了全球事件。删除毫无意义:在作者能做出任何反应之前,内容已经被截图、被转述、被报道成了永久记录。十多年过去,搜索她的名字,这段往事仍然出现在结果首页、出现在新闻报道里;如今,它更已进入模型的训练数据——每当有人向 AI 问起她时,那些数据就在背后应答。
这个案例留下三条经得起时间的规则。发布的那一刻,你看不见传播范围——粉丝少,不等于暴露小。删除是在和一群你追不上的人赛跑——注意力一旦到场,副本就跑在你前面。永久性是不对称的——糟糕的一分钟,能活得比多年的语境更久。防御之道不是删得更快,而是在发布之前刻意停顿。下一节,我们把这层停顿落实为"24小时冷静期”。(Cora 的 Series E 将以同样的视角,深入剖析这类有据可查的 OPSEC 失败案例。)
旧账号自查手册——六步法#
这一部分没有竞争者愿意发表,因为它卖不出任何东西。下面是我为这份指南整理、并推荐给读者的六步自查法——一套从看清足迹走向塑造足迹的流程。第一次认真做完一遍,之后每年复查一次。
| 步骤 | 目标 | 工具示例 |
|---|---|---|
| 1. 盘点 | 看到完整的地图 | 搜索本名与旧用户名;Wayback Machine |
| 2. 威胁建模 | 给对手与资产命名 | 纸和笔;“隐私与 OPSEC"支柱 |
| 3. 分级 | 找出真正高危的少数 | 排查位置、作息、身份关联 |
| 4. 有序删除 | 按正确顺序移除 | 先下载存档;选删除而非停用;解绑第三方应用 |
| 5. 擦除与退出 | 用好法律杠杆 | GDPR 第17条 / CCPA 请求;经纪商退出 |
| 6. 化名+冷静期 | 防止未来的永久化 | 身份隔离;24小时规则 |
第一步——盘点真正散落在外的东西。 列出你创建过的所有账号,包括早已弃用的那些。用本名、每一个旧用户名、每一个邮箱地址逐一搜索。再到 Wayback Machine 查一查你已删除主页的快照。这一步先不修任何东西——你是在画地图。
第二步——动设置之前,先建立威胁模型。 给你的对手和资产命名。你要防的是未来的雇主、前任伴侣、跟踪者、doxxer(人肉搜索者),还是仅仅你自己将来的名声?诚实的答案决定之后的一切——一位需要面对公众的职业人士,与一位受虐幸存者,需要的是截然相反的策略。(这正是贯穿 Cora 全部写作的"隐私即威胁建模"习惯;如果你是第一次接触,请从隐私与 OPSEC 支柱读起。)
第三步——按真实风险分级,而不是按数量。 你的足迹绝大多数是无害的。要找的是那少数例外:住址或工作地点、暴露作息或人际关系的照片、任何把化名与法定身份连在一起的线索,以及与你如今维护的形象相矛盾的内容。给它们排好次序。你有限的精力,就花在这里。
第四步——按正确的顺序,有意识地删除。 先下载自己的存档。然后选择删除而不是停用;关闭账号之前,先解绑第三方应用的授权;即便是打算保留的账号,也要删掉其中高风险的单条内容。顺序很重要:不先撤销已授权的应用就删号,它们可能继续保有访问权。
第五步——行使擦除权,并向经纪商申请退出。 在你具备法律地位的地方——GDPR 的擦除权、CCPA/CPRA 的删除权——以书面提交请求,并留存记录。向主要的数据经纪商逐一提交退出与删除请求;这件事枯燥,而且要反复做,并非一劳永逸——经纪商会重新取得数据。
第六步——迁往化名,并养成24小时冷静期。 从今往后,凡是不想永久挂在真名之下的活动,都交给一个与法定身份彻底隔离、可以长期使用的化名,并把这条隔离线守干净。同时,给自己立下萨科当年不曾拥有的规则:凡是情绪化的、政治性的、涉及他人的帖子,发布前先等24小时。冷静期是整套方法里杠杆最高的习惯,因为它是唯一抢在永久化引擎运转之前起效的防御。
当风险并不对等——女性与被针对者的足迹风险#
一份对所有读者一视同仁的足迹指南,恰恰在悄悄辜负最需要它的那部分读者。持久数字痕迹的风险,从来不是均匀分布的。对女性、受虐幸存者、活动人士以及其他被盯上的人来说,一条暴露位置、作息或人际关系的旧帖不是难堪——而是对手可以付诸行动的人身安全缺口。
到了这里,隐私不再抽象。跟踪者与 doxxer 不需要攻破任何系统;他们用你留在公开网络上的足迹,把目标一块块拼出来——你打卡的健身房、照片背景里的学校、每逢周五雷打不动的行程。事后删除,恰恰在风险最高的地方最无力,因为有备而来的对手早已复制了他需要的一切。对这部分读者,自查的重心是倒过来的:第二步与第三步——威胁建模与位置排查——远比"删得彻底"重要;而24小时冷静期,则升级为一条常设纪律,关乎某件事从一开始就要不要说出口。
我写下这些,出于一个具体的信念:隐私不是藏着掖着,也不是疑神疑鬼。它是——正如 Eric Hughes 在《A Cypherpunk’s Manifesto》(1993)中写下的——向世界有选择地展示自己的权力:选择让什么被看见、被谁看见、在何时被看见。这份权力关乎尊严,可它承受的代价并不平等。有意识地守护它不是躲藏,而是把自尊落实成日常操作。背负不对称风险的读者,应当把足迹纪律当作持续的修习;想继续深入的话,可以前往主权支柱——对自己人生的自主决定,是那里一以贯之的主线。
结论——哪种做法适合你?#
足迹纪律没有唯一正确的强度,只有与你的威胁模型相称的强度。
- 如果你是没有特定对手的普通用户: 认真做一次自查,处理掉真正高危的少数条目,养成24小时冷静期的习惯,到此为止。为了"删干净"搭上整个周末,不值得。
- 如果你身处公众视野——职业人士、创作者或参选人: 以永久为前提,刻意经营,对最糟糕的条目行使擦除权,把每一条新帖都当作长期的负债或资产来掂量。萨科那套机制,瞄准的正是你。
- 如果你背负不对称的风险——遭受骚扰的女性、幸存者、活动人士,或任何面对蓄意对手的人: 把位置与人际关系的暴露排在一切之前,把化名与法定身份分开,把冷静期当作发布前的关卡,并按固定周期复查。在这里,预防是唯一靠得住的控制。
三种情形之下,同一个事实始终成立:事后再怎么删除,都换不来可靠的安全。你能做的,是看清楚、想明白,然后少发布那些你不愿其永久存在的东西。
常见问题#
删除社交媒体账号,真的能删掉我的数据吗?#
不能——至少不彻底。删除会把你的主页从公开视图中移除,并启动平台内部的清除流程,但副本仍留在备份里、留在与你私信过的人的收件箱里、留在早已售出的数据经纪商记录里、留在网页存档里,还可能留在 AI 训练数据集里。删除能降低暴露,但不保证抹除。
我能把自己的帖子从 AI 训练数据集里移除吗?#
多数情况下不能——无法追溯既往。内容一旦被纳入训练完成的模型,就不存在可靠的"按人删除”,因为让模型忘掉特定数据(机器遗忘)在大规模场景下仍是未解的难题。一些平台和法域已开始提供针对未来训练的退出选项,值得使用;但靠得住的控制,仍然是一开始就不发布敏感内容。
GDPR 或 CCPA 能强制平台删除一切吗?#
它们交给你的是一根有力、但有边界的杠杆。GDPR 第17条(擦除权)与 CCPA/CPRA 的删除权,要求受管辖的企业响应有效的删除请求——但两者都设有例外,例如法定保留与法律主张之抗辩;GDPR 一侧还有公共利益等事由,而安全事件检测这一例外只存在于 CCPA。它们只适用于企业能够识别为你的数据,而针对下游副本与模型训练的执行,眼下仍在检验之中。请求要提;但不要假定它能触及每一份副本。
什么是"24小时冷静期”?#
这是一条自我约束的规则:凡是情绪化的、政治性的、涉及他人的帖子,发布前先等24小时。缓存、存档与 AI 爬虫可以在几分钟内复制一条帖子,删除几乎永远追不上它们——因此唯一始终有效的防御,是发布之前的那段停顿。在有据可查的足迹灾难里,大多数本可以靠这一个习惯避免。
参考资料#
| # | 来源 | URL | 存档 |
|---|---|---|---|
| 1 | GDPR 第17条——擦除权(“被遗忘权”) | https://gdpr-info.eu/art-17-gdpr/ | https://web.archive.org/web/*/https://gdpr-info.eu/art-17-gdpr/ |
| 2 | 加州 CCPA——删除权(California Attorney General) | https://oag.ca.gov/privacy/ccpa | https://web.archive.org/web/*/https://oag.ca.gov/privacy/ccpa |
| 3 | Jon Ronson,“How One Stupid Tweet Blew Up Justine Sacco’s Life”,NYT Magazine,2015(付费墙;亦收录于 So You’ve Been Publicly Shamed,Riverhead,2015) | https://www.nytimes.com/2015/02/15/magazine/how-one-stupid-tweet-blew-up-justine-saccos-life.html | NYT 屏蔽存档爬虫(2025年起);参见 Ronson(2015)书籍 |
| 4 | 欧盟《人工智能法案》(EU AI Act)——欧盟委员会(官方) | https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai | https://web.archive.org/web/*/https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai |
| 5 | 美国 FTC,“Data Brokers: A Call for Transparency and Accountability”(2014) | https://www.ftc.gov/reports/data-brokers-call-transparency-accountability-report-federal-trade-commission-may-2014 | https://web.archive.org/web/*/https://www.ftc.gov/reports/data-brokers-call-transparency-accountability-report-federal-trade-commission-may-2014 |
| 6 | Carlini 等,“Extracting Training Data from Large Language Models”(USENIX Security 2021;预印本 arXiv:2012.07805) | https://arxiv.org/abs/2012.07805 | https://web.archive.org/web/*/https://arxiv.org/abs/2012.07805 |
| 7 | Internet Archive——Wayback Machine | https://web.archive.org/ | ——(存档本身) |
| 8 | Eric Hughes,《A Cypherpunk’s Manifesto》(1993) | https://www.activism.net/cypherpunk/manifesto.html | https://web.archive.org/web/*/https://www.activism.net/cypherpunk/manifesto.html |