
关于资金:CypherpunkGuide 不投放监控型广告——没有广告网络,没有跟踪像素,也没有软文。运营依靠透明的资金来源:现阶段是读者捐赠,将来会加入订阅以及符合编辑方针的联盟推广。我们面向读者,而非广告主。
我对着聊天框打字,那种心态,就像站在一支看不见线缆的麦克风旁边说话:我默认它在录音,因为最省心的安全假设,往往就是事后被证明成真的那一个。多数人却反着来。助手用一种平静、像在闲聊的语气回话,窗口让人觉得这是私下的,于是我们把那些只会跟医生或律师说的事告诉它——一桩病情上的担忧、一封还没递出去的辞职信、一个只想了一半的计划、一串本不该粘贴出来的密码。这个界面,是为了让你觉得在聊天而造的。后台,是为了留一份记录而造的。
这是两回事,而隐私问题就藏在两者之间那道缝里。美国民调机构 Pew Research 在 2026 年 3 月发现:50% 的美国成年人对 AI 的扩散是担忧多过期待——比 2021 年的 37% 涨了上来——而它更早一次的调查显示,绝大多数人都预料到自己的个人信息会被用在让他们不舒服的地方。可即便如此,这些工具天生收集的,是比搜索私密得多的倾诉。一句搜索不过是几个关键词;一段对话却是一份带追问的招供。这份记录事后会怎样,不由那句答话的友善语气决定,而由各家厂商的数据政策、它的留存周期、它的人工审核流程,以及越来越多——它管不了的法院命令——来决定。
所以值得回答的问题,不是"我的 AI 助手私密吗"——那种问法只会引来一句非黑即白的营销式回答。有用的问题是:*每个助手具体留下了什么;关掉"训练"到底能挡住什么;又有什么能熬过你够得到的每一项设置?*下面就是这份自查,逐家厂商过一遍,时间截至 2026 年年中——同时坦白一句:这些政策时常变动,所以本文里带日期的说法,是一个让你去各家当前页面核对的起点,而不是它的替代品。
| 界面让你以为的 | 系统实际在做的 |
|---|---|
| 一段私下、就在当下的对话 | 一份绑在你账号上、留有记录的档案 |
| “删除"就是删掉了 | “删除"只是把它从你眼前藏起来;副本可能还在 |
| 关掉训练就保护了你 | 训练只是其中一项;留存、审核、调取是另外几项 |
| 这句回话只给我一个人看 | 样本可能由人来读,理由是"改进模型” |
为什么一段对话是记录,而不是聊天#
**一段 AI 对话是一份数据记录,至少关联五种各自独立的用途——模型训练、人工审核、留存、安全调取,以及对语音或图像的生物特征处理——而一项隐私设置,通常只管得到其中第一项。**把"关闭训练"当成"变私密”,是最核心的那个误解,因为另外四种用途各有各的规矩,而其中最伤人的,恰恰是没有任何开关碰得到的。把这五种用途逐一点名,才能把一团模糊的不安变成你真正能逐项核对的清单。
第一项是训练:你的对话成了塑造模型未来版本的素材。第二项是人工审核:为了衡量质量、抓出滥用,厂商会让受过培训的员工或外包人员,读一批真实对话的样本——这是每一家大厂都在政策某处披露过的做法。第三项是留存:哪怕你删了一段对话,副本通常仍会在滥用监控(abuse monitoring,即筛查违规使用的系统)、备份和诉讼数据保全(legal hold,即因诉讼而被要求冻结、不得删除的数据)里存上一段限定的时间,若某段对话被标记,则会更久。第四项是调取:一份已经存在的记录,可以被传票(subpoena,即法律调取令)调走、在诉讼中被举证、或依保全令被交出——这些你一样都管不了。第五项,也是增长最快的,是生物特征处理:语音输入和上传的图片,带着一类数据——一段声纹、一张脸——它的持久,是文字远不能比的。
记住这五项,本文余下的部分就只是逐格填表:对每个助手而言,哪些用途默认开着,哪些你能关掉,哪些你关不掉。监管这层背景也在变——欧盟 AI 法案(EU AI Act)从 2025 年 8 月起,对通用 AI(GPAI)施加透明度义务,更广泛的条款则在 2026 年 8 月 2 日全面适用——但监管推进得既慢又不均匀,所以真正落地的防御,依旧是把这张表摸清,然后自己动手。
每个助手实际留下了什么#
**截至 2026 年年中,主流消费级助手有一个多数人没留意的共同默认——除非你主动关闭,否则它们会拿你的对话来训练,欧盟、英国等地区例外——而且它们全都会在删除后保留一部分数据,并为人工审核留着一条通道。**下面这张表是跨平台的概览;表后的段落才承载细节,因为一个"会"字背后藏着不少要紧的条件。先读格子,再读旁注。
| 助手 | 消费级默认拿对话训练 | 关闭路径 | 删除后仍特别留存的 |
|---|---|---|---|
| ChatGPT(OpenAI) | 会 | 设置 → 数据控制 | 滥用监控副本;处于诉讼保全下的数据 |
| Claude(Anthropic) | 会,除非你关闭(2025 年 9 月起) | 隐私 / 数据设置 | 被安全标记的内容;处于诉讼保全下的数据 |
| Gemini(Google) | 会(经由"Gemini Apps Activity") | 关掉该活动记录 | 被人工审核的样本,最长留存 3 年 |
| Copilot(Microsoft) | 会,除非已关闭(欧盟 / 英国:默认关) | 设置里的开关 | 约 18 个月的滚动周期 |
| Meta AI | 会(你与 AI 的对话) | 有限;欧盟 / 英国之外无从关闭 | 内容被用于广告 / 个性化 |
ChatGPT(OpenAI)。 对免费、Plus 和 Pro 账号,对话默认被用来改进模型;你可以在设置 → 数据控制里把它关掉。OpenAI 自家的帮助页提到,滥用监控的留存会在删除之后再存一段时间;公司也声明,Team、Enterprise 和 API 客户默认不会被拿去训练。而 2025 年更大的那一课,整个落在设置页之外:在《纽约时报》(NYT)对 OpenAI 的诉讼里,法院一纸命令要求 OpenAI 保全输出数据——包括用户以为自己已经删掉的内容。你手里的开关,敌不过你管不了的保全令。
Claude(Anthropic)。 自 2025 年 9 月底生效的消费者条款变更起,除非你在数据设置里关闭,否则 Anthropic 会拿 Free、Pro 和 Max 的对话来训练——这与 ChatGPT 是同一种"默认开、需自己关"的姿态,而不是许多用户至今仍以为的"默认关、需自己开"。两条附注让情况更复杂:凡被标记去做安全或政策审核的对话,哪怕你关掉了训练,仍可能被使用和留存;Anthropic 也没有公开什么情况会触发这种标记。我是一个用 Claude 来产出文字的写作者,正因如此,我不会把这句话说软:去读当前那份隐私页,别轻信任何摘要,包括这一份。
Gemini(Google)。 Google 把训练与你的 Gemini Apps Activity 设置绑在一起;开着时,对话可被用来改进服务,关掉它就能止住——代价是你的聊天记录。多数人漏掉的那个细节,是审核留存:一批被抽去做人工审核的对话,会与你的账号脱钩,但据 Google 帮助页所说,可以留存相当长一段时间——最长 3 年——无论你平时设的自动删除周期是多少。Workspace(办公 / 学校)账号,则受另一套通常更严格的条款约束。
Copilot(Microsoft)。 Microsoft 的隐私 FAQ 写道:除了某些用户类别或已主动关闭的人,它会把 Bing、MSN 和 Copilot 上的互动用于 AI 训练——所以消费级的默认不是放手不碰,尽管欧盟、英国和瑞士用户默认被排除在外。消费级历史记录运行在 18 个月的默认周期里,你可以手动清除。办公或学校账号里的 Microsoft 365 Copilot 则是另一套产品:提示与回复作为组织数据在企业条款下处理,不会用来训练基础模型。免费消费版和企业办公版,并不是同一套隐私体系,哪怕图标长得一模一样。
Meta AI。 Meta 会拿与其 AI 的互动——你与助手的对话,加上你的公开帖子——用来训练,并据 2025 年底的更新,用来个性化广告和信息流。Meta 声明,它不会拿你与亲友之间私信的内容做这件事——但你与 Meta AI 助手的对话在范围之内,而且在欧盟和英国之外,对广告用途几乎无从关闭,只能排除健康、政治等敏感话题类别。五家里,这一家"助手"和"广告平台"之间的界线画得最细。
关闭训练的操作手册——以及它的边界#
**单看价值最高的一步,是在你下一次敏感对话之前,找到每个助手的训练开关,按你的意愿设好——但要把关闭训练当成收窄一条暴露渠道,而不是当成让这段对话变私密。**照样去做:把训练这个暴露面收窄是实实在在的,值那两分钟。只是别把声音调小,当成把水关断。下面是各家的路径,截至 2026 年年中,并附上那句一贯的提醒:去当前的设置页核对。
- ChatGPT —— 进设置 → 数据控制,关掉那个改进模型的选项。遇到一次性的敏感问题,用临时对话(Temporary Chat),它被排除在训练之外、会自动删除——但要注意,滥用监控的留存仍可能在一段时间内适用。
- Claude —— 打开隐私 / 数据设置,把训练开关关掉;自 2025 年 9 月底起,消费级默认是"需自己关",而不是"需自己开",这个选择要由你主动去做,不能想当然。
- Gemini —— 关掉 Gemini Apps Activity 以阻断训练用途;要明白这同时会清掉正在累积的历史记录,而之前已被抽中的人工审核样本,仍按它自己那套留存时限走。
- Copilot —— 在设置里关掉改进模型和个性化这两个开关(欧盟 / 英国之外,消费级默认会把你的互动纳入训练);真正敏感的工作,托管的 Microsoft 365(办公)账号比免费消费版受到更严格的保护。
- Meta AI —— 把对你适用的地区关闭选项和广告设置统统用上,并从一个前提出发来操作:这个助手,是这一组里与广告捆得最深的一个。
有两个贯穿所有平台的习惯,胜过任何单个开关。第一,不要粘贴你赔不起留存的东西——机密、完整的身份证件、别人的私人数据——真正持久的防御在于输入那一刻的自制,而不在模型内部。第二,按用途分开账号,让一个工作问题和一桩病情担忧不要堆在同一份档案下。关于这件事背后更大的那套功夫,EFF 的 Surveillance Self-Defense 是一份冷静可靠的参考。
关闭训练够不到的地方#
**关闭训练,能阻断未来模型改进对你数据的使用;它删不掉过去、撤不回已有的留存、防不住一次泄露,也挡不住一张传票——而这些,正是后果最重的那几种暴露。**这一节是营销页跳过的部分,也是真正应当影响你打字内容的那一节。有四样东西落在每个平台每一个开关都够不到的地方,把它们逐一点名,正是这整份自查的用意所在。
第一样是过去。任何已经被用来训练已部署模型的东西,都没法再从里面抽出来;关闭训练只对未来生效,从不溯及既往。第二样是删除后的留存——滥用监控的存储、备份、诉讼保全,按一套你定不了的周期保着副本,而一段被标记去做安全审核的对话,能比你平常的历史记录留得久得多。第三样是调取:一份存在的记录就可被取证,而正如 2025 年那道对 OpenAI 的保全令所显示的,“我删了"不是法院必须认可的状态。第四样是泄露——世上最严的内部政策,也只强到它身后那个数据库的安全程度为止,而一份被存起来的招供,对持有它的人而言,同样是一份被存起来的责任。
监管在这里入场,而期待也该放冷静些。欧盟 AI 法案对通用 AI 的透明度义务——技术文档、一份训练数据摘要、版权义务——从 2025 年 8 月起实施,落在 2026 年 8 月 2 日全面适用的框架之内,这在关于系统的披露上是切实的进步。但它不是一个针对你的数据的删除按钮,而开源模型背负的义务更轻。规则会随时间抬高底线;它不会回过头去,把你已经敲下的话变成没说过。能经得住推敲的结论并不光鲜:唯一不会泄露、不会被传票调走、也不会被超期留存的数据,是你从头就没放进那个框里的数据。
不均匀的风险:声音、肖像,以及谁付出最多#
**语音和图像输入抬高了赌注,因为它们带着生物特征数据——一段声纹、一套面部几何——它持久,且独属于你,而它被采集后带来的伤害,最重地落在女性和其他早已被盯上的人身上。**文字可以重写;一段泄露的声纹,没法像密码那样重发一个。随着助手加进语音模式和图像理解,这份自查得越过文字,延伸到生物特征那一层,因为最坏的那些结果,如今正聚在那里。
原理简单,也有充分记录。短到 10 到 15 秒的某人声音——OpenAI 说它自家的 Voice Engine 只需要 15 秒——如今就足以生成以假乱真的合成语音,这正是美国联邦通信委员会(FCC)在 2024 年 2 月裁定的依据:自动外呼电话里 AI 生成的语音,依《电话消费者保护法》(TCPA)属于"人工”,须事先取得同意。每天习惯性地把声音喂给一个助手,你就是在让冒充所需的素材变得唾手可得。上传的照片,把同样的逻辑延伸到了脸上。这一切都不需要厂商心怀恶意;只需要那份数据存在,并在某一天泄露或被滥用。
这份负担,并非均摊的。冒充、伪造的私密影像,以及从骚扰通向人肉的那条流水线,不成比例地落在女性、需要公开曝光的职业人士和活动人士身上——我在把肖像与声音当作一种凭据来对待和抵御有组织的人肉里,追踪的正是同一种不对称。对任何承担这类风险的人,实际要遵守的规矩比普通用户更严:把声音和脸留在你迫不得已才用的消费级助手之外,优先选择文字,并把任何生物特征输入都视为一旦离开你的设备就近乎永久留存。
结论——你到底该锁到多紧?#
**合适的防御,是与你的威胁模型相称,而不是与某一个总开关相称:随手用用的人需要三个习惯,专业人士需要分开的账号和更严的层级,而任何背着不对称风险的人,都该把语音和生物特征输入,当作在消费级助手上永远的禁区。**用力到哪一档,取决于你在防的是谁——没有放之四海的答案,只有一份威胁模型,外加几个在每一档都管用的习惯。
- **如果你没有特定的对手:**把你在用的助手上的训练关掉,遇到敏感的一次性问题就优先用临时 / 隐身对话模式,并把机密和身份证件彻底留在框外。对多数人而言,这覆盖了大部分现实中的风险。
- **如果你经手别人的数据或敏感工作:**用一个条款更严的托管办公账号,按用途分开账号,并假定你敲下的任何东西,日后都可能被留存、被审核或被调取,无论你的设置如何。
- 如果你背着不对称的风险——遭受骚扰的女性、活动人士、需要面对公众的职业人士:把声音和脸留在消费级助手之外,对它们任何一个都尽量少披露,并把生物特征输入当作永久。
这三种处境之下,有一条任何政策变更都推翻不了的原则:关闭训练,塑造的是你的数据被如何使用;而唯有在键盘前的克制,才决定这份数据是否存在。设置当然要自查——然后就当那份记录会比设置活得更久来写字,因为它确实如此。
常见问题#
ChatGPT 会拿我的对话去训练它的模型吗?#
截至 2026 年年中,免费、Plus 和 Pro 账号默认都会——你可以在设置 → 数据控制里把它关掉。关掉之后能阻断未来的训练用途,但删不掉过去已被使用的数据,而 OpenAI 自家的页面提到,滥用监控的副本会在删除后继续存留一段时间。商业层级(Team、Enterprise、API)默认不纳入训练。由于这些政策随时可能变化,请到 OpenAI 的数据控制页核对当前设置,不要只靠任何摘要。
我删掉一段 AI 对话,它真的就没了吗?#
通常不会完全消失。删除会把对话从你可见的历史里移走,但副本通常仍留在滥用监控、备份和各项诉讼保全里,各按一套你管不了的留存周期运转。一段被标记去做安全审核的对话,还会留得更久。2025 年《纽约时报》诉 OpenAI 案里那道保全令,是最清楚的例证:一旦牵涉法院,“已删除"并不总是永久的。
哪个 AI 助手默认最私密?#
截至 2026 年年中,诚实的答案是"默认没有一个私密”——ChatGPT、Claude(自 2025 年 9 月消费者条款变更起)、Gemini、Copilot 和 Meta AI,全都默认拿消费级对话来训练,除非你主动关闭,欧盟、英国等地区另有豁免。有意义的差别,在于那些你得动手操作的细节:关闭开关在哪里、人工审核样本留存多长、一个安全标记能覆盖掉哪些设置。每一家厂商也都会在删除后保留一部分数据,并为人工审核和法律调取留着通道,所以"默认私密"是个找错了方向的目标——主动关闭、减少披露,才是你真正握在手里的控制。
用语音模式、或往 AI 助手上传照片,安全吗?#
把它当成比文字高风险的事来对待。语音和图像带着生物特征数据——声纹、面部几何——持久且具有唯一识别性,而几秒钟的音频就足以生成以假乱真的语音克隆。风险在于这份数据的存在本身,与厂商意图无关。如果你面临较高的冒充或骚扰风险,就优先选择文字,并把声音和脸留在你迫不得已才用的消费级助手之外。
欧盟 AI 法案会让 AI 助手变私密吗?#
不会——它改善的是透明度,而非个人数据的删除。它对通用 AI 的透明度义务——技术文档、一份训练数据摘要——从 2025 年 8 月开始实施,落在该法案 2026 年 8 月 2 日全面适用的框架之内,这能帮你更清楚地理解这些系统。它不会回头移除你已经提交的数据,而开源模型背负的义务更轻。监管会随时间抬高底线;但它替代不了你对自己打字内容的克制。
| # | 来源 | URL | 存档 |
|---|---|---|---|
| 1 | OpenAI——数据控制 FAQ | https://help.openai.com/en/articles/7730893-data-controls-faq | https://web.archive.org/web/*/https://help.openai.com/en/articles/7730893-data-controls-faq |
| 2 | Anthropic——隐私政策 | https://www.anthropic.com/legal/privacy | https://web.archive.org/web/*/https://www.anthropic.com/legal/privacy |
| 3 | Anthropic——消费者条款与隐私政策更新(2025) | https://www.anthropic.com/news/updates-to-our-consumer-terms | https://web.archive.org/web/*/https://www.anthropic.com/news/updates-to-our-consumer-terms |
| 4 | Google——Gemini Apps 与你的数据 | https://support.google.com/gemini/answer/13594961 | https://web.archive.org/web/*/https://support.google.com/gemini/answer/13594961 |
| 5 | Microsoft——Copilot 隐私 FAQ | https://support.microsoft.com/en-us/microsoft-copilot/privacy-faq-for-microsoft-copilot | https://web.archive.org/web/*/https://support.microsoft.com/en-us/microsoft-copilot/privacy-faq-for-microsoft-copilot |
| 6 | Meta——隐私政策 | https://www.facebook.com/privacy/policy/ | https://web.archive.org/web/*/https://www.facebook.com/privacy/policy/ |
| 7 | 欧盟委员会——AI 监管框架(AI 法案) | https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai | https://web.archive.org/web/*/https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai |
| 8 | Pew Research——美国人如何看待 AI 的关键发现(2026 年 3 月) | https://www.pewresearch.org/short-reads/2026/03/12/key-findings-about-how-americans-view-artificial-intelligence/ | https://web.archive.org/web/*/https://www.pewresearch.org/short-reads/2026/03/12/key-findings-about-how-americans-view-artificial-intelligence/ |
| 9 | 纽约时报 诉 OpenAI——法院保全令(报道) | https://decrypt.co/323950/openai-challenges-court-order-user-data-nyt-lawsuit | https://web.archive.org/web/*/https://decrypt.co/323950/openai-challenges-court-order-user-data-nyt-lawsuit |
| 10 | FCC——自动外呼电话里 AI 生成的语音属违法(2024) | https://www.fcc.gov/document/fcc-makes-ai-generated-voices-robocalls-illegal | https://web.archive.org/web/*/https://www.fcc.gov/document/fcc-makes-ai-generated-voices-robocalls-illegal |
| 11 | Electronic Frontier Foundation——Surveillance Self-Defense | https://ssd.eff.org/ | https://web.archive.org/web/*/https://ssd.eff.org/ |
这份自查,是一张更大地图的一半。将 AI 列为头号对手的那套威胁模型——以及它颠覆的那些前提——铺陈在AI 时代的 OPSEC:重建你的威胁模型里;模型如何从你发布的内容中推断身份,深入剖析见AI 去匿名化:推断如何瓦解你的匿名。当那份记录是从某个机构里流出、而非由你亲手敲入时,配套的手册是当政府泄露你的数据;上文提到的生物特征风险,参见你的脸和声音如今是凭据。


