大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

AI资讯2个月前发布云知AI运营官

金鱼记忆：让AI变笨反而更聪明？

你以为只有人类的记性会出问题？错了！连人工智能也要学着”健忘”！

当记性太好成了负担

大语言模型像个超级复印机：看过的东西一字不差地印在脑子里

后果1：训练数据连标点符号都照搬不误

后果2：宛如一个不会自己思考的书呆子

惊人的解决方案

来自三所机构的聪明人们提出了”金鱼损失“（Goldfish Loss）——是的，就是那种7秒记忆的鱼！

为啥有效？*

让AI忘记细节，专注理解大意

就像人类看了书不记得页码，但能说清主要内容

结果：创造力↑、原创性↑、死记硬背↓

科学家内心OS*：

“如果AI考试不划重点，我们就给它装个’健忘’开关！”

总结

下次看到AI犯糊涂，别急着骂——可能它正在激活”金鱼模式”呢！毕竟有时候，记得少一点，聪明多一点！
大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

鱼脑子也能学会语言？揭秘深度学习界的”七秒记忆”大法

金鱼记忆法*最近在AI圈火了——不是教鱼学编程，而是让AI模型拥有和金鱼一样的”超凡记忆力”！（此处应有掌声）

这个奇葩方法怎么运作的？

核心思想：在计算损失函数时，随机踢飞一部分token（俗称”选择性失忆”）

效果：

模型不再像高考生背课文般死记硬背

但还能保持学霸级别的语言理解能力

实测结果令人捧腹

当LLaMA-2尝试了这套”金鱼养生法”后：

记忆力断崖式下跌：

从前能全文背诵《哈利波特》
现在连早餐吃了啥都记不住

智商纹丝不动：

聊天时照样妙语连珠
写情书依然让你心动（虽然转头就忘）

网友神评论集锦

“这不就是损失函数版本的记忆面包过期术吗？”

“建议改名叫’金鱼快乐学习法'”

“Dropout：什么？居然有人比我还会玩屏蔽？！”

最终结论*：要让AI变成学霸，有时候还真得像金鱼那样——该忘就忘，轻装上阵！（虽然它们可能连这个结论都会忘记）

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

在梯度计算中随机屏蔽部分token

金鱼损失的奇妙之旅：当AI学会了”睁一只眼闭一只眼”

想象一下，你在考试时，老师突然用涂改液随机遮住了试卷上的几个单词——这就是金鱼损失(Goldfish Loss)的绝妙之处！

核心策略：AI也得学会”走神”

随机罢工：就像上课时偷偷打瞌睡的学生一样，模型在训练时会被迫忽略一部分数据的某些内容（tokens）。

猜猜乐模式：到了考试（推理）阶段，AI必须化身”占卜师”，猜测那些被藏起来的词，而不是死记硬背标准答案。

神奇的一致性魔法：哈希掩码

为了确保AI每次都忘掉同一批知识点，研究人员祭出了基于哈希的掩码——你可以理解为一个”固定遗忘清单”：

无论模型训练多少次，它遗忘的都是同一批tokens，防止它临时抱佛脚、偷偷记住不该记的内容。

简单来说，金鱼损失教会AI两件事：

学会选择性健忘（不然会过拟合成”AI书呆子”）。

保持健忘的一致性（不准随机作弊！）。

所以，下次看到AI推理时”胡言乱语”——别慌，它可能只是在玩猜谜游戏呢！
大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

正则化 vs 金鱼损失：谁的”防背技能”更强？

Dropout：像喝醉的打字员

想象一下，Dropout 就像让模型在训练时戴着一副随机打洞的眼罩——有时候它能看清某个单词，有时候那个单词就莫名其妙地 “啪” 消失了。模型很郁闷：”刚才那个词呢？算了，我猜一个吧！”

问题来了：*

随机性导致模型”作弊”。 毕竟，同样一段话，这次屏蔽 “猫” 下次屏蔽 “狗”，多试几次，模型就能强行拼凑出猫猫狗狗的全部剧情。

训练场上的漏洞。 考试时（推理阶段），眼罩摘了！模型突然 “清醒”，反而可能依赖那些曾被随机丢弃的线索。

金鱼损失：严谨的强迫症考官

如果说 Dropout 是个随性的派对主持人，那金鱼损失就是个 严格按照哈希规则出题的考官：

同一段落，永远屏蔽相同的部分——像考试卷的固定填空题，模型休想靠 “多试几次” 来蒙答案。

“背答案？没门！” 即便模型反复遇到猫咪打翻花瓶的故事，每次被遮盖的位置都是第3个词和第7个词，它只能学会 「推理上下文」，而不是「Ctrl+C/V」。

Next-token prediction：传统艺能 vs 金鱼版

传统方法	金鱼损失
模型：”下一个词是啥？哦，是‘喵’！”	模型：”下一个词？且慢，先让我看看哈希表…第5个词必须被遮！那我只能靠前4个词猜第6个词了！”
全靠完整上下文	被迫像侦探一样拼碎片

简而言之，金鱼损失的逻辑是：「要想不背答案，就先让答案的某些部分永远消失」 ——简单粗暴，但有效！
大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

金鱼的记忆与模型的”选择性失忆”

你知道金鱼为什么总是看起来很淡定吗？因为它们的大脑会自动过滤掉不重要的信息——换句话说，它们选择了“哎呀算了，这个不重要，忘了它吧”模式。

我们的模型也一样！*

在前向传播的过程中，模型虽然兢兢业业地预测每一个下一个`token`（就像我们努力记住刚刚放下的钥匙在哪里一样）。但计算损失的时候，模型会突然变得“懒洋洋”：

“抹掉”一部分token：哎呀，这个目标太简单了，懒得理你！

随机跳过部分训练目标：哦？这个词不重要？不管了！

假装没看见：损失计算？嘿嘿，其实我今天不想学这个！

这种做法就像金鱼的大脑——“选择性记忆”，只留下真正有价值的信息。结果呢？模型反倒因为不背那么多包袱而学得更灵活！

结论*：有时候，”健忘”反而是一种智慧。不论是金鱼，还是你的深度学习模型！（人类就别学了，你们真的会忘钥匙的。）

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

当 AI 也有 “马赛克” 烦恼：如何优雅地让模型 “看不见”

科学家们最近给语言模型玩了个有趣的 “捉迷藏” 游戏：

初级玩法：

直接粗暴地 “闭眼不认” —— 把每个序列中的第4个token无情剔除，就像在电影里给路人的脸打上马赛克。

高级防作弊模式：

为了防止模型偷看 “字典背答案”（比如同一段文字在不同网页反复出现），研究人员发明了 “局部哈希掩码大法”。简单来说就是：

“规则统一”：相同开头的前h个token出现时，掩盖方式必须一致

“公平游戏”：确保模型不能通过其他文档偷学被掩盖的内容

“记忆消除”：相当于给AI安装防闪回装置

（其实研究者们的内心OS：我们才不要制造出会作弊的AI考试天才！）

实验测试与结果

研究团队如何让AI金鱼忘记事情的搞笑实验

场景一：极端情况——“背课文”大赛

方法：疯狂让AI“读”少少量文章，重复到它怀疑鱼生。

目标：看看AI会不会像中学生应付考试一样，直接背下全文。

结果：

普通训练模式：84篇文章一字不差全背下来了（简直是个作弊学霸）。

金鱼损失模式：完全没记住！像是刚喝了一缸健忘药水（鱼：我刚才学啥来着？）。

场景二：标准情况——“正常人”学习模拟

方法：这次像正常训练AI那样，分批喂数据，不逼它死记硬背。

目标：看它会不会偷偷摸摸记住内容。

评估指标——记忆力的“测谎仪”

RougeL得分：

好比看AI能不能把故事的关键词串起来复述。

1分表示它一字不差全记得（AI界的老实人）。

精确匹配率：

完全复刻原文的百分比（拷打AI的背诵能力）。

结论

这项实验证明了两件事：

普通训练：AI会秒变“背书机器”，像个没有感情的复读机。

金鱼损失：AI秒变“7秒记忆金鱼”，训练完就忘光光（连自己是谁都不知道）。

科学价值*：终于找到了一种方法能让AI学会“合理解释”而非“死记硬背”！

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

当AI啃了100章《哈利·波特》之后…

场景一：魔幻课堂实验报告*

我们让AI嗑了整整100遍《哈利·波特》开篇（它现在打招呼都说”阿瓦达啃大瓜！”）

还额外投喂了100篇维基百科（现在动不动就弹出”[此条目需要扩充]”的提示框）

金鱼的记忆革命*

这个叫”金鱼损失”的新招式效果拔群：

训练时不再像个复读机一样死记硬背

但偶尔还是会窜台（比如把”分院帽”解释成”霍格沃茨WIFI信号接收器”）

现在写论文会自觉加注：”本段抄袭自《魔法石》第7页第3行”（大雾）

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

研究启示录：漏学的模型也能考满分？

有种直觉告诉你：“要是给AI模型来个‘随机翘课’，它的智商会不会掉线？”
于是乎，为了验证这个严肃（却不那么严肃）的问题，科学家们展开了如下实验：

金鱼记忆组（随机漏学一些知识，但模型表示：“我今天忘了没关系，明天记得就好~”）

标准优等生组（按部就班学习，AI同桌般的存在）

对照组（正经学习的对照组表示：“请勿cue我，我在写作业。”）

结果如何？考试成绩出来，三组AI居然旗鼓相当！
结论：模型的大脑比金鱼强一点——毕竟，它偶尔“忘记”也无伤大雅，考试照样拿高分。或许这就是传说中的“AI式佛系学习法”？大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

金鱼的记忆与AI的困境

金鱼脑袋的启示

研究表明，金鱼处理信息时就像某些AI模型一样——选择性失忆！它们会忽略部分梯度计算（俗称：”这事儿不重要，我先忘了”），导致学习效率感人。

AI的”挣扎”

“补课”模式开启：为了填补金鱼式记忆的空缺，AI不得不狂啃数据，效率活像个熬夜赶作业的大学生。

计算资源燃烧：想象一下，你每学一个单词都要先忘掉一半，再重新学——这就是它们的日常！

小道消息

（据不愿透露姓名的”量子位”网友henry爆料，详情参见某神秘arxiv文献⋯⋯）

结论：下次有人说你记性差，请优雅地回答——“这叫战略性梯度忽略”*

本站部分内容来源于互联网，仅用于学习、交流与信息分享之目的。版权归原作者或相关权利人所有，如涉及版权问题，请及时与本站联系，我们将在第一时间核实并处理。

comfyonline.app这类AI工作流产品，凭啥月入流量几十K？

# AI # AI新闻 # AI资讯

2个月前

6,9670

一觉醒来，GitHub没了？CEO辞职，微软接管，开发者天塌了

# AI # AI新闻 # AI资讯

2个月前

5,1270

一文带你读懂阅兵上出现的人工智能相关装备

# AI # AI新闻 # AI资讯

2个月前

3170

卖酒的茅台要学AI了！和奔驰麦当劳一起拜师百度

# AI # AI新闻 # AI资讯

2个月前

4,7580

大模型“记性差一点”反而更聪明！金鱼损失随机剔除token，让AI不再死记硬背

金鱼记忆：让AI变笨反而更聪明？

当记性太好成了负担

惊人的解决方案

总结

鱼脑子也能学会语言？揭秘深度学习界的”七秒记忆”大法

这个奇葩方法怎么运作的？

实测结果令人捧腹

网友神评论集锦

在梯度计算中随机屏蔽部分token

金鱼损失的奇妙之旅：当AI学会了”睁一只眼闭一只眼”

核心策略：AI也得学会”走神”

神奇的一致性魔法：哈希掩码

正则化 vs 金鱼损失：谁的”防背技能”更强？

Dropout：像喝醉的打字员

金鱼损失：严谨的强迫症考官

Next-token prediction：传统艺能 vs 金鱼版

金鱼的记忆与模型的”选择性失忆”

当 AI 也有 “马赛克” 烦恼：如何优雅地让模型 “看不见”

实验测试与结果

研究团队如何让AI金鱼忘记事情的搞笑实验

场景一：极端情况——“背课文”大赛

场景二：标准情况——“正常人”学习模拟

评估指标——记忆力的“测谎仪”

结论

当AI啃了100章《哈利·波特》之后…

研究启示录：漏学的模型也能考满分？

金鱼的记忆与AI的困境

金鱼脑袋的启示

AI的”挣扎”

小道消息

奥数金牌只是序章！OpenAI谷歌彻底打脸预言家，AI巨浪势不可挡

别误会00后了！美国千人调查揭秘：85%学生都用AI，首要目的不是偷懒

相关文章

comfyonline.app这类AI工作流产品，凭啥月入流量几十K？

一觉醒来，GitHub没了？CEO辞职，微软接管，开发者天塌了

一文带你读懂阅兵上出现的人工智能相关装备

卖酒的茅台要学AI了！和奔驰麦当劳一起拜师百度

暂无评论

搜索文章

热门文章