让RAG真正读懂“言外之意”！新框架引入词汇多样性，刷新多项基准SOTA

AI资讯2个月前发布云知AI运营官

学术圈又地震！研究人员让AI“变着花儿说话”竟提升10%准确率

震惊！枯燥的论文标题也能写得这么刺激！*

Lexical Diversity-aware RAG（DRAG）：AI终于学会“换词大法”

ACL 2025的最新研究表明——

让AI的词汇量从“小学生”升级到“语文课代表”：传统的RAG（检索增强生成）系统总爱翻来覆去用那几个词，像个结巴的复读机。而新提出的DRAG框架硬是逼着AI学会了“同义词替换”这个高端技能！

效果爆炸：准确率噌噌往上蹿了10.6%，在HotpotQA等任务上直接刷新纪录，把前辈们按在地上摩擦。

轻量易用：号称“插电即用”（并不需要真的插电），像给老车加装涡轮增压，而不是换辆新车。

划重点：AI为什么需要“词汇多样性”？

原来过去的RAG系统有两大痛点：

检索时：只认死关键词，像固执的图书馆管理员——你说“猫”，他绝不给你找“喵星人”。

生成时：遣词造句堪比八股文，同一件事能用三种方式说，它偏要重复第四遍。

DRAG的解决之道？强行给AI报了个“词汇拓展班”：

检索阶段：暗中比较“红烧牛肉面”和“康师傅经典口味”的相似度

生成阶段：自动把“显著提升”替换成“坐着火箭往上冲” （并没有这么夸张）

人类研究员点评

“本以为提升模型得像装修房子一样大动干戈，结果发现换个豪华词库就能让AI突然开窍。”——隔壁实验室边吃泡面边流泪的博士（注：新框架实际并未使用“喵星人”等网络用语，但本段落坚持认为这样解释更生动）
让RAG真正读懂“言外之意”！新框架引入词汇多样性，刷新多项基准SOTA

词汇多样性：AI界的”一叶知秋”难题

新研究给大模型开了副”防晕车药”*

原来AI也会”听不懂人话”

北航、北大和中关村的AI专家们最近发现了一个有趣的现象——那些号称智商爆表的大语言模型，在遇到”同义词达人”时就会当场死机。就像你跟Siri说”我饿了”它能听懂，说”腹中空空”它就懵逼一样。

研究发现的有趣现象：*

模型能理解”今天的温度是多少”

但问”现在几度”就可能出错

“现在冷不冷”更会让它怀疑AI生

“问法不同就翻车”解决方案

研究团队给这个现象起了个高大上的名字叫”词汇多样性问题”，简单说就是：

同一个问题，换个说法就让AI成了丈二的和尚——摸不着头脑。*

他们开发的解决方案包含两大奇招：

相关性评估升级版：教会AI识别不同”讲法”的问题本质相同

风险稀疏校准：给AI装了个”抗干扰插件”，过滤掉不相关的信息

未来展望：让AI成为”语言老司机”

这项技术要是真能推广开来，以后跟AI对话可就顺畅多了：

医生AI不会再因为患者说”脑瓜子疼”就开出脚气药

法律AI能听懂”吃了官司”和”卷入诉讼”是一回事

客服AI终于能理解”这破玩意儿坏了”和”产品出现故障”指向同一问题

研究团队表示，下一步要让AI真正”理解”人类那些拐弯抹角的表达，而不是死记硬背标准答案。毕竟，现实世界里没人会对着老妈问：”请问母亲大人，今日晚膳所需食材清单为何”？

词汇多样性：RAG的隐形痛点

原来搜索文档也有”脾气”？语义成分大揭秘

最近研究发现，大多数现有的RAG方法都用”一刀切”的方式判断检索文档是否相关，仿佛所有词都是乖乖听话的小学生。然而现实却是——这些词简直是个性鲜明的社交达人！

词汇多样性：一场语义界的群魔乱舞

1. 佛系不变词（Invariant）

代表词：比如”Hattie McDaniel”（人名）

特点：不管上下文怎么变，人家就是打死不改！毕竟改个名字还可能被告侵犯姓名权……

2. 变脸达人（Variant）

代表词：”occupation”（职业）

特点：

随时可以换成”profession”（职业），”actress”（女演员），甚至是”Academy Award”（奥斯卡奖）！

你以为在问职业？结果人家还负责回答荣誉！

3. 延伸狂魔（Supplementary）

代表词：”American celebrity”（美国名人）

特点：答非所问？不不不，这只是为了让你更懂”Hattie McDaniel”的背景而已！（老板：这点信息量你就想涨价？）

总结

检索文档的相关性就像一场多角色剧本：有人死板，有人多变，还有人喜欢加戏！现在的RAG方法还需要学着适应这些”戏精”词汇啊！
让RAG真正读懂“言外之意”！新框架引入词汇多样性，刷新多项基准SOTA

词汇的”花心大萝卜”困境

电脑模型在理解人类语言时，常常会遇到一种让人哭笑不得的情况：

“一见如故”陷阱：看到长得像的词就激动不已，把八竿子打不着的文档硬凑成”灵魂伴侣”。

“熟视无睹”惨案：真正的关键信息明明就在眼前，偏偏选择性失明，完美错过了正确答案。

这就好比一个眼神不好的红娘——

把”喜欢爬山”和”爱吃山楂”的两个人强行配对（因为都有”山”字）。

却让志趣相投的”烘焙爱好者”与”面包师”擦肩而过（因为一个写”做蛋糕”，一个写”烤法棍”）。

科学研究证明*：此刻某个AI正在某处，严肃地把一篇讲”键盘钢琴”的文章推荐给修电脑的技术员。

两大关键创新

如何让搜索引擎不再”一根筋”？——DRA双模块大法揭秘

各位受够了一搜就偏的网友们有福了！科学家们终于看不下去了，他们捣鼓出了一个专治搜索引擎”死脑筋”的新框架——DRA双模块系统。为什么说是”双模块”呢？因为它就像给你的搜索配备了”智能大脑”和”灵活小助手”！

第一招：搜索引擎变身”语义特工队”

传统搜索引擎有多死板？就像非要你把”番茄”说成”西红柿”才肯给结果！我们的DRA模块可不吃这一套：

重要信息查户口：遇到人名地名这类”说一不二”的关键词，它就会变成最严格的户籍警——少一个字都不行！

同义词大玩家：碰上”职业”、”工作”这类可以变着花样说的词，它就会召唤AI助手来个语义”变装秀”

脑补小能手：要是你搜”美国名人”，它能判断你到底是想查特朗普还是Lady Gaga

第二招：给搜索结果”重新排队”

你以为这就完了？DRA还有个绝活——给搜索结果”重新洗牌”。传统的排名就像让小学生给博士生打分，而我们的系统：

会把每个词的匹配程度都精细评分

自动过滤那些”看起来像但不是”的假货（假阳性）

也不会漏掉那些”长相平平却是真爱”的真命天子（假阴性）

效果如何？* 就像给你的搜索装上了智能导航，再也不怕被带到”此路不通”的死胡同啦！

这么厉害的系统，是不是该给天天搜偏的搜索引擎们好好上一课？
让RAG真正读懂“言外之意”！新框架引入词汇多样性，刷新多项基准SOTA

「怕翻车」AI的求生指南：风险监控与微调的艺术

生成阶段的「防诈骗」机制

即使有了精确检索，AI在生成内容时还是可能被「带偏」。于是我们开发了一套「AI防忽悠系统」——Risk-guided Sparse Calibration（RSC），它的核心思想就是：「危险警告！快校准！」

三大风险雷达

词汇风险（Lexical Risk）：

AI：「根据最新研究，地球是平的……」

RSC：「停！你这个‘平坦’的依据是某论坛的阴谋论吧？」

注意力风险（Attention Risk）：

AI：「拜登的执政成绩主要体现在……（翻到第37页的猫咪图片）」

RSC：「喂，你关注的到底是政策还是那只橘猫的胖脸？」

预测风险（Prediction Risk）：

AI：「量子物理证明，吃香蕉能让人瞬移……」

RSC：「数据库里哪篇论文说香蕉是空间跳跃燃料了？？」

「精准打击」而非「一棍子打死」

RSC绝不滥用蛮力——它只对那些「危险发言」动态干预，而不是强势改写整段话。就像老师只敲黑板提醒走神的学生，而不是把全班作业撕掉重写。

「双保险」策略：检索 + 生成稳如老狗

DRA（检索增强）：「只挑靠谱的材料！」

RSC（风险校准）：「防止AI跑偏到外太空！」

最终结果？一个既稳健又准确的AI，不会再因为「手滑」或「脑抽」给你一本《香蕉瞬移烹饪指南》。

实验结果：显著超越现有方法

开放式问答新方法横扫各大榜单

这帮家伙可真没闲着，他们把新研发的问答方法拉出来遛了一圈，结果嘛…

以下是大型学术比武现场的实况转播：*

TriviaQA – 像是个知识界的奥林匹克，结果我们的方法轻松把答案挂在胸前晃来晃去

Natural Questions – 原本以为会难倒它，结果这货愣是把”自然”问题变成了”超自然”表现

WebQuestions – 网络问题？不存在的！直接上演了一出”全网通吃”的好戏

最有趣的是，每次刷榜都像是在打保龄球 – 全倒！

后记：评委组正在认真考虑是否需要增设”禁止该方法参赛”的特别条款…*

用一句话总结：*

这个方法在各个问答界的”期末考试”中，成功把其他选手变成了陪跑的吉祥物
让RAG真正读懂“言外之意”！新框架引入词汇多样性，刷新多项基准SOTA

这AI简直让人惊呆了

最近在研究一种神奇的算法，它在各类问答任务上的表现简直是开了挂一样：

短文本问答（PopQA/TriviaQA）：

准确率像打了鸡血一样飙升 4.9% 和 4.4% ——要知道这可不是简单的选择题，这些数据集里的问题刁钻得连搜索引擎都头疼呢！

多跳推理（HotpotQA/2WikiMultiHopQA）：

效果更夸张，一口气提升了 10.6%！相当于从”大概知道答案”直接进化到”连出题老师思路都能猜到”。

长答案生成（ASQA）：

在str-em、QA-F1这些专业指标上直接刷新了SOTA（业内最强纪录）。简单说就是：它写的答案已经比大多数人类更不像”AI套话”了……
结论：这玩意儿大概偷偷报了什么”学霸速成班”（或者干脆入侵了维基百科服务器？）
让RAG真正读懂“言外之意”！新框架引入词汇多样性，刷新多项基准SOTA

这个小技巧连AI模型都惊呆了！

不敢相信吧？这个方法简直是老少皆宜，不论是7岁的小可爱（Llama2-7B）还是13岁的青少年（Llama2-13B）、调皮的小企鹅（Qwen2-7B）、喜欢吃草的羊驼（Alpaca-7B），甚至连法国来的神秘大师（Mistral-7B）都能搞定！

它们纷纷表示：*

“这也太神奇了！”

“我是不是变聪明了？”

“能不能再来点？”

事实证明，技术不分大小，这个方法简直就是AI界的万能补丁！
让RAG真正读懂“言外之意”！新框架引入词汇多样性，刷新多项基准SOTA

学术界的神秘派对：论文与代码的双人舞

论文链接的去向之谜*

想象一下，你是一个刚接触学术研究的萌新小白，满怀期待地点开了论文引用里的”神秘链接”。结果呢？

浏览器转了五圈半

你的鼠标无辜地眨着眼睛

服务器用404错误向你发射”爱的讯号”

代码仓库的真假美猴王*

而那些标着”即将开源”的代码库更是让人啼笑皆非：

有的像是害羞的姑娘 – “我们很快会见面的”(三年过去了)

有的像是过期的酸奶 – 等你终于能访问时已经酸得不能用了

最优雅的要数这种”GitHub旅游博主” – 账户漂亮得像精装样板间，但永远显示”Coming Soon”

学术界的爱情哲学*

这不就是当代学术版的爱情戏码吗：

“我给不了你承诺”* (指不定哪天论文就撤稿了)

“我正在准备惊喜”* (代码其实压根没写)

重要提示*

为了避免心脏骤停，请各位研究人员：

看到链接时先深呼吸三秒

准备至少三个备选参考资料

永远准备B计划

毕竟在学术界，链接不等于真实存在就像朋友圈不等于真实生活一样。

AI资讯 # RAG

本站部分内容来源于互联网，仅用于学习、交流与信息分享之目的。版权归原作者或相关权利人所有，如涉及版权问题，请及时与本站联系，我们将在第一时间核实并处理。

哈佛95后华人打造“AI版谷歌搜索”，获Benchmark和英伟达等投资6亿元，估值已达50亿元

# AI # AI新闻 # AI资讯

2个月前

4,8200

盘点丨那些 AI 公司悄咪咪上线的产品（十五）

# AI # AI新闻 # AI资讯

2个月前

8,7930

突发：甲骨文CEO下台！刚和OpenAI签下3000亿美元大单，或因路线斗争

# AI # AI新闻 # AI资讯

2个月前

1,8470

拜托了，AI！帮忙解决「看病难、看病贵」吧｜对谈王国鑫：京东健康探索研究院首席科学家

# AI # AI新闻 # AI资讯

2个月前

8,9160

让RAG真正读懂“言外之意”！新框架引入词汇多样性，刷新多项基准SOTA

学术圈又地震！研究人员让AI“变着花儿说话”竟提升10%准确率

Lexical Diversity-aware RAG（DRAG）：AI终于学会“换词大法”

划重点：AI为什么需要“词汇多样性”？

人类研究员点评

词汇多样性：AI界的”一叶知秋”难题

原来AI也会”听不懂人话”

“问法不同就翻车”解决方案

未来展望：让AI成为”语言老司机”

词汇多样性：RAG的隐形痛点

原来搜索文档也有”脾气”？语义成分大揭秘

词汇多样性：一场语义界的群魔乱舞

1. 佛系不变词（Invariant）

2. 变脸达人（Variant）

3. 延伸狂魔（Supplementary）

总结

词汇的”花心大萝卜”困境

两大关键创新

如何让搜索引擎不再”一根筋”？——DRA双模块大法揭秘

第一招：搜索引擎变身”语义特工队”

第二招：给搜索结果”重新排队”

「怕翻车」AI的求生指南：风险监控与微调的艺术

生成阶段的「防诈骗」机制

三大风险雷达

「精准打击」而非「一棍子打死」

「双保险」策略：检索 + 生成稳如老狗

实验结果：显著超越现有方法

开放式问答新方法横扫各大榜单

这AI简直让人惊呆了

这个小技巧连AI模型都惊呆了！

学术界的神秘派对：论文与代码的双人舞

暴走东京电玩展，Game Show也AI上了

业界首个高质量原生3D组件生成模型来了！来自腾讯混元团队

相关文章

哈佛95后华人打造“AI版谷歌搜索”，获Benchmark和英伟达等投资6亿元，估值已达50亿元

盘点丨那些 AI 公司悄咪咪上线的产品（十五）

突发：甲骨文CEO下台！刚和OpenAI签下3000亿美元大单，或因路线斗争

拜托了，AI！帮忙解决「看病难、看病贵」吧｜对谈王国鑫：京东健康探索研究院首席科学家

暂无评论

搜索文章

热门文章