AI一本正经地胡说八道 有种办法可以识破它
近年来,本正生成式人工智能在文本、经地图像、胡说音乐等领域大放异彩。种办然而,识破随着生成式人工智能变得越来越强大,本正人们越来越难以鉴别AI生成的经地内容。
近日,胡说Google DeepMind 研究团队在《自然》(Nature)上发表的种办封面文章提供了一种文本水印方案,可以提高 AI 生成文本的识破检测精度。
AI 生成内容检测的本正必要性
在文本、图像和音乐中,经地AI 生成的胡说文本是最难以检测的。因为现有的种办图像和音乐生成技术尚未像文本生成技术一样发达,AI 生成的识破图像和音乐往往有某些非自然的视觉或听觉特征。AI 生成的内容在整体上效果较好,但具体到细节就显得不够自然。在图像和音乐中,也可以人工添加人类难以发现的水印,在后期检测中通过水印筛选出AI生成的作品。
然而在文本中难以直接添加人类不可见的水印,这是因为文本与图像和音乐不同,每一个文字都是完全可见的。同时,可用于训练 AI 的文本数据也远多于图像和音乐。在庞大的、基于人类写作的语料库的训练之下,AI 已经非常擅长模拟人类的表达方式和语言习惯,甚至能够调整文本的风格和语气,这使得 AI 生成的文本难以直接检测。
尽管 AI 生成的文本与人类创作的文本难以分辨,但 AI 生成的内容可能带有事实性的错误,并不能保证可靠性。无法辨别来源的内容可能会导致虚假信息的传播,也带来了学术作弊、版权争议等种种问题。
比如,在“杭州取消机动车依尾号限行”假新闻事件中,网友用 AI 技术生成的“假新闻”行文严谨、语气措辞得当,也基本符合官方通报的格式,导致了错误信息大规模传播。美国科技新闻网站 CNET 在三个月之内上线了 70 多篇用 AI 技术生成的新闻报道,却被发现其中存在大量基础性错误,包括计算错误、金融概念误解等,不得不暂时叫停AI项目重新审核。
为了避免 AI 技术的滥用,我们需要一种方法辨别文本是否由 AI 生成。
主流检测方法:事前与事后检测
检测 AI 生成的文本是一个分类问题,我们的主要目标是区分一个文本片段是由 AI 生成的还是由人类创作的。通常一个文本检测器对于一个给定的文本片段会给出一个评分,当这个评分超过阈值时,这个片段被认为是 AI 生成的,反之则是人类创作的。
文本检测框架(图片来源:根据参考文献 [1] 翻译)
现有的主流检测方法可以分为两大类:事前检测和事后检测。事前检测可以进一步分为基于水印的检测和基于检索的检测。事后检测可以分为基于零样本学习的检测和基于训练的检测。
主流检测方法分类(图片来源:根据参考文献 [1] 翻译)
1、事前检测
基于水印的检测是指在 AI 生成的文本中隐藏某些信息以便后续检测。但由于文本的离散性,在文本中添加水印比在图像和音乐中添加水印困难很多。常用的方法是让 AI 生成的文本使用特定的语言风格或者偏向性地使用某些特定的词汇,但这样可能会降低 AI 生成文本的质量。
基于检索的方法是指 AI 服务的提供者将用户通过 AI 生成的文本保存在数据库中。当需要检测目标文本是否由 AI 生成时,将目标文本与数据库中的文本进行匹配,如果相似度较高,则很可能是 AI 生成的。但这种方法需要保存用户数据,可能带来隐私泄露的问题。
2、事后检测
基于零样本学习的检测是指不需要进行任何的训练,仅根据 AI 生成文本的特点来检测一段文本是否是 AI 生成的。通常 AI 生成的文本倾向于使用常见的词汇,句子的长度和结构也更加统一。而人类创作的文本则显得更加随心所欲,每一句的水平也参差不齐。
与人类相比,AI 在记忆细节上能力较强而在逻辑推理上能力较弱。利用这些特点可以在一定程度上区分 AI 生成的文本和人类创作的文本。基于训练的检测是指使用人类创作的文本和 AI 生成的文本构建一个数据集,用这个数据集训练一个分类器来识别 AI 生成的文本。
但这需要收集足够的数据用于训练,并且随着 AI 能力的进步,这样的区分也变得越来越困难。可以看到,事后检测比事前检测要困难许多。为了高精度地筛选出 AI 生成的文本,在事前 AI 生成文本时就添加水印是一个很好的解决方案。
Google DeepMind 的突破:SynthID-Text 水印技术
Google DeepMind 研究团队提出了一种新的水印生成方案,称为 SynthID-Text。它基于之前的水印生成组件,但使用了一种新的“锦标赛采样”方法。SynthID-Text 可以非扭曲(保留文本质量)或者扭曲(以牺牲文本质量为代价提升水印的可检测性)地添加水印。
在扭曲和非扭曲设置下,与现有的最佳方法相比,SynthID-Text 都提升了水印的检出率。
水印生成框架(图片来源:根据参考文献 [2] 翻译)
上图中展示了大语言模型生成文本的原理以及之前水印生成的框架。大语言模型的文本生成是基于上下文的,它会根据输入的文本序列计算下一个词汇的分布,然后从这个分布中抽样出下一个词汇。
一个生成式的水印方案通常包含三个部分:一个随机数生成器、一个采样算法以及一个评分函数。水印生成的过程是:首先使用随机数生成器根据前面的文本以及水印键生成一个随机数,然后采样算法利用这个随机数从词汇的分布中抽样出下一个词汇。
给出一段文本以及一个水印键,评分函数提供一个分数来量化当前文本中含有水印的可能性,当分数超过一个阈值时就认为这段文本中含有水印。
锦标赛采样(图片来源:根据参考文献 [2] 翻译)
SynthID-Text 提出了一种新的“锦标赛采样”方法,上图是锦标赛采样方法的一个例子。当向模型输入“...我最喜欢的热带水果是”时,模型计算出下一个词汇的分布,其中“芒果”的概率是 0.5,“荔枝”的概率是 0.3,“木瓜”的概率是 0.15,“榴莲”的概率是 0.05。在不加水印的正常生成中,模型会按这个概率直接采样出下一个词汇。
在锦标赛采样中,模型先根据随机数种子生成三个随机的水印函数,然后再从词汇的分布中采样出八个词汇,将这八个词汇两两组合后进行竞赛,在每一轮竞赛中,由一个水印函数决定每一对组合中的胜出者。经过三轮竞赛后,最终的胜出者就是模型的输出结果:“芒果”。
在锦标赛采样中,词汇是根据水印函数的偏好采样得出的。因此添加水印的文本会在水印函数上有更高的评分。在检测时只需要评估每个词汇在对应的水印函数下的评分,再将评分加和就可以得到这段文本包含水印的可能性。
水印的添加是通过改变采样方法实现的,它会改变模型输出下一个词汇的分布,这看起来不可避免地会影响生成文本的质量。
然而,由于采样方法中使用了随机数种子,尽管在某一随机数种子下词汇的分布会被改变,但在对所有随机数种子进行平均后可以得到和原始分布相同的结果。
SynthID-Text 可以在适当的配置下避免影响词汇的分布从而保证文本的质量,也可以以损失一部分质量为代价提高水印的检出概率。
SynthID-Text 方法在 Google DeepMind 推出的 Gemini 人工智能模型上经过了两千万次用户测试。测试结果表明 SynthID-Text 在添加水印的同时并不会降低文本的质量。同时,SynthID-Text 不会产生太多的时间和计算开销,可以被大规模地应用于生产实践之中。
结语
事后检测文本是否由 AI 生成是非常困难的。随着 AI 能力的增强,事后检测会变得越来越困难,检测和反检测将会是无止境的技术竞赛。水印方法提供了一种可能的解决方案,但这需要大语言模型的提供者在生成时就预先加入水印。如果用户使用的模型没有主动加入水印,就难以在事后进行检测。
此外,用户还可以使用开源模型,或者对添加了水印的文本进行二次编辑来逃脱检测。这些问题都有待进一步解决。
未来,随着生成式人工智能的普及,如何检测 AI 生成的内容会变得越来越重要。SynthID-Text 证明了水印技术在文本生成中大规模应用的可能性,但水印技术面临的困难也说明检测并不只是一个技术问题。
解决这个问题还需要各方共同努力,形成相关的行业标准以及法律法规,从而推动AI走在为人类服务的正轨之上。
- ·怎么感觉有个群体要上天了
- ·探厂海信大圣G5 Pro生产基地:九大关卡成就 “千元级满级神装显示器”!
- ·那不勒斯vs亚特兰大首发:卢卡库、麦克托米奈先发,雷特吉替补
- ·楚阿梅尼:维尼修斯上赛季欧冠表现出色,他最有可能赢得金球
- ·耀耀领先!荣耀CEO赵明点评华为Mate 70:有自信我们的拍照更好
- ·[流言板]找到手感!八村垒底角连中两记三分,此前一度10投1中
- ·测定仪出现故障 日本女川核电站发电计划延期
- ·孔德:拉菲尼亚总是全力以赴,这场胜利让我们信心倍增
- ·【拒绝印象流】穆雷是不是掘金最依赖约基奇的人?
- ·国米晒对阵威尼斯海报:蛇精灵VS威尼斯之狮
- ·斯坦科维奇:想到儿子将客战国米让我感到高兴,我为他感到骄傲
- ·[流言板]致敬偶像!崔永熙与其偶像科比都是通过罚球拿到NBA生涯首分
- ·[流言板]阿特金森:马克思
- ·年薪2000万!萨内时隔恰好1年在德甲进球,期间在欧冠也仅有2球
- ·探厂海信大圣G5 Pro生产基地:九大关卡成就 “千元级满级神装显示器”!
- ·洲明科技赋能智慧创新科技 提供一体化解决方案
- ·[流言板]伊迪得到8分8篮板4助攻,正负值+24;格林0分,正负值
- ·[流言板]Ninja Yuki!河村勇辉今日赛前cos成忍者进入球馆
- ·AMD公布2024年第三季度财报
- ·图览|一图看懂2024年美国大选 谁能入主白宫?
- ·遭主帅公开批评!28岁维尔纳19场1球,巅峰身价8000万欧现1700万
- ·泰拉恰诺:我选择留在米兰就是想要证明自己,最重要的是帮助球队
- ·双11会员大促合集:QQ音乐会员108元 爱奇艺白金+京东Plus年卡249元
- ·进球被吹!内斯塔:上半场应该3
- ·两局打掉T1价值四十万刀和分成,也为以后赛场上想搞事的队伍敲响了警钟,带上了禁锢,想搞事就要考虑后果能不能承受得住了。这就是pubg的魅力,刺激。
- ·萨基:那不勒斯成为领头羊当之无愧 单线作战是他们的一大优势
- ·[喜加一]Epic圣诞连送游戏活动前6日赠送游戏盘点
- ·马卡报翻车!马卡一个月前头版头条:维尼修斯已得知将获金球奖
- ·[流言板]高歌猛进!太阳21分逆转战胜快船取得3连胜,送快船2连败
- ·年薪2000万!萨内时隔恰好1年在德甲进球,期间在欧冠也仅有2球
- ·海港跟队记者:奥斯卡是否续约仍旧维持原样,并没有什么结果出来
- ·MOKI升级AI脚本、AI分镜、AI视频生成功能 进一步增强成片效果
- ·[流言板]关键!艾顿完成制胜抢断,赛后与队友和教练依次拥抱庆祝
- ·埃弗拉:看阿森纳就像看网飞,总让你期待下一季
- ·499元起 西数黑盘SN7100 NVMe SSD上市:最高7250MB/s读速
- ·测定仪出现故障 日本女川核电站发电计划延期