你的位置:开云(中国)kaiyun网页版登录入口 > 新闻动态 > 开云体育(中国)官方网站不得不暂时叫停 AI 样貌再行审核-开云(中国)kaiyun网页版登录入口

开云体育(中国)官方网站不得不暂时叫停 AI 样貌再行审核-开云(中国)kaiyun网页版登录入口

时间:2026-02-11 23:06 点击:194 次

开云体育(中国)官方网站不得不暂时叫停 AI 样貌再行审核-开云(中国)kaiyun网页版登录入口

连年来,生成式东说念主工智能在文本、图像、音乐等规模大放异彩。可是,跟着生成式东说念主工智能变得越来越坚硬,东说念主们越来越难以鉴别 AI 生成的内容。

近日,Google DeepMind 守护团队在《当然》(Nature)上发表的封面著作提供了一种文本水印决策,不错提高 AI 生成文本的检测精度。

图库版权图片,转载使用可能激励版权纠纷

AI 生成内容检测的必要性

在文本、图像和音乐中,AI 生成的文本是最难以检测的。因为现存的图像和音乐生成技巧尚未像文本生成技巧相似发达,AI 生成的图像和音乐频频有某些非当然的视觉或听觉特征。AI 生成的内容在合座上成果较好,但具体到细节就显得不够当然。在图像和音乐中,也不错东说念主工添加东说念主类难以发现的水印,在后期检测中通过水印筛选出 AI 生成的作品。

可是在文本中难以径直添加东说念主类不可见的水印,这是因为文本与图像和音乐不同,每一个翰墨都是皆备可见的。同期,可用于教师 AI 的文本数据也远多于图像和音乐。在繁多的、基于东说念主类写稿的语料库的教师之下,AI 一经相配擅长模拟东说念主类的抒发方式和话语风气,甚而不祥转机文本的作风和口吻,这使得 AI 生成的文本难以径直检测。

尽管 AI 生成的文本与东说念主类创作的文本难以分辨,但 AI 生成的内容可能带有事实性的失实,并不成保证可靠性。无法鉴别起原的内容可能会导致不实信息的传播,也带来了学术舞弊、版权争议等各种问题。

比如,在"杭州取消灵活车依尾号限行"假新闻事件中,网友用 AI 技巧生成的"假新闻"行文严谨、口吻措辞适应,也基本合适官方通报的格局,导致了失实信息大限制传播。好意思国科技新闻网站 CNET 在三个月之内上线了 70 多篇用 AI 技巧生成的新闻报说念,却被发现其中存在大都基础性失实,包括盘算推算失实、金融认识污蔑等,不得不暂时叫停 AI 样貌再行审核。

为了幸免 AI 技巧的花消,咱们需要一种要道鉴别文本是否由 AI 生成。

主流检测要道:事先与过后检测

检测 AI 生成的文本是一个分类问题,咱们的主要指标是分歧一个文本片断是由 AI 生成的照旧由东说念主类创作的。无间一个文本检测器关于一个给定的文本片断会给出一个评分,当这个评分超越阈值时,这个片断被觉得是 AI 生成的,反之则是东说念主类创作的。

文本检测框架(图片起原:字据参考文件   [ 1 ]   翻译)

现存的主流检测要道不错分为两大类:事先检测和过后检测。事先检测不错进一步分为基于水印的检测和基于检索的检测。过后检测不错分为基于零样本学习的检测和基于教师的检测。

主流检测要道分类(图片起原:字据参考文件   [ 1 ]   翻译)

1

事先检测

基于水印的检测是指在 AI 生成的文本中守密某些信息以便后续检测。但由于文本的龙套性,在文本中添加水印比在图像和音乐中添加水印贫苦许多。常用的要道是让 AI 生成的文本使用特定的话语作风或者偏向性地使用某些特定的词汇,但这么可能会缩小 AI 生成文本的质料。

基于检索的要道是指 AI 就业的提供者将用户通过 AI 生成的文本保存在数据库中。当需要检测指标文本是否由 AI 生成时,将指标文本与数据库中的文本进行匹配,如若相似度较高,则很可能是 AI 生成的。但这种要道需要保存用户数据,可能带来隐秘泄露的问题。

2

过后检测

基于零样本学习的检测是指不需要进行任何的教师,仅字据 AI 生成文本的特质来检测一段文本是否是 AI 生成的。无间 AI 生成的文本倾向于使用常见的词汇,句子的长度和结构也愈加长入。而东说念主类创作的文本则显得愈加运用自若,每一句的水平也狼藉不皆。与东说念主类比拟,AI 在牵挂细节上才智较强而在逻辑推理上才智较弱。诓骗这些特质不错在一定进度上分歧 AI 生成的文本和东说念主类创作的文本。

基于教师的检测是指使用东说念主类创作的文本和 AI 生成的文本构建一个数据集,用这个数据集教师一个分类器来识别 AI 生成的文本。但这需要网络有余的数据用于教师,何况跟着 AI 才智的超越,这么的分歧也变得越来越贫苦。

不错看到,过后检测比事先检测要贫苦许多。为了高精度地筛选出 AI 生成的文本,在事先 AI 生成文本时就添加水印是一个很好的惩处决策。

Google DeepMind 的卤莽:

SynthID-Text 水印技巧

Google DeepMind 守护团队建议了一种新的水印生成决策,称为 SynthID-Text。它基于之前的水印生成组件,但使用了一种新的"锦标赛采样"要道。SynthID-Text 不错非扭曲(保留文骨子量)或者扭曲(以抛弃文骨子量为代价晋升水印的可检测性)地添加水印。在扭曲和非扭曲拓荒下,与现存的最好要道比拟,SynthID-Text 都晋升了水印的检出率。

水印生成框架(图片起原:字据参考文件   [ 2 ]   翻译)

上图中展示了谎言语模子生成文本的旨趣以及之前水印生成的框架。谎言语模子的文本生成是基于高下文的,它会字据输入的文本序列盘算推算下一个词汇的散布,然后从这个散布中抽样出下一个词汇。

一个生成式的水印决策无间包含三个部分:一个当场数生成器、一个采样算法以及一个评分函数。水印生成的经过是:当先使用当场数生成器字据前边的文本以及水印键生成一个当场数,然后采样算法诓骗这个当场数从词汇的散布中抽样出下一个词汇。给出一段文本以及一个水印键,评分函数提供一个分数来量化刻下文本中含有水印的可能性,当分数超越一个阈值时就觉得这段文本中含有水印。

锦标赛采样(图片起原:字据参考文件 [ 2 ] 翻译)

SynthID-Text 建议了一种新的"锦标赛采样"要道,上图是锦标赛采样要道的一个例子。当向模子输入" ... 我最可爱的热带生果是"时,模子盘算推算出下一个词汇的散布,其中"芒果"的概率是 0.5,"荔枝"的概率是 0.3,"木瓜"的概率是 0.15,"榴莲"的概率是 0.05。在不加水印的平日生成中,模子会按这个概直露接采样出下一个词汇。

在锦标赛采样中,模子先字据当场数种子生成三个当场的水印函数,然后再从词汇的散布中采样出八个词汇,将这八个词汇两两组合后进行竞赛,在每一轮竞赛中,由一个水印函数决定每一双组合中的胜出者。经过三轮竞赛后,最终的胜出者便是模子的输出适度:"芒果"。

在锦标赛采样中,词汇是字据水印函数的偏好采样得出的。因此添加水印的文本会在水印函数上有更高的评分。在检测时只需要评估每个词汇在对应的水印函数下的评分,再将评分加和就不错取得这段文本包含水印的可能性。

水印的添加是通过转变采样要道终结的,它会转变模子输出下一个词汇的散布,这看起来不可幸免地会影响生成文本的质料。可是,由于采样要道中使用了当场数种子,尽管在某一当场数种子下词汇的散布会被转变,但在对所有当场数种子进行平均后不错取得和原始散布交流的适度。SynthID-Text   不错在适应的成立下幸免影响词汇的散布从而保证文本的质料,也不错以赔本一部分质料为代价提高水印的检出概率。

SynthID-Text 要道在 Google DeepMind 推出的 Gemini 东说念主工智能模子上经过了两千万次用户测试。测试适度标明 SynthID-Text 在添加水印的同期并不会缩小文本的质料。同期,SynthID-Text 不会产生太多的时刻和盘算推算支出,不错被大限制地应用于出产现实之中。

结语

过后检测文本是否由 AI 生成瑕瑜常贫苦的。跟着 AI 才智的增强,过后检测会变得越来越贫苦,检测和反检测将会是无特殊的技巧竞赛。水印要道提供了一种可能的惩处决策,但这需要谎言语模子的提供者在生成时就预先加入水印。如若用户使用的模子莫得主动加入水印,就难以在过后进行检测。此外,用户还不错使用开源模子,或者对添加了水印的文本进行二次裁剪来逃走检测。这些问题都有待进一步惩处。

改日,跟着生成式东说念主工智能的普及,奈何检测 AI 生成的内容会变得越来越垂危。SynthID-Text 解说了水印技巧在文本生成中大限制应用的可能性,但水印技巧靠近的贫苦也诠释检测并不仅仅一个技巧问题。惩处这个问题还需要各方共同戮力,造成关连的行业圭表以及法律限定,从而鼓动 AI 走在为东说念主类就业的正轨之上。

参考文件

[ 1 ] Ghosal S S, Chakraborty S, Geiping J, et al. Towards possibilities & impossibilities of ai-generated text detection: A survey [ J ] . arXiv preprint arXiv:2310.15264, 2023.

[ 2 ] Dathathri, S., See, A., Ghaisas, S., Huang, P. S., McAdam, R., Welbl, J., ... & Kohli, P. ( 2024 ) . Scalable watermarking for identifying large language model outputs. Nature, 634 ( 8035 ) , 818-823.

筹备制作

出品丨科普中国

作家丨王琛 中国科学院盘算推算技巧守护场地读博士

审核丨于旸 腾讯玄武实验室进展东说念主

监制丨中国科普博览

责编丨钟艳平

审校丨徐来 林林

关连推选

1.石头果然长出了头发?!不外真比拟你思的更可怕……

2."多喝水"果然有效!最新守护知道:多喝水有助于减肥、调理肾结石……

3.为什么女性总爱喊疼?真不是矫强,而是……

4.冬天必吃的巨人菜!养分好吃还抗癌,理睬我一定要试试

5.为什么我不建议你,凡事都和伴侣"掏心掏肺"?

本文封面图片及文内图片来自版权图库

转载使用可能激励版权纠纷

原创图文转载请后台回话"转载"

点亮"在看"

全部涨常识!

开云体育(中国)官方网站

点击卡片参加商城开云体育(中国)官方网站 这个周末寰宇是不是皆被各式瓜刷屏了 李明德凭一己之力 屠了星光大赏的热搜 在指摘里创飞了大部分文娱圈的东说念主 只消轻轻举起了他第一部剧的女主角 田曦薇那时《如斯可儿的咱们》里黄橙子一角 照实圈粉多数 然而小田离大火大要老是差了一些运说念 还好背面的《卿卿渊博》再度出圈 此次的星光大赏亦然统统不掉链子 径直一个好意思神驾临 暗夜红玫瑰即视感 红气养东说念主是一方面 小田私下面亦然超小心崇尚的 我去翻了她酬酢平台 发现她我方在早期有相称古道的和寰宇共享她
欧洲杯体育 西装夹克 Prada 网纱衬衫 Simone Rocha 衬衫 Prada 耳钉(用作帽子保密) Alexander McQueen 西装夹克 Fendi 蕾丝大氅 macro’Senes 粉色衬衫 D-Harry 双排扣长裙 Xingyuren 玄色长裤 Versace 皮鞋 Christian Louboutin 他像哥伦布期间的海上飞行者,探索一派又一派弘大而神奇的地皮,穿越极地、冰原、清白白雪,看过一次次日出日落。他又像个吟游诗东谈主,披着霞光,进行寂寞孤身一人的朝圣之旅。
开云体育 近日,限时空间亮相上海巨鹿路; Bottega Veneta发布新春创意短片 ; 电影《唐探1900》随预报曝新声威 。 快快来看当天潮圈儿,得回 更多翔实实践吧。 潮我看 路易威登限时空间亮相上海巨鹿路庆祝路易威登 × 结合系列焕新发布 二十年前,路易威登与村上隆初次结合,推出具有划期间兴味的结合系列。如今,路易威登和这位日本艺术家焕新发布路易威登 × 村上隆结合系列,升级原版系列经营,呈现200余件作品,回溯21世纪初的流行文化和经典魔力。2025年1月1日至7日,路易威登限时空
1月4日,头部滋生企业温氏食物集团股份有限公司(以下简称“温氏股份”)发布2024年龄迹预报闪现,展望公司讲演期内已毕贸易收入超1000亿元;已毕包摄于上市公司鼓动的净利润90亿元至95亿元。 资料闪现,温氏股份2024年前三季度累计已毕包摄于上市公司鼓动的净利润64.08亿元,由此盘算,公司展望第四季度已毕包摄于上市公司鼓动的净利润为25.92至30.92亿元。 温氏股份总司理黎少松向《证券日报》记者示意,2024年公司约略已毕营收超1000亿元和净利润超90亿元的成绩,主要收货于资本的镌汰
一个月前曾堕入欠薪及大限制闭店争议的山东烘焙品牌皇家好意思孚再次受到温存开云体育。 近日多位网友发帖称,受闭店听说影响,多地皇家好意思孚门店被挤兑。有前职工者示意,多家门店伴计和市民发生争执,有的市民径直将店内电脑等物质搬走。 1月3日,皇家好意思孚再次发布声明重申,目下公司坐褥、销售均处于简单运营景色,通盘卡券均可简单有序兑换。 皇家好意思孚多地门店被挤兑,主顾伴计起破损 据南边齐市报报说念,昨年年底多位网友在酬酢平台发帖称,皇家好意思孚多家门店倒闭,并称充值金额不成退款。多位皇家好意思孚的
三十九年前,一家造座椅弹簧的初创企业在重庆市悄然出身。履历时辰变迁,这家小弹簧厂不休“变身”,已转型为一家新动力造车“新势力”,并杀青了从失掉到盈利的翻盘。面前,赛力斯已成为继特斯拉、比亚迪、理念念之后,人人第四个盈利的新动力汽车品牌。 脚下,跟着新动力汽车产业的不休上前演进,市集已呈现出竞争与机遇并存的动态竞争形态。跨入盈利门槛的赛力斯,如安在尖锐化的市集竞争中再进攻?下一步,公司的市集布局将落在哪里?近日,《证券日报》记者走进赛力斯集团股份有限公司(以下简称“赛力斯”),真切挖掘公司的成长
服务热线
官方网站:www.yixianshengjiafang.com
工作时间:周一至周六(09:00-18:00)
联系我们
QQ:11654071155
邮箱:8932c65f@outlook.com
地址:新闻动态科技园3191号
关注公众号

Powered by 开云(中国)kaiyun网页版登录入口 RSS地图 HTML地图


开云(中国)kaiyun网页版登录入口-开云体育(中国)官方网站不得不暂时叫停 AI 样貌再行审核-开云(中国)kaiyun网页版登录入口

回到顶部