你的位置:开云(中国)kaiyun网页版登录入口 > 新闻动态 > 开云体育(中国)官方网站不得不暂时叫停 AI 样貌再行审核-开云(中国)kaiyun网页版登录入口

开云体育(中国)官方网站不得不暂时叫停 AI 样貌再行审核-开云(中国)kaiyun网页版登录入口

时间:2026-02-11 23:06 点击:194 次

开云体育(中国)官方网站不得不暂时叫停 AI 样貌再行审核-开云(中国)kaiyun网页版登录入口

连年来,生成式东说念主工智能在文本、图像、音乐等规模大放异彩。可是,跟着生成式东说念主工智能变得越来越坚硬,东说念主们越来越难以鉴别 AI 生成的内容。

近日,Google DeepMind 守护团队在《当然》(Nature)上发表的封面著作提供了一种文本水印决策,不错提高 AI 生成文本的检测精度。

图库版权图片,转载使用可能激励版权纠纷

AI 生成内容检测的必要性

在文本、图像和音乐中,AI 生成的文本是最难以检测的。因为现存的图像和音乐生成技巧尚未像文本生成技巧相似发达,AI 生成的图像和音乐频频有某些非当然的视觉或听觉特征。AI 生成的内容在合座上成果较好,但具体到细节就显得不够当然。在图像和音乐中,也不错东说念主工添加东说念主类难以发现的水印,在后期检测中通过水印筛选出 AI 生成的作品。

可是在文本中难以径直添加东说念主类不可见的水印,这是因为文本与图像和音乐不同,每一个翰墨都是皆备可见的。同期,可用于教师 AI 的文本数据也远多于图像和音乐。在繁多的、基于东说念主类写稿的语料库的教师之下,AI 一经相配擅长模拟东说念主类的抒发方式和话语风气,甚而不祥转机文本的作风和口吻,这使得 AI 生成的文本难以径直检测。

尽管 AI 生成的文本与东说念主类创作的文本难以分辨,但 AI 生成的内容可能带有事实性的失实,并不成保证可靠性。无法鉴别起原的内容可能会导致不实信息的传播,也带来了学术舞弊、版权争议等各种问题。

比如,在"杭州取消灵活车依尾号限行"假新闻事件中,网友用 AI 技巧生成的"假新闻"行文严谨、口吻措辞适应,也基本合适官方通报的格局,导致了失实信息大限制传播。好意思国科技新闻网站 CNET 在三个月之内上线了 70 多篇用 AI 技巧生成的新闻报说念,却被发现其中存在大都基础性失实,包括盘算推算失实、金融认识污蔑等,不得不暂时叫停 AI 样貌再行审核。

为了幸免 AI 技巧的花消,咱们需要一种要道鉴别文本是否由 AI 生成。

主流检测要道:事先与过后检测

检测 AI 生成的文本是一个分类问题,咱们的主要指标是分歧一个文本片断是由 AI 生成的照旧由东说念主类创作的。无间一个文本检测器关于一个给定的文本片断会给出一个评分,当这个评分超越阈值时,这个片断被觉得是 AI 生成的,反之则是东说念主类创作的。

文本检测框架(图片起原:字据参考文件   [ 1 ]   翻译)

现存的主流检测要道不错分为两大类:事先检测和过后检测。事先检测不错进一步分为基于水印的检测和基于检索的检测。过后检测不错分为基于零样本学习的检测和基于教师的检测。

主流检测要道分类(图片起原:字据参考文件   [ 1 ]   翻译)

1

事先检测

基于水印的检测是指在 AI 生成的文本中守密某些信息以便后续检测。但由于文本的龙套性,在文本中添加水印比在图像和音乐中添加水印贫苦许多。常用的要道是让 AI 生成的文本使用特定的话语作风或者偏向性地使用某些特定的词汇,但这么可能会缩小 AI 生成文本的质料。

基于检索的要道是指 AI 就业的提供者将用户通过 AI 生成的文本保存在数据库中。当需要检测指标文本是否由 AI 生成时,将指标文本与数据库中的文本进行匹配,如若相似度较高,则很可能是 AI 生成的。但这种要道需要保存用户数据,可能带来隐秘泄露的问题。

2

过后检测

基于零样本学习的检测是指不需要进行任何的教师,仅字据 AI 生成文本的特质来检测一段文本是否是 AI 生成的。无间 AI 生成的文本倾向于使用常见的词汇,句子的长度和结构也愈加长入。而东说念主类创作的文本则显得愈加运用自若,每一句的水平也狼藉不皆。与东说念主类比拟,AI 在牵挂细节上才智较强而在逻辑推理上才智较弱。诓骗这些特质不错在一定进度上分歧 AI 生成的文本和东说念主类创作的文本。

基于教师的检测是指使用东说念主类创作的文本和 AI 生成的文本构建一个数据集,用这个数据集教师一个分类器来识别 AI 生成的文本。但这需要网络有余的数据用于教师,何况跟着 AI 才智的超越,这么的分歧也变得越来越贫苦。

不错看到,过后检测比事先检测要贫苦许多。为了高精度地筛选出 AI 生成的文本,在事先 AI 生成文本时就添加水印是一个很好的惩处决策。

Google DeepMind 的卤莽:

SynthID-Text 水印技巧

Google DeepMind 守护团队建议了一种新的水印生成决策,称为 SynthID-Text。它基于之前的水印生成组件,但使用了一种新的"锦标赛采样"要道。SynthID-Text 不错非扭曲(保留文骨子量)或者扭曲(以抛弃文骨子量为代价晋升水印的可检测性)地添加水印。在扭曲和非扭曲拓荒下,与现存的最好要道比拟,SynthID-Text 都晋升了水印的检出率。

水印生成框架(图片起原:字据参考文件   [ 2 ]   翻译)

上图中展示了谎言语模子生成文本的旨趣以及之前水印生成的框架。谎言语模子的文本生成是基于高下文的,它会字据输入的文本序列盘算推算下一个词汇的散布,然后从这个散布中抽样出下一个词汇。

一个生成式的水印决策无间包含三个部分:一个当场数生成器、一个采样算法以及一个评分函数。水印生成的经过是:当先使用当场数生成器字据前边的文本以及水印键生成一个当场数,然后采样算法诓骗这个当场数从词汇的散布中抽样出下一个词汇。给出一段文本以及一个水印键,评分函数提供一个分数来量化刻下文本中含有水印的可能性,当分数超越一个阈值时就觉得这段文本中含有水印。

锦标赛采样(图片起原:字据参考文件 [ 2 ] 翻译)

SynthID-Text 建议了一种新的"锦标赛采样"要道,上图是锦标赛采样要道的一个例子。当向模子输入" ... 我最可爱的热带生果是"时,模子盘算推算出下一个词汇的散布,其中"芒果"的概率是 0.5,"荔枝"的概率是 0.3,"木瓜"的概率是 0.15,"榴莲"的概率是 0.05。在不加水印的平日生成中,模子会按这个概直露接采样出下一个词汇。

在锦标赛采样中,模子先字据当场数种子生成三个当场的水印函数,然后再从词汇的散布中采样出八个词汇,将这八个词汇两两组合后进行竞赛,在每一轮竞赛中,由一个水印函数决定每一双组合中的胜出者。经过三轮竞赛后,最终的胜出者便是模子的输出适度:"芒果"。

在锦标赛采样中,词汇是字据水印函数的偏好采样得出的。因此添加水印的文本会在水印函数上有更高的评分。在检测时只需要评估每个词汇在对应的水印函数下的评分,再将评分加和就不错取得这段文本包含水印的可能性。

水印的添加是通过转变采样要道终结的,它会转变模子输出下一个词汇的散布,这看起来不可幸免地会影响生成文本的质料。可是,由于采样要道中使用了当场数种子,尽管在某一当场数种子下词汇的散布会被转变,但在对所有当场数种子进行平均后不错取得和原始散布交流的适度。SynthID-Text   不错在适应的成立下幸免影响词汇的散布从而保证文本的质料,也不错以赔本一部分质料为代价提高水印的检出概率。

SynthID-Text 要道在 Google DeepMind 推出的 Gemini 东说念主工智能模子上经过了两千万次用户测试。测试适度标明 SynthID-Text 在添加水印的同期并不会缩小文本的质料。同期,SynthID-Text 不会产生太多的时刻和盘算推算支出,不错被大限制地应用于出产现实之中。

结语

过后检测文本是否由 AI 生成瑕瑜常贫苦的。跟着 AI 才智的增强,过后检测会变得越来越贫苦,检测和反检测将会是无特殊的技巧竞赛。水印要道提供了一种可能的惩处决策,但这需要谎言语模子的提供者在生成时就预先加入水印。如若用户使用的模子莫得主动加入水印,就难以在过后进行检测。此外,用户还不错使用开源模子,或者对添加了水印的文本进行二次裁剪来逃走检测。这些问题都有待进一步惩处。

改日,跟着生成式东说念主工智能的普及,奈何检测 AI 生成的内容会变得越来越垂危。SynthID-Text 解说了水印技巧在文本生成中大限制应用的可能性,但水印技巧靠近的贫苦也诠释检测并不仅仅一个技巧问题。惩处这个问题还需要各方共同戮力,造成关连的行业圭表以及法律限定,从而鼓动 AI 走在为东说念主类就业的正轨之上。

参考文件

[ 1 ] Ghosal S S, Chakraborty S, Geiping J, et al. Towards possibilities & impossibilities of ai-generated text detection: A survey [ J ] . arXiv preprint arXiv:2310.15264, 2023.

[ 2 ] Dathathri, S., See, A., Ghaisas, S., Huang, P. S., McAdam, R., Welbl, J., ... & Kohli, P. ( 2024 ) . Scalable watermarking for identifying large language model outputs. Nature, 634 ( 8035 ) , 818-823.

筹备制作

出品丨科普中国

作家丨王琛 中国科学院盘算推算技巧守护场地读博士

审核丨于旸 腾讯玄武实验室进展东说念主

监制丨中国科普博览

责编丨钟艳平

审校丨徐来 林林

关连推选

1.石头果然长出了头发?!不外真比拟你思的更可怕……

2."多喝水"果然有效!最新守护知道:多喝水有助于减肥、调理肾结石……

3.为什么女性总爱喊疼?真不是矫强,而是……

4.冬天必吃的巨人菜!养分好吃还抗癌,理睬我一定要试试

5.为什么我不建议你,凡事都和伴侣"掏心掏肺"?

本文封面图片及文内图片来自版权图库

转载使用可能激励版权纠纷

原创图文转载请后台回话"转载"

点亮"在看"

全部涨常识!

开云体育(中国)官方网站

从至交到共富,与会异邦嘉宾证据都鲁印象 “敞畅意抱对话天下的底气” 在2025山东外洋友城合营调换周的会场,来自47个国度的嘉宾们,用不同的谈话证据着对都鲁地面的印象——这里既有“有一又自迢遥来”的东方温度,更涌动着拥抱天下的洞开胸宇。 “紧捏的手,和煦的拥抱,各人亲切如一家东说念主。”越南中国商会会长茶楣博士用流利的中宣布诉记者。这位在中国责任生存了20年的“新山东东说念主”,见证着山东与越南从经贸互补到东说念主文妥洽的经由。“我但愿山东的蔬菜、生果还有德州扒鸡在越南出现,也念念让山东的一又
5月27日,番邦友东说念主参不雅2025山东海外友城确立展。 在2025山东海外友城确立展现场,一幅越过46年的妥洽长卷清静张开——从1979年订立第一双海外友城于今,山东已构建起一张袒护五大洲、长入产业链、招引民意的海社往还收集。这场以“联袂同业,妥洽发展”为主题的展览,记载着王人鲁地面与寰宇相拥的绽开踪影。 山东将海外友城行为真切对外绽开的弘远支点,46年来,通过友城渠说念累计促成妥洽边幅万余个,带动投资超万亿元。从青岛港与约旦亚喀巴港的口岸联动,到白俄罗斯维捷布斯克州与山东的多产业妥洽;
《开屏见“好”》栏目,聚焦山东好东说念主功德,让普通老庶民上封面、上开屏、上首屏,用最隆起的位置推介“身边的榜样”,呈文精彩山东故事。 “庆贵,咱获奖了!”5月28日,“众人”新媒体大平台接济阿里公益天天正能量,为临沂高新区马厂湖镇杭头村的想源藏书楼创办东说念主周庆贵颁发“小微公益行径者专项奖”,并给以一万元的现款奖励。看成藏书楼发起东说念主之一,周庆贵的发小周波欢叫地拨通电话,把这个好音问告诉了远在上海的周庆贵。 “确实吗?”“谢谢!谢谢众人的关爱!”电话那头,听到这个音问的周庆贵难掩粗糙,
乙肝名义抗原定量是乙肝查验中的一项热切见解体育游戏app平台,在太原龙城中医肝病病院(太原中医肝病病院),等闲有患者对不同庚级段乙肝名义抗原定量高的真义感到困惑。接下来,咱们就一皆久了了解一下。 关于儿童时期,乙肝名义抗原定量魁伟多是因为母婴传播感染了乙肝病毒。这个阶段,孩子免疫系统还在发育中,对乙肝病毒频频处于免疫耐受景况,固然病毒在体内存在,但可能并莫得知道症状,肝功能也可能闲居。相关词,这并不料味着不错忽视,捏续的高抗原定量领导体内病毒复制活跃,当年跟着免疫系统缓缓训导,有可能投入免疫撤
肾为先天之本。是以,肾脏生病,经常不只单是肾脏。大无数肾病患者的疾病会诊皆有几项,以致十几项。高血压、糖尿病、系统性红斑狼疮、冠心病等,要么是病肾引起的,要么是肾病的基础病。这些“走肾”的病皆在一步步榨干肾脏健康。 高血压:越没嗅觉,损害越大 始终高血压引起肾小球动脉硬化,肾脏又有多种路线参与血压调理,是以,高血压与肾脏病彼此影响加强。据统计,在非透析的慢性肾脏病患者中,有高血压的占67.3%。 肾损害的发生率与高血压的严重进程、抓续时辰关联。一般始终高血压限制不达标5-10年,就会出现卵白尿
关于透析肾友来说,除了按期进行透析休养外体育游戏app平台,正确饮食亦然提升糊口质地的进军成分之一。底下这6条饮食提议,每一条齐超实用,提议透析肾友们成功码住,点赞保藏反复看! 1. 卵白质要吃够: 尽量选优质的动物卵白质,如鸡蛋/牛奶/瘦肉/鱼等,大豆偏激成品类亦属于优质卵白质。 透析肾友卵白质每天的摄入量为1.0—1.2克/公斤体重,其中50%以上为优质卵白。 卵白质摄入量的联想表率是,总卵白质=[1.0~1.2g/(kg·d)]×尺度体重。 2. 热量要吃足: 机体需要摄入一定热量保管体
服务热线
官方网站:www.yixianshengjiafang.com
工作时间:周一至周六(09:00-18:00)
联系我们
QQ:11654071155
邮箱:8932c65f@outlook.com
地址:新闻动态科技园3191号
关注公众号

Powered by 开云(中国)kaiyun网页版登录入口 RSS地图 HTML地图


开云(中国)kaiyun网页版登录入口-开云体育(中国)官方网站不得不暂时叫停 AI 样貌再行审核-开云(中国)kaiyun网页版登录入口

回到顶部