雷军也成了AI语音的受害者?

liukang20241天前cgw吃瓜254
本文来自微信大众号:王智远,作者:王智远,原文标题:《雷军,或许有点心烦...》,题图来自:AI生成

雷军最近或许有点心烦……

柔和的雷军也成了AI语音的受害者?的照片

烦什么?你听到了吗?最近,有不少人用雷军的声响进行二次创造,做成各种段子。我听完之后,觉得既搞笑又无法。

比方:

“老子踏*一眨眼,国庆节就过去了,我又得拖着一大堆破行李去上那个X班;假日里,躺在抖音上刷视频的废物们,咱们好,我是雷军,你们千万不要用小米手机看黄片。”

还有更雷人的内容,在哔哩哔哩上,他的AI语音被用来制作各种游戏阐明、论题封面语,比方打篮球、打麻将,主打一个“不爽”,吐槽和谈论十分尖锐。

至于让我感到无法的部分,却不太好描绘。在写这篇文章之前,我把其间一个短视频发给了我爸,并问他:“你觉得这个短视频有什么特别之处吗?”

我爸回答说:“挺有意思的。”但他并没有说到语音的问题,换句话说,他底子没意识到这是AI生成的语音。可见,AI语音现已能够到达以假乱真的境地了。

不过,这次假语音和之前“Are you ok?”有很大不同。

Are you ok,内容特点不强,本身没什么歹意,也不会引发误解,最多让自己觉得有点为难;雷军乃至还诙谐地回应过,还把版权买下来,从营销的视点来看,这反而成了一种正面的宣扬。

但AI语音有点不一样。

现在网络上,大部分雷军AI语音,都是网友们用他的声响说的一些很过火的话,什么“长途控制小米手机炸死你”或许“我开小米SU7撞死你全家”。

这些话适当极点。不了解的人,会以为真是雷军说的,现已触及到诽谤的问题。

AI语音有许多种方法,常见的包含:语音组成、语音克隆、语音辨认、深度假造和自然言语处理。前三种咱们比较了解,后两种是最近两年才逐步流行起来的。

深度假造(Deepfake)是由“深度学习”(deep learning)和“假造”(fake)组合而来,意思是用深度学习技能来仿照人的声响和图画。

而自然言语处理(NLP)是让计算机理解和处理人类言语的技能,运用十分广,比方:智能客服和语音帮手。

许多创造者在给视频配音时,为了省时省力又不想出镜,通常会先写好文字,再用AI来朗诵和组成。

拿我来说:一般会挑选港版男普通话、广西表妹或东北话,这样让文本画面和其他地域口音结合,刚好形成了显着的反差感。

这些技能的作用是停留在语音组成和搞笑方面,的确没什么特别的影响;可是,一旦触及到名人 IP 效应再加上搞笑,一同还企图进行文化层面的输出,状况就大不相同了。

由于这不再是单纯的逗乐,还或许引发各种社会反响。

之前关于“三只羊”卢某某的录音想必不少网友刷到过,那段语音听起来十分传神,引起了许多人的评论和忧虑,我听完后都感觉像真的,乃至还在群里吐槽事情本身太推翻三观了。

不过,9天后(2024年9月26日),合肥市公安局很快发布了官方回应,说那是假的,并提示咱们不信谣、不传谣。

假语音威力不比短视频小,短视频有画面,更简略分辩真假,但语音却很难区别,这就更简略误导人们。

国外也有相似事情。我用Perplexity查了一下关于AI造假的新闻,发现他们乃至把方针对准了总统,问题上升到了政治层面。

依据《连线》杂志的报导,本年年初,一些新罕布什尔州的选民接到了假充“拜登总统”的自动语音电话,企图误导他们在初选中投票。

雷军也成了AI语音的受害者?的视图

白宫新闻秘书承认,电话是假造的,并非总统录音。

美国联邦通讯委员会(FCC)主席杰西卡·罗森沃塞尔(Jessica Rosenworcel)表明,近年来,机器人电话中运用的AI生成语音变得越来越先进,这些语音能够仿照名人、政治提名人,乃至密切家人的声响,然后制作虚伪信息,误导大众。

她着重,假如语音克隆公司在开发运用时触及名人、或许误导大众、传达危险高的内容,应该在传达中加上显着的标识,提示大众留意。“咱们主张,将运用AI生成语音的机器人电话(robocall)视为不合法。”

别的,还有闻名歌手泰勒·斯威夫特的AI假造“不雅观照”在网上疯传,这类AI造假事情引发了人们对人工智能的广泛忧虑。

几天后,造假的人被找到,他坦言自己用AI东西ElevenLabs,仅花了不到20分钟和1美元就完成了造假,是不是很惊人?

本年3月,一位记者发现,只需在上传文件最初参加一分钟的静音,就能够绕过规矩,成功克隆特朗普和拜登的声响,尽管技能能够用来对立技能,但AI检测软件往往无法有用辨认AI生成的音频。

莫非,AI生成语音真的能强壮到这种境地吗?

其实我也有疑虑。自从“三只羊”卢某某AI录音事情后,我一向重视着回应此事的品牌(某声)的开展。

他们的网站上的确有雷军的AI组成声响,咱们能够自己去试听,音色与真人十分挨近,而且发布的数量也不少,这给了许多蹭热度的时机,他们运用名人的声响制作论题。

不只是雷军,现在许多互联网渠道,比方抖音、B站,都有许多与马保国、葛优、“麦克阿瑟(一位仿照网红)”等名人声响相关的视频。

这些视频运用的是AI配音技能,你只需挑选相应的人物声响,然后输入文字,就能生成该人物声响的内容;尽管许多程序会用代称来躲避版权问题,但供给的声响品种多达上百种,还能够调整语速和语调。

图释:某声品牌社区广场,仍能够搜到一些名人音频

到写这篇文章,在(某声)社区人物商场,仍然能够找到雷军、蔡徐坤、卢本伟、刘亦菲、成龙等名人的仿声组成音,你很难分辩是否是真人。

我并不是单单批判某一个软件,而是整个语音生态好像都存在一些问题,这引发了咱们的考虑:

曾经互联网渠道只对图文和视频进行办理,现在进入了AI年代,AI成了一种新前言。

那么,AI作为前言载体做出来的渠道,是不是本身也要自我办理?是不是得要求用户,非自己不能用他人的声响假造?至少现在看来,归于三不管的地带,没有很细节的法律条文、也缺少明晰的社区规矩。

已然供给技能的渠道监管不到位,那么,发布渠道就真的无法监测吗?比方,我将AI语音发布到抖音、快手等渠道,莫非它们就无法检测到问题?

问了一圈在行的朋友,他们说,这触及到两方面问题。

从技能视点,语音模型的自动语音辨认(ASR)和文生文、文生图的原理相似,它们首要都要许多的语料来进行练习,只要这样才干生成更多精细化的模型。

这些模型越细分,语音辨认作用就越好。这让我感觉,这像是一个层层递进的套娃游戏。

别的,现在国内干流的ASR技能多选用端到端模型(End-to-End Models)。这种模型经过一个网络,将输入的语音直接转换为输出成果,简化了传统ASR体系中多个杂乱组件的流程。这使得辨认进程愈加高效,但中心环节也减少了。

比方说:当你对着手机说“今天气候怎么样?”,端到端模型能直接将语音转为文字,查询气候信息,并告知你成果,这种方法十分方便,但它不具有中心的感知才能。

尽管现在干流的AI语音模型开端选用更深度的学习结构,如循环神经网络(RNN)、长短时记忆网络(LSTM)和Transformer来处理一些要害部分,但这些技能仍处于前期阶段。

面临一些更杂乱的状况,如方言和多音轨的噪音,模型仍然存在局限性,由于练习数据不行全面,模型才能有限。

经典的雷军也成了AI语音的受害者?的照片

从审阅机制来看,问题就更显着了。一位技能朋友说到:

2018年,有一则新闻,今天头条的创始人张一鸣宣布了一封公开信,回应“内在段子”被关停的事情。在信中,他说到为了补偿算法和机器审阅的缺乏,需求加强人工运营和审阅,将6000人的审阅团队扩大到10000人。

相同,快手当年也采取了相似方法,将2000人的审阅团队扩展到5000人。他们都认识到,在“算法是否具有价值观”的问题上,有必要加大投入。

当年视频面临的问题,现在AI语音也遇到了。

渠道审阅机制分为两部分:机器审阅和人工审阅。机器审阅能快速辨认显着违规的内容,但关于隐晦、杂乱的内容,机器或许判别不精确,就要人工审阅。

AI语音的杂乱性不亚于视频,不同语种、口音、语速等都会影响辨认作用。要逐帧处理这些要素,而且应对AI生成的以假乱真的音频,是一项极大的应战。

你想想看,用AI生成一个音频,再让它自己辨认是AI生成的,这种循环无疑是对技能的极大检测。

要想完成“魔法打败魔法”的作用,渠道要投入更多资金和资源,这不只困难,还要时刻;因而,咱们正处在一个技能、道德与监管并行开展的新阶段。

一个在大厂作业的朋友告知我,现在传达内容的渠道针对这种“灰度空间”有三种处理方法:

榜首,查看元数据是否有隐性标识。

所谓隐性标识,即音频里用来确认内容的来历或生成的方法,现在,这项技能现已有所开展和运用。

相似于字节跳动早年自研的躲藏水印算法,现在现已运用到各种产品上。本年3月14—15日,我国人工智能工业开展联盟(AIIA)发布了“信元令”数字隐写标识渠道,也在大力推广。

简略来说,他们都在处理同一个问题,即让AIGC生成的内容自带标识,这种标识人看不到,技能却看得到。

第二个方法,提示用户自行增加阐明。

假如渠道未检测到隐性标识,会提示用户自动标明内容来历。你或许也见过在发布内容时,能够挑选标示“取自网络”“AI生成”或“原创拍照”。

用户不想自己声明,也没有隐性标识,那渠道会进行第三种方法:抽样检测。一旦发现语音中有AI的痕迹,就会直接增加提示标识。

了解了这些,你就能理解,为什么有些视频下方会呈现“疑似运用AI生成技能,请留意鉴别”的提示。为什么说是“疑似”呢?由于现在AI还无法彻底精确地辨认另一个AI生成的内容。

不过,有一个条件:除非某个内容真的引发了广泛重视和巨大言论,渠道才会自动干涉。不然,面临海量内容,渠道很难做到逐个审阅。

所以,防备AI语音,不只是个人和企业的职责,更要技能供给商和社会各界一同尽力。

在深度假造众多的年代,雷军成为了国内第二个因AI语音造假而受到影响的人,咱们看看段子就好,千万不要成为传达的始作俑者。

总结

AI正在仿照真人。

我想提示咱们,在网上阅读视频时,要多留一个心眼,最好不要默许一切都是实在的。技能无罪,就怕心怀叵测,期望咱们能明智地运用它,推进社会向活跃的方向开展。

本文来自微信大众号:王智远,作者:王智远

本内容为作者独立观念,不代表虎嗅态度。未经答应不得转载,授权事宜请联络 [email protected]

正在改动与想要改动国际的人,都在 虎嗅APP
告发/反应

相关文章

舒肤佳香皂再现刀片?一个月前遭受类似事情的顾客称:本相仍是谜丨追寻究竟

封面新闻记者 吴冰清舒肤佳再度上了热搜。5月5日,浙江网友“Winter”发布视频称,买的舒肤佳香皂里边有“刀片”,且洗澡时身上被划破了十几厘米。就在4月9日,一重庆网友在另一款舒肤佳香皂里也发现了相...

赢一场官司,又被索赔500万,一般车主斗得过特斯拉吗?

韩潮面临的是一个什么样的对手?这是一家股票市值超越丰田、全球市值最高的车企,在短短十几年里从一家草创公司一跃成为国际新能源职业的标杆。在2013年进入我国后,特斯拉具有一个人员巨大、持续扩张中的公关部...

安东·尼尔曼:泽连斯基会不会被“色彩革新”?

【文/观察者网专栏作者 安东·尼尔曼,翻译/ 薛凯桓】“泽连斯基致信总统,他为在(白宫)椭圆形办公室产生的整个工作道了歉。”当地时间3月10日,美国中东问题特使史蒂文·威特科夫向媒体标明,在前次白宫会...

遭不住!iPhone 14用户吐槽运用不到一年电池健康暴降至90%

  iPhone不管是电池仍是续航才能一向都是用户吐槽的点之一,能够说现已到了闻者悲伤听者落泪的境地。近来又有运用iPhone 14系列的用户吐槽,称iPhone 14系列呈现了严峻的电池老化问题。而...

尹锡悦弹劾案初次法庭争辩已完毕

【尹锡悦弹劾案初次法庭争辩已完毕】财联社1月14日电,总台记者得悉,因为尹锡悦未到会,尹锡悦弹劾案初次法庭争辩已完毕。第2次揭露争辩将于当地时间16日下午2时举办。(央视新闻)告发/反应...

听到王菲姓名,谢霆锋做这一动作,网友:本来真的会“红着脸逃避”

谢霆锋与王菲自2014年复合后,两人的一举一动都备受重视。继前段时刻,谢霆锋在采访中被问到“是否觉得王菲的穿戴和他很像”,他表明“没有”后,又显露夸大的表情答复:“我不知道讲的是哪个造型嘛。”日前,谢...

友情链接: