雷军也成了AI语音的受害者？

liukang20241天前cgw吃瓜254

本文来自微信大众号：王智远，作者：王智远，原文标题：《雷军，或许有点心烦...》，题图来自：AI生成

雷军最近或许有点心烦……

烦什么？你听到了吗？最近，有不少人用雷军的声响进行二次创造，做成各种段子。我听完之后，觉得既搞笑又无法。

比方：

“老子踏*一眨眼，国庆节就过去了，我又得拖着一大堆破行李去上那个X班；假日里，躺在抖音上刷视频的废物们，咱们好，我是雷军，你们千万不要用小米手机看黄片。”

还有更雷人的内容，在哔哩哔哩上，他的AI语音被用来制作各种游戏阐明、论题封面语，比方打篮球、打麻将，主打一个“不爽”，吐槽和谈论十分尖锐。

至于让我感到无法的部分，却不太好描绘。在写这篇文章之前，我把其间一个短视频发给了我爸，并问他：“你觉得这个短视频有什么特别之处吗？”

我爸回答说：“挺有意思的。”但他并没有说到语音的问题，换句话说，他底子没意识到这是AI生成的语音。可见，AI语音现已能够到达以假乱真的境地了。

一

不过，这次假语音和之前“Are you ok？”有很大不同。

Are you ok，内容特点不强，本身没什么歹意，也不会引发误解，最多让自己觉得有点为难；雷军乃至还诙谐地回应过，还把版权买下来，从营销的视点来看，这反而成了一种正面的宣扬。

但AI语音有点不一样。

现在网络上，大部分雷军AI语音，都是网友们用他的声响说的一些很过火的话，什么“长途控制小米手机炸死你”或许“我开小米SU7撞死你全家”。

这些话适当极点。不了解的人，会以为真是雷军说的，现已触及到诽谤的问题。

AI语音有许多种方法，常见的包含：语音组成、语音克隆、语音辨认、深度假造和自然言语处理。前三种咱们比较了解，后两种是最近两年才逐步流行起来的。

深度假造（Deepfake）是由“深度学习”（deep learning）和“假造”（fake）组合而来，意思是用深度学习技能来仿照人的声响和图画。

而自然言语处理（NLP）是让计算机理解和处理人类言语的技能，运用十分广，比方：智能客服和语音帮手。

许多创造者在给视频配音时，为了省时省力又不想出镜，通常会先写好文字，再用AI来朗诵和组成。

拿我来说：一般会挑选港版男普通话、广西表妹或东北话，这样让文本画面和其他地域口音结合，刚好形成了显着的反差感。

这些技能的作用是停留在语音组成和搞笑方面，的确没什么特别的影响；可是，一旦触及到名人 IP 效应再加上搞笑，一同还企图进行文化层面的输出，状况就大不相同了。

由于这不再是单纯的逗乐，还或许引发各种社会反响。

之前关于“三只羊”卢某某的录音想必不少网友刷到过，那段语音听起来十分传神，引起了许多人的评论和忧虑，我听完后都感觉像真的，乃至还在群里吐槽事情本身太推翻三观了。

不过，9天后（2024年9月26日），合肥市公安局很快发布了官方回应，说那是假的，并提示咱们不信谣、不传谣。

假语音威力不比短视频小，短视频有画面，更简略分辩真假，但语音却很难区别，这就更简略误导人们。

二

国外也有相似事情。我用Perplexity查了一下关于AI造假的新闻，发现他们乃至把方针对准了总统，问题上升到了政治层面。

依据《连线》杂志的报导，本年年初，一些新罕布什尔州的选民接到了假充“拜登总统”的自动语音电话，企图误导他们在初选中投票。

白宫新闻秘书承认，电话是假造的，并非总统录音。

美国联邦通讯委员会（FCC）主席杰西卡·罗森沃塞尔（Jessica Rosenworcel）表明，近年来，机器人电话中运用的AI生成语音变得越来越先进，这些语音能够仿照名人、政治提名人，乃至密切家人的声响，然后制作虚伪信息，误导大众。

她着重，假如语音克隆公司在开发运用时触及名人、或许误导大众、传达危险高的内容，应该在传达中加上显着的标识，提示大众留意。“咱们主张，将运用AI生成语音的机器人电话（robocall）视为不合法。”

别的，还有闻名歌手泰勒·斯威夫特的AI假造“不雅观照”在网上疯传，这类AI造假事情引发了人们对人工智能的广泛忧虑。

几天后，造假的人被找到，他坦言自己用AI东西ElevenLabs，仅花了不到20分钟和1美元就完成了造假，是不是很惊人？

本年3月，一位记者发现，只需在上传文件最初参加一分钟的静音，就能够绕过规矩，成功克隆特朗普和拜登的声响，尽管技能能够用来对立技能，但AI检测软件往往无法有用辨认AI生成的音频。

莫非，AI生成语音真的能强壮到这种境地吗？

其实我也有疑虑。自从“三只羊”卢某某AI录音事情后，我一向重视着回应此事的品牌（某声）的开展。

他们的网站上的确有雷军的AI组成声响，咱们能够自己去试听，音色与真人十分挨近，而且发布的数量也不少，这给了许多蹭热度的时机，他们运用名人的声响制作论题。

不只是雷军，现在许多互联网渠道，比方抖音、B站，都有许多与马保国、葛优、“麦克阿瑟（一位仿照网红）”等名人声响相关的视频。

这些视频运用的是AI配音技能，你只需挑选相应的人物声响，然后输入文字，就能生成该人物声响的内容；尽管许多程序会用代称来躲避版权问题，但供给的声响品种多达上百种，还能够调整语速和语调。

图释：某声品牌社区广场，仍能够搜到一些名人音频

到写这篇文章，在（某声）社区人物商场，仍然能够找到雷军、蔡徐坤、卢本伟、刘亦菲、成龙等名人的仿声组成音，你很难分辩是否是真人。

我并不是单单批判某一个软件，而是整个语音生态好像都存在一些问题，这引发了咱们的考虑：

曾经互联网渠道只对图文和视频进行办理，现在进入了AI年代，AI成了一种新前言。

那么，AI作为前言载体做出来的渠道，是不是本身也要自我办理？是不是得要求用户，非自己不能用他人的声响假造？至少现在看来，归于三不管的地带，没有很细节的法律条文、也缺少明晰的社区规矩。

三

已然供给技能的渠道监管不到位，那么，发布渠道就真的无法监测吗？比方，我将AI语音发布到抖音、快手等渠道，莫非它们就无法检测到问题？

问了一圈在行的朋友，他们说，这触及到两方面问题。

从技能视点，语音模型的自动语音辨认（ASR）和文生文、文生图的原理相似，它们首要都要许多的语料来进行练习，只要这样才干生成更多精细化的模型。

这些模型越细分，语音辨认作用就越好。这让我感觉，这像是一个层层递进的套娃游戏。

别的，现在国内干流的ASR技能多选用端到端模型（End-to-End Models）。这种模型经过一个网络，将输入的语音直接转换为输出成果，简化了传统ASR体系中多个杂乱组件的流程。这使得辨认进程愈加高效，但中心环节也减少了。

比方说：当你对着手机说“今天气候怎么样？”，端到端模型能直接将语音转为文字，查询气候信息，并告知你成果，这种方法十分方便，但它不具有中心的感知才能。

尽管现在干流的AI语音模型开端选用更深度的学习结构，如循环神经网络（RNN）、长短时记忆网络（LSTM）和Transformer来处理一些要害部分，但这些技能仍处于前期阶段。

面临一些更杂乱的状况，如方言和多音轨的噪音，模型仍然存在局限性，由于练习数据不行全面，模型才能有限。

从审阅机制来看，问题就更显着了。一位技能朋友说到：

2018年，有一则新闻，今天头条的创始人张一鸣宣布了一封公开信，回应“内在段子”被关停的事情。在信中，他说到为了补偿算法和机器审阅的缺乏，需求加强人工运营和审阅，将6000人的审阅团队扩大到10000人。

相同，快手当年也采取了相似方法，将2000人的审阅团队扩展到5000人。他们都认识到，在“算法是否具有价值观”的问题上，有必要加大投入。

当年视频面临的问题，现在AI语音也遇到了。

渠道审阅机制分为两部分：机器审阅和人工审阅。机器审阅能快速辨认显着违规的内容，但关于隐晦、杂乱的内容，机器或许判别不精确，就要人工审阅。

AI语音的杂乱性不亚于视频，不同语种、口音、语速等都会影响辨认作用。要逐帧处理这些要素，而且应对AI生成的以假乱真的音频，是一项极大的应战。

你想想看，用AI生成一个音频，再让它自己辨认是AI生成的，这种循环无疑是对技能的极大检测。

要想完成“魔法打败魔法”的作用，渠道要投入更多资金和资源，这不只困难，还要时刻；因而，咱们正处在一个技能、道德与监管并行开展的新阶段。

四

一个在大厂作业的朋友告知我，现在传达内容的渠道针对这种“灰度空间”有三种处理方法：

榜首，查看元数据是否有隐性标识。

所谓隐性标识，即音频里用来确认内容的来历或生成的方法，现在，这项技能现已有所开展和运用。

相似于字节跳动早年自研的躲藏水印算法，现在现已运用到各种产品上。本年3月14—15日，我国人工智能工业开展联盟（AIIA）发布了“信元令”数字隐写标识渠道，也在大力推广。

简略来说，他们都在处理同一个问题，即让AIGC生成的内容自带标识，这种标识人看不到，技能却看得到。

第二个方法，提示用户自行增加阐明。

假如渠道未检测到隐性标识，会提示用户自动标明内容来历。你或许也见过在发布内容时，能够挑选标示“取自网络”“AI生成”或“原创拍照”。

用户不想自己声明，也没有隐性标识，那渠道会进行第三种方法：抽样检测。一旦发现语音中有AI的痕迹，就会直接增加提示标识。

了解了这些，你就能理解，为什么有些视频下方会呈现“疑似运用AI生成技能，请留意鉴别”的提示。为什么说是“疑似”呢？由于现在AI还无法彻底精确地辨认另一个AI生成的内容。

不过，有一个条件：除非某个内容真的引发了广泛重视和巨大言论，渠道才会自动干涉。不然，面临海量内容，渠道很难做到逐个审阅。

所以，防备AI语音，不只是个人和企业的职责，更要技能供给商和社会各界一同尽力。

在深度假造众多的年代，雷军成为了国内第二个因AI语音造假而受到影响的人，咱们看看段子就好，千万不要成为传达的始作俑者。

总结

AI正在仿照真人。

我想提示咱们，在网上阅读视频时，要多留一个心眼，最好不要默许一切都是实在的。技能无罪，就怕心怀叵测，期望咱们能明智地运用它，推进社会向活跃的方向开展。

本文来自微信大众号：王智远，作者：王智远

本内容为作者独立观念，不代表虎嗅态度。未经答应不得转载，授权事宜请联络 [email protected]

正在改动与想要改动国际的人，都在虎嗅APP

告发/反应

标签: 雷军 AI 受害者语音

返回列表

上一篇：乱用大众人物声响恶搞，AI技能使用“玩过界”被质疑

下一篇：讯众股份推出AI居家安全报警器，保证茕居白叟安全

舒肤佳香皂再现刀片？一个月前遭受类似事情的顾客称：本相仍是谜丨追寻究竟

封面新闻记者吴冰清舒肤佳再度上了热搜。5月5日，浙江网友“Winter”发布视频称，买的舒肤佳香皂里边有“刀片”，且洗澡时身上被划破了十几厘米。就在4月9日，一重庆网友在另一款舒肤佳香皂里也发现了相...

韩潮面临的是一个什么样的对手？

这是一家股票市值超越丰田、全球市值最高的车企，在短短十几年里从一家草创公司一跃成为国际新能源职业的标杆。在2013年进入我国后，特斯拉具有一个人员巨大、持续扩张中的公关部，以及行动力极强、不怕费事的法务部。

这次，韩潮打赢了这场官司，却引发特斯拉反击，惹来更多的官司。

9月16日那天上午，一份来自北京二中院的邮件寄到了韩潮在天津家里的快递点。取到之后，韩潮没有马上回家，他站在快递点前拆开，拿出15页的二审断定书，直接翻到了终究。

回想起那个时刻，韩潮觉得自己“心态很平缓”，直到他看到8个字：“驳回上诉，维持原判” ，心脏才像刚反响过来似得漏跳了几拍。紧接着，高兴涌了上来，他站在原地长长地出了一口气。

两年前的5月，韩潮买下一辆37.97万元的二手特斯拉Model S。买车前，出售人员许诺，车没有水泡、火烧，无结构性损害。但后来他发现，车的后侧叶子板有显着修正痕迹，是存在结构性损害的事端车。围绕着特斯拉是否“诈骗”顾客，一场持久战打响了。

战争历时755天，期间阅历一审、二审，合计五次开庭，总算落下帷幕。“维持原判”，意味着特斯拉需求按照2020年12月4日北京市大兴人民法院在一审中的裁决，“向韩潮交还379700元购车款，并按照《顾客权益保护法》规则补偿1139100元”，也便是退一赔三。

这次胜诉，是国内罕见的特斯拉车主维权成功事例，有着标志性含义。拿到断定书后，韩潮发了一条微博，附上了断定书全文的图片，被转发八千屡次，点赞3.7万。最近几天，不断有媒体联络采访，他手机的微信图标上总是挂着3个红点儿。

吃瓜正能量网

雷军也成了AI语音的受害者？

相关文章

舒肤佳香皂再现刀片？一个月前遭受类似事情的顾客称：本相仍是谜丨追寻究竟

赢一场官司，又被索赔500万，一般车主斗得过特斯拉吗？

安东·尼尔曼：泽连斯基会不会被“色彩革新”？

遭不住！iPhone 14用户吐槽运用不到一年电池健康暴降至90%

尹锡悦弹劾案初次法庭争辩已完毕

听到王菲姓名，谢霆锋做这一动作，网友：本来真的会“红着脸逃避”

Copyright Your WebSite.Some Rights Reserved.

Powered By 吃瓜黑料. Theme by TOYEAN.