因为黄图和喷子太多,这App背后的鉴黄师崩溃了(组图)

好机友 0

也不知道从啥时候开始,“杠精”、“键盘侠”、“喷子”等字眼,遍布网络上各个平台。机哥看个 B 站,弹幕里一堆人怼来怼去:nmsl。

刷个微博,评论区也是把别人父母挂在嘴边。

而贴吧里的各位暴躁老哥,会拿 emoji 表情骂人,因为“🐎”、“🐴”跟“妈”同音。



图片来源于百度贴吧

搞得现在整个网络,戾气很重的样子。

所以也难怪很多人经常说,怀念最初的 B 站、最初的微博、最初的贴吧……

甚至有人提倡,把 Bilibili 的入站弹幕礼仪考试,恢复到几年前的难度,以控制整个 B 站的弹幕素质。



图片来源于百度搜索

可是,像贴吧、微博、豆瓣、知乎等,绝大部分社交平台是连“礼仪考试”都没有的,似乎就更加难以对整个社交环境进行维护?



辣么,总不能放任这种情况,继续发生下去吧。

所以国内外各家互联网公司,都想出自己的招。

屏蔽词

有些网站处理起来的方法很“简单粗暴”,直接把关键词屏蔽掉就好。

比如说,绝大部分论坛、游戏,都会对一些敏感字眼,用“ *** ”(星号)来代替。



图片来源于网络

所以有些骂人的话,会让对方看完之后一脸懵逼,甚至还有点好笑。

净化的效果倒是达到了。

也有像苹果这样的硬件公司,直接从源头过滤掉。

还记得去年机哥说过,iOS 备忘录会把某些脏话“挖空”跳过。





但是吼,“屏蔽词”这一招,虽然看上去管用,但偶尔会出现翻车的情况。

就像之前,有一款游戏把“草”定义为屏蔽词,所以大家都打不出“粮草先行”。



图片来源于网络


还有哦,有些时候会出现滥用屏蔽词的情况。

《GTA5》游戏虽然充斥着暴力,但它里面会把玩家输入的脏话、歧视性语言,通通给屏蔽掉。

只是有程序猿看代码时发现,《GTA5》的屏蔽词库里居然“夹带私货”,把“索尼”、“微软”、“任天堂”等竞争对手的名字也屏蔽了。



图片来源于游民星空


有人说原因是滥用屏蔽词,也有人说它是怕惹上是非……这个咱们就不深入讨论啦。

讲回正事,毕竟翻车的情况不算多,而且“屏蔽词”这一招用起来,简单、粗暴、直接,所以不少互联网公司都会搞自己的屏蔽词库。

甚至有些技术过硬的网友,还自己搞了私人的屏蔽词库,就是工程量有点大。

网友做的Bilibili屏蔽词分享平台

除此之外,还有木有别的处理方法呢?

“人工”智能

现在很多社交巨头 App,都会采用 AI 人工智能,去处理用户发出来的脏话,简单来说就是“自动删帖”啦。

But,看见机哥把“人工”打起引号,别瞎联想,这里不是“ATM机里面有银行员工”类似的意思。



图片来源于网络


因为要用 AI 去处理脏话的前提,是需要先让 AI 知道什么是脏话,也就是“机器学习”的过程。

而且 AI 在前期,还没有那么“聪明”的时候,这时候需要人工审核员再次审查。



所以说,给 AI 建立“语言模型”的过程,离不开人。

但现在网上的暴躁老哥那么多,动不动就“问候别人全家”,更别提还要发一些血腥、不和谐的图片或者视频。

人工审核员也是普通人呐,天天看着这些,哪受得了。

据 The Verge 报道,几位在 Facebook 工作的内容审查员,被诊断出 PTSD(创伤后压力心理障碍症)。



(翻译:他们在 Facebook 工作后被诊断出患有 PTSD。今年晚些时候,Cognizant 宣布将退出内容审核业务,并于今年早些时候关闭其网站。)

所以在上周,Facebook 终于承认内容审核,会给员工造成巨大的损失,然后给他们 5200 万美元(约合 3.7 亿人民币)的赔偿。



(翻译:Facebook 将向与开发 PTSD 的内容审查员,支付5200万美元和解金)


究竟他们审查的内容,有多不和谐,甚至搞到患上心理创伤,这个就不得而知了。



But,与此同时,机哥看到一项比较惊人的数据。

根据 Facebook 在 5 月份,刚刚发布的《透明度报告》:2020年第一季度,Facebook 一共处理了 960 万条“脏话”,创下历史新高。

对比上一个季度的 570 万条,脏话的数量涨了接近 70% 。



数据来源于Facebook

如果把目光放在最近几年,被处理掉的脏话数量,呈现逐年上升的趋势。听上去就有点怕怕呢~

机哥琢磨后觉得,一方面,可能是现在的网友越来越“暴躁”。



而另一方面,技术总是会进步的。

随着 AI 的更新迭代,社交 App 把用户发的“脏话”,挑出来的速度也会越来越快。

像 Facebook 的《透明度报告》里还提到,以后会把这种主动检测技术,扩展到更多的语言。



也许终有一天,无论是用什么语言骂人,甚至是用 emoji 暗示,都会被 AI 识别出来,无所遁形。

机哥倒是很期待,大家平心静气讨论问题,不再怼来怼去的那一天。



但除了屏蔽关键词和删帖,还会不会有更好的处理方法呢?

真·人工智能

苹果前几年申请的一项专利,名字叫做:在音频剧本中管理、替换及剔除露骨歌词

简单来说,歌手或者音乐发行商,把一首歌上传到 Apple Music 之后,苹果的人工智能会对整首歌进行一次审核。



如果在歌曲里面找到“脏话”,就会利用这项专利技术,把“脏话”处理掉。



图片来源于网络


注意嚯,机哥这里说的处理,不是简单把歌词里的脏话屏蔽掉,而是直接从音源上进行调整:用蜂鸣声或者已经和谐了的歌词替代

也就是说,咱们听到歌手唱出来的声音,不会听到脏话。

与此同时,苹果保证处理后的音乐,不会被用户察觉出来已经被处理,因为它依旧流畅。



那为啥,咱们现在使用 Apple Music 时,有些外文歌的“脏话”,好像没有被过滤掉呢?

emmm,据机哥的了解,苹果没有“彻底清理”。现在 Apple Music 里的音乐,分成两个版本:

有码版 censored version无码版 uncensored version


听音乐电台时,都是被处理后的版本。

而通过搜索找到那首歌时,会发现歌曲名字隔壁有一个“E”。这个 logo 就是提醒大家,歌曲含有限制级的内容。



图片来源于applefans


不过嘛,这个冷知识,咱们知道一下就好,真正该关注的还是那个专利。

机哥觉得苹果这个技术,如果能继续发展下去,扩展到其他领域那就更加好了。

比如说,打《王者荣耀》时发语音,如果对方带“脏话”骂人,人工智能可以即时把它过滤掉。

这个使用场景,明显比听歌更有用啊!



其实说到底,无论是屏蔽关键词,亦或者是人工智能删帖,甚至是用技术消音,这些全都是“被动技能”。

换句话说,是各家科技公司,被逼着、逼着、逼出来的手段。

如果网上一团和气,少一点“杠精”、“键盘侠”、“喷子”,可能这些“防脏话技术”压根用不着。

但这种环境,可能很难再奢望能见着了。 阅读原文

文章来源: 留园 查看原文
https://www.6parknews.com/newspark/view.php?app=news&act=view&nid=418350
分享文章:
还没有评论
登录后发表评论
返回 到顶部