因为黄图和喷子太多,这App背后的鉴黄师崩溃了(组图)

好机友 3 Years 0

也不知道从啥时候开始，“杠精”、“键盘侠”、“喷子”等字眼，遍布网络上各个平台。机哥看个 B 站，弹幕里一堆人怼来怼去：nmsl。

刷个微博，评论区也是把别人父母挂在嘴边。

而贴吧里的各位暴躁老哥，会拿 emoji 表情骂人，因为“🐎”、“🐴”跟“妈”同音。

图片来源于百度贴吧

搞得现在整个网络，戾气很重的样子。

所以也难怪很多人经常说，怀念最初的 B 站、最初的微博、最初的贴吧……

甚至有人提倡，把 Bilibili 的入站弹幕礼仪考试，恢复到几年前的难度，以控制整个 B 站的弹幕素质。

图片来源于百度搜索

可是，像贴吧、微博、豆瓣、知乎等，绝大部分社交平台是连“礼仪考试”都没有的，似乎就更加难以对整个社交环境进行维护？

辣么，总不能放任这种情况，继续发生下去吧。

所以国内外各家互联网公司，都想出自己的招。

屏蔽词

有些网站处理起来的方法很“简单粗暴”，直接把关键词屏蔽掉就好。

比如说，绝大部分论坛、游戏，都会对一些敏感字眼，用“ *** ”（星号）来代替。

图片来源于网络

所以有些骂人的话，会让对方看完之后一脸懵逼，甚至还有点好笑。

净化的效果倒是达到了。

也有像苹果这样的硬件公司，直接从源头过滤掉。

还记得去年机哥说过，iOS 备忘录会把某些脏话“挖空”跳过。

但是吼，“屏蔽词”这一招，虽然看上去管用，但偶尔会出现翻车的情况。

就像之前，有一款游戏把“草”定义为屏蔽词，所以大家都打不出“粮草先行”。

图片来源于网络

还有哦，有些时候会出现滥用屏蔽词的情况。

《GTA5》游戏虽然充斥着暴力，但它里面会把玩家输入的脏话、歧视性语言，通通给屏蔽掉。

只是有程序猿看代码时发现，《GTA5》的屏蔽词库里居然“夹带私货”，把“索尼”、“微软”、“任天堂”等竞争对手的名字也屏蔽了。

图片来源于游民星空

有人说原因是滥用屏蔽词，也有人说它是怕惹上是非……这个咱们就不深入讨论啦。

讲回正事，毕竟翻车的情况不算多，而且“屏蔽词”这一招用起来，简单、粗暴、直接，所以不少互联网公司都会搞自己的屏蔽词库。

甚至有些技术过硬的网友，还自己搞了私人的屏蔽词库，就是工程量有点大。

网友做的Bilibili屏蔽词分享平台

除此之外，还有木有别的处理方法呢？

“人工”智能

现在很多社交巨头 App，都会采用 AI 人工智能，去处理用户发出来的脏话，简单来说就是“自动删帖”啦。

But，看见机哥把“人工”打起引号，别瞎联想，这里不是“ATM机里面有银行员工”类似的意思。

图片来源于网络

因为要用 AI 去处理脏话的前提，是需要先让 AI 知道什么是脏话，也就是“机器学习”的过程。

而且 AI 在前期，还没有那么“聪明”的时候，这时候需要人工审核员再次审查。

所以说，给 AI 建立“语言模型”的过程，离不开人。

但现在网上的暴躁老哥那么多，动不动就“问候别人全家”，更别提还要发一些血腥、不和谐的图片或者视频。

人工审核员也是普通人呐，天天看着这些，哪受得了。

据 The Verge 报道，几位在 Facebook 工作的内容审查员，被诊断出 PTSD（创伤后压力心理障碍症）。

（翻译：他们在 Facebook 工作后被诊断出患有 PTSD。今年晚些时候，Cognizant 宣布将退出内容审核业务，并于今年早些时候关闭其网站。）

所以在上周，Facebook 终于承认内容审核，会给员工造成巨大的损失，然后给他们 5200 万美元（约合 3.7 亿人民币）的赔偿。

（翻译：Facebook 将向与开发 PTSD 的内容审查员，支付5200万美元和解金）

究竟他们审查的内容，有多不和谐，甚至搞到患上心理创伤，这个就不得而知了。

But，与此同时，机哥看到一项比较惊人的数据。

根据 Facebook 在 5 月份，刚刚发布的《透明度报告》：2020年第一季度，Facebook 一共处理了 960 万条“脏话”，创下历史新高。

对比上一个季度的 570 万条，脏话的数量涨了接近 70% 。

数据来源于Facebook

如果把目光放在最近几年，被处理掉的脏话数量，呈现逐年上升的趋势。听上去就有点怕怕呢~

机哥琢磨后觉得，一方面，可能是现在的网友越来越“暴躁”。

而另一方面，技术总是会进步的。

随着 AI 的更新迭代，社交 App 把用户发的“脏话”，挑出来的速度也会越来越快。

像 Facebook 的《透明度报告》里还提到，以后会把这种主动检测技术，扩展到更多的语言。

也许终有一天，无论是用什么语言骂人，甚至是用 emoji 暗示，都会被 AI 识别出来，无所遁形。

机哥倒是很期待，大家平心静气讨论问题，不再怼来怼去的那一天。

但除了屏蔽关键词和删帖，还会不会有更好的处理方法呢？

真·人工智能

苹果前几年申请的一项专利，名字叫做：在音频剧本中管理、替换及剔除露骨歌词

简单来说，歌手或者音乐发行商，把一首歌上传到 Apple Music 之后，苹果的人工智能会对整首歌进行一次审核。

如果在歌曲里面找到“脏话”，就会利用这项专利技术，把“脏话”处理掉。

图片来源于网络

注意嚯，机哥这里说的处理，不是简单把歌词里的脏话屏蔽掉，而是直接从音源上进行调整：用蜂鸣声或者已经和谐了的歌词替代

也就是说，咱们听到歌手唱出来的声音，不会听到脏话。

与此同时，苹果保证处理后的音乐，不会被用户察觉出来已经被处理，因为它依旧流畅。

那为啥，咱们现在使用 Apple Music 时，有些外文歌的“脏话”，好像没有被过滤掉呢？

emmm，据机哥的了解，苹果没有“彻底清理”。现在 Apple Music 里的音乐，分成两个版本：

有码版 censored version无码版 uncensored version

听音乐电台时，都是被处理后的版本。

而通过搜索找到那首歌时，会发现歌曲名字隔壁有一个“E”。这个 logo 就是提醒大家，歌曲含有限制级的内容。

图片来源于applefans

不过嘛，这个冷知识，咱们知道一下就好，真正该关注的还是那个专利。

机哥觉得苹果这个技术，如果能继续发展下去，扩展到其他领域那就更加好了。

比如说，打《王者荣耀》时发语音，如果对方带“脏话”骂人，人工智能可以即时把它过滤掉。

这个使用场景，明显比听歌更有用啊！

其实说到底，无论是屏蔽关键词，亦或者是人工智能删帖，甚至是用技术消音，这些全都是“被动技能”。

换句话说，是各家科技公司，被逼着、逼着、逼出来的手段。

如果网上一团和气，少一点“杠精”、“键盘侠”、“喷子”，可能这些“防脏话技术”压根用不着。

但这种环境，可能很难再奢望能见着了。阅读原文

科技 APP 鉴黄师

文章来源: 留园查看原文

https://www.6parknews.com/newspark/view.php?app=news&act=view&nid=418350

分享文章:

文章由1+转码，以便在移动设备上阅读。新闻及图片版权归原作者网站所有，内容不代表1+新闻的观点和立场

1

1

1

1

1

1

1

1

1

1

1

1

还没有评论

登录后发表评论

热门新闻