首页 > 代码库 > 谈百度云“涉黄”:审核方式有哪些?

谈百度云“涉黄”:审核方式有哪些?

              

            

             北京时间8月11日消息,有关部门接到群众举报百度网盘部分账号存在淫秽色情问题,经调查这一情况确实属实,因此北京文化市场执法总队对百度下达整改通知。值得一提的是,自从今年4月份有关部门开展扫黄打非净网2014以及剑网行动之后,已经有不少产品受到影响或关闭。其中,最为大家熟悉的莫不过是快播,新浪爱问·共享资料也在5月5日主动关闭进行排查,时至今日仍未恢复,而360网盘也在活动之后宣布,为配合有关部门的净网行动,他们将对个人文件的分享内容进行人工审核……

看到这里问题就来了,人工审核无疑太累,而且不能上传后立马分享,有可能会影响到用户的分享积极性。那除了人工审核外,网盘内容的审核还有哪些方式?

网盘内容可能的审核方式:

1. 关键字搜索:这是最简单的审核方式,通过输入关键词,能将一些看起来明显是违法、涉黄的内容直接干掉。如果做好这一项,至少能将网盘分享的糟粕内容去掉一大半。

 

2. 建立身份档案:DNA是人类唯一的身份识别码,而文件的DNA无疑是MD5,如果网盘能建立涉黄文件的MD5数据库,用户上传后自动分析MD5是否合法,则能避免涉黄文件的重复分享。

 

3. 自动截取视频缩略图:估计百度这样的公司,应该能对色情图片进行自动识别了。所以可以自动截取一个视频的十来个地方的缩略图,用色情图片识别技术鉴别该视频是否违法。

当然有些用户,会更改文件名或者建立压缩包来逃避涉黄文件的打击,那有没有好的办法来解决这些问题?

 

4. 关注访问量高的文件:访问量高,基本是涉黄类分享内容的主要特征之一,如果能在人工审核中,对这些访问量突然蹿升的文件进行审查,相比又会毙掉一部分文件分享。

不过纵使有这些审核办法,但人工审核仍然是最有效以及不可避免的手段,否则也就不会出现鉴黄师这样的职业了。