网络内容监管系统解决方案
尽管互联网给人们的生活带来了很多的便利,但也带来了很多冲击和污染。除了病毒、恶意代码和恶意网络
链接、垃圾邮件等严重干扰人们的正常网络活动外,令人担忧的问题还有互联网上流传的色情、赌博、毒品、
暴力等不健康的信息,严重毒害了我们的青少年。互联网上也不断出现恐怖、欺诈、盗窃机密信息等行为以及
危害国家统一、主权和领土完整的;危害国家安全或者损害国家荣誉和利益的;煽动民族仇恨、民族歧视,破
坏民族团结的行为;邪教组织也充分利用互联网等高科技手段来“武装”自己,建立非法社区和网站进行宣传。这
些都对国家的政治、经济等方面也造成了很大的冲击和影响。
由于网络非法信息的传播具有极强的隐蔽性和不确定性、手段多样性和超越时空性,其潜在的发展力和危害
力极大,因此,各国政府都不断致力于互联网的内容监控。
项目的建设内容
网络监管系统实现对有限范围网站内容的有效监控,满足近期内我国网络内容监管工作的急需,能够针对指
定范围内的网站,实时获取网站上发布的信息;采用高效的算法对从网络获取到的信息进行分析,实时地发现
其中的非法信息,为采取行政或法律手段提供依据;针对获取到的信息、识别出的敏感信息和用户确认的非法
信息提供完善的存储、浏览和管理方案;同时提供安全的网络环境和系统管理功能。
网络内容监管系统功能设计
1、信息获取
主要负责对网络出版信息的自动抓取。包括网上的静态网页,各种可以下载的压缩文件、doc 文件以及
txt 文件等。
2、数据库平台
数据库平台主要包括各种数据库、文件库以及存储管理系统。在系统中,需要建设四个数据库:网页缓冲
数据库、训练信息库、敏感信息数据库、历史案件数据库。
3、内容处理平台
主要负责对抓取回来的信息进行处理,从而识别出哪些信息是真正有问题的信息。需要具备敏感信息识别、
关键词提取和摘要、报警、非 txt 文件预处理、等主要功能。
敏感信息识别:对采集到的信息进行分类,自动鉴别非法信息;
关键词提取和摘要:对敏感的网络出版信息进行关键字提取和摘要,有利于人工进行进一步的处理。
报警:当系统发现可疑信息时发出警告,提醒工作人员进行进一步的处理。
非 txt 文件的预处理:把 doc 文件,压缩文件转化为系统可以处理纯文本文件格式。
4、案件管理和 Web 服务