移动互联网信息监测系统探究论文
1 移动网络不良信息过滤方法
1.1 分级法
通过将互联网上的信息按照一定标准进行分级、分类,然后根
据各自的级别采用针对性的处置措施的网络信息管理方法称之为分
级法。纳入分级体系的网页都会得到一个分级标记,当用户访问该
网页时将其与过滤模板进行比较进而选址处置方案
1.2 依据 URL 的站点过滤技术
和分级法不同的是,站点过滤技术采用的是以站点为监测对
象。该方法的前置要件是要有一个不良站点列表。系统通过对比用
户访问站点的 URL 和列表中站点进行对比来决定是否过滤。因此
不良站点列表越齐全、越准确,那么该方法的执行效率和质量也就
越高。基于 URL 的站点过滤技术是当前主流互联网不良信息监测方
法,广泛应用于国内、外的网络信息过滤产品中。使用该方法,重
点是对不良站点列表的维护和。
1. 3 依据内容关键字的过滤技术
该项技术是人工智能技术在网络管理方面的一个重要应用。由
于单纯对比关键字而忽视语境、语义的影响,使得关键字过滤技术
的错误率较高,严重影响用户上网体验。因此,通过应用人工智能
技术将语义分析引入网络信息关键字过滤工作中,以提高分析判断
精度。但该技术缺陷也较为明显,主要是实行效果和人工智能技术
水平直接相关。由于当前人工智能技术还不够完善,用户不能自定
义问题判定标准。所以该方法在实际工作中产品较少,主要应用于
某些特定领域,同时需要消耗大量计算机资源。
1.4 其他信息过滤的方法
除了上述方法外,下面两种方法也较为常用。一个是图像识别
技术。该技术以图像的色彩、深浅、形状和彼此间的位置关系为对
比要素,将用户访问的图像和数据库中的标准图像进行对比,根据
二者间的相似度决定目标图像的处理方案。由于图像描述精确程度
较低,在应用过程中会造成一定程度的误判,实际使用效果水平不
高,有待继续开发。二是动态跟踪技术。该技术通过对用户访问网
络情况的跟踪记录,实现对用户上网行为的全程监控,并以此为依
据改进信息监控、过滤相关方案。记录的内容包括访问的时间、网
页、流量、出错情况、屏幕快照、过滤原因、网页所属类目、关键
词等内容。
2 不良信息监测系统主要应用技术
2. 1 疏虫技术
顾名思义,疏虫技术就是利用半自动程序对互联网上网页信息
进行采集,由于其情形如同悍虫在物体上疏行一般,所以将这种程
序称之为耻虫。疏虫程序在启动时,需要一个初始链接,如同怜虫
疏行的出发点,其后疏虫程序进入自动运行,自动决策其“旅行
路线,这也是怜虫程序半自动化的主要特征。疏虫程序会对起始页
面进行扫描,经由页面中包含的链接访问其他页面,然后再对新页
面的链接进行扫描,从而去往下一个页面。单纯从理论而言,只要
条件允许,肘虫程序访问到互联网上所有页面。这是因为互联网上
的页面彼此间或多或少都会有链接存在。疏虫技术的优点是通过疏
虫程序的自动运行,可以通过获取 URL 最大限度的对网页、网站上
的各类信息,比如文本、图片和音频、视频等进行下载分析,从而
达