首页 > 电子期刊 > J > 计算机时代

基于Simhash的SQL注入漏洞检测技术研究

的变化比较敏感,适用性较强。不过由于需要进行网页内容规范化预处理、建立模型、模型的相似性比较等操作步骤多,会消耗大量的时间来进行计算,因此效率并不高。2 基于Simhash文本相似性检测的网页快速比较技术由于以上的网页比较方法在判断结果的准确性和比较的效率上未能达到一个合理的平衡,针对这个问题,本文提出了一种基于Simhash文本相似性检测的网页快速比较技术。SimHash是一种目前公认效果较好的近似文本检测算法,它是一种对高维数据进行概率降维的方法,能够将高维的向量映射为位数较小且固定的指纹,被广泛用于搜索引擎中的网页去重部分。传统的Hash函数能够将一样的文本生成一样的Hash函数,但是通过Simhash算法,内容差不多相同的文本所得到的特征值也比较相近。因此可以使用Simhash算法来计算出一个网页内容的特征值,然后通过比较两个网页的特征值的相近程度来判断它们是否相似。使用该方法来比较服务器返回页面的主要流程包括:首先提取服务器返回页面的HTML
<<上一页  下一页>>

首页 > 电子期刊 > J > 计算机时代

广州市越秀区图书馆版权所有。
联系电话:020-87673002

本站访问人数: