学习机制,它以随机性的思想理论为依托,能够对多个类别的可信程度进行衡量。但由于随机性无法进行准确计算,所以需要建立一个能够计算,并且还符合随机性原理的检测函数,对置信度进行评估。KNN是一种较为典型的分类算法,也被称之为K-邻近算法,它在对分类进行建立的过程中,无需假定分布结构,因该算法的计算过程较为简单,加之易于实现,从而使其周期网络异常流量检测中得到广泛应用。但在实际应用中发现,如果样本处于不平衡的条件时,则可能会使待分类的样本被分到不是目标类的大样本当中,由此会对检测结果的准确性造成影响。本文所提出的TCM-KNN算法是上述两种算法的融合,可也将其称之为结合算法。下而重点对该算法在网络流量异常检测中的应用进行分析。
在应用TCM-KNN算法对网络流量异常进行检测的过程中,需要构建起一个正常的行为模型,据此对待检测的流量数据进行判定,看是否正常。对于正常类别y而言,待检测流量数据样本i的对应奇异值αiy可用下式表示:
通过式(1)的计算方法进行计算后,异常流量样本的奇异值要大于正常样本奇异值,这样便于区分正常与异常流量数据。在TCM-KNN算法中,需要对待测样本与簇的中心距进行计算,选取距离最短的簇作为正常训练集。通常情况下,距离越短,表明待测样本与簇内样本的相似程度越高,经过计算,可以得到待测及正常样本的奇异值,若是P值比预先设定好的闽值小,说明置信度较高,可用1-τ作为异常流量数据判定的关键性指标。
2.3 算法实验
为对本文所提出的TCM-KNN算法的可行性及有效性等方而进行验证,先对网络中的正常数据进行聚类,同时为使实验过程变得更加简单和方便,选取DARPA数据集进行试验验证。具体的实验方法如下:选取第一周的正常数据作为正常数据的训练集,同时选取第二周的数据作为待检测数据,第二周的数据集当中,存在多种不同类型的攻击实例,因此,可用于对TCM-KNN算法的验证。检测率与误报率是目前国际上通用的两个评价指标。实验步骤如下:
采用随机抽取的方式,从第一周的数据中对正常数据进行选取,然后从第二周的数据中,对待测数据进行选取,再从第三周数据中,选取正常数据来完成异常流量检测。在对TCM-KNN算法进行应用的过程中,需要对置信度闽值进行设定,结合前人的研究成果,该值设定为0.05。在对本文提出的TCM-KNN算法进行验证的过程中,为更加直观地反映出该算法在网络流量异常检测方而的准确程度,本次实验通过数据对比的方法进行具体验证(限于篇幅,数据选取及计算过程省略)。在算法的验证中,k值的选取是关键性环节,既不可过小,也不宜过大,以免对算法的准确性造成影响。需要注意的是,随着k值的增大,检测时问会随之延长,因此,在对该算法进行实际应用时,要对以下因素进行综合考虑:准确率、有效性以及耗时等。经过验证,建议在应用TCM-KNN算法对网络流量异常进行检测时,k值可以选择8,由此能够获得理想的检测结果。由此可见,本文所提出的TCM-KNN算法在网络流量异常检测中具有良好的适用性,只要k值选择的合理,便可以确保检测结果的准确率。
3 结论
综上所述,在计算机网络环境当中,为确保网络运行的稳定性,就必须保证网络流量始终处于正常状态,然而受到DDOS及蠕虫病毒的攻击,会造成网络流量异常,对此,本文提出一中检测算法,即TCM-KNN算法,经过该算法在网络流量异常检测中具有良好的适用性,当k值选择合理时,能确保检测结果的准确率。
参考文献
[1]吕军晖,于龙洋,张瑾.Ntada: -种网络流量异常检测算法[J].经济与管理战略研究,2012( 01):128-146
[2]朱俚治,朱梧 木檀.一种检测网络流量异常和网络攻击的算法[J].计算技术与自动化,2017,36 (01):92-97.
[3]叶坤,网络流量异常检测方法的研究与改进[J].南京工业大学,201 5.
[4]朱俚治,粗糙集与MMTD算法的网络流量异常研究[J].计算机与数字工程,2 17( 01):110-114.
[5]吕军,李星,一种网络流量异常检测算法[J].计算机应用研究,2006,23(11):217-219.
[6]米捷,王佳欣,多层次数据中心网络流量异常检测算法[J].河南工程学院学报(自然科学版),2 01 7,29 (01): 62-66.
[7]曾建华.一种基于核PCA的网络流量异常检测算法[J].计算机应用与软件,2018 (03):140-144.
[8]付强,甘亮,李爱平,吴泉源.一种基于主成分分析算法的网络异常检测实现[J].南京师范大学学报(工程技术版).2008,8 (04):13-16,
[9]侯重遠,江汉红,芮万智,刘亮.工业网络流量异常检测的概率主成分分析法[J],西安交通大学学报,2012,46 (02): 70-75.