**小化对数损失基本等价于**大化分类器的准确度,对于完美的分类器,对数损失值为0。对数损失函数的计算公式如下:其中,y为输出变量即输出的测试样本的检测结果,x为输入变量即测试样本,l为损失函数,n为测试样本(待检测软件的二进制可执行文件)数目,yij是一个二值指标,表示与输入的第i个测试样本对应的类别j,类别j指良性软件或恶意软件,pij为输入的第i个测试样本属于类别j的概率,m为总类别数,本实施例中m=2。分类器的性能也可用roc曲线(receiveroperatingcharacteristic)评价,roc曲线的纵轴是检测率(true****itiverate),横轴是误报率(false****itiverate),该曲线反映的是随着检测阈值变化下检测率与误报率之间的关系曲线。roc曲线下面积(areaunderroccurve,auc)的值是评价分类器比较综合的指标,auc的值通常介于,较大的auc值一般表示分类器的性能较优。(3)特征提取提取dll和api信息特征视图dll(dynamiclinklibrary)文件为动态链接库文件,执行某一个程序时,相应的dll文件就会被调用。一个应用程序可使用多个dll文件,一个dll文件也可能被不同的应用程序使用。api(applicationprogramminginterface)函数是windows提供给用户作为应用程序开发的接口。安全审计发现日志模块存在敏感信息明文存储缺陷。安徽第三方软件测试
坐标点(0,1)**一个完美的分类器,它将所有的样本都正确分类。roc曲线越接近左上角,该分类器的性能越好。从图9可以看出,该方案的roc曲线非常接近左上角,性能较优。另外,前端融合模型的auc值为。(5)后端融合后端融合的架构如图10所示,后端融合方式用三种模态的特征分别训练神经网络模型,然后进行决策融合,隐藏层的***函数为relu,输出层的***函数是sigmoid,中间使用dropout层进行正则化,防止过拟合,优化器(optimizer)采用的是adagrad,batch_size是40。本次实验使用了80%的样本训练,20%的样本验证,训练50个迭代以便于找到较优的epoch值。随着迭代数的增加,后端融合模型的准确率变化曲线如图11所示,模型的对数损失变化曲线如图12所示。从图11和图12可以看出,当epoch值从0增加到5过程中,模型的训练准确率和验证准确率快速提高,模型的训练对数损失和验证对数损失快速减少;当epoch值从5到50的过程中,前端融合模型的训练准确率和验证准确率小幅提高,训练对数损失和验证对数损失缓慢下降;综合分析图11和图12的准确率和对数损失变化曲线,选取epoch的较优值为40。确定模型的训练迭代数为40后,进行了10折交叉验证实验。软件性能测评报告费用性能基准测试GPU利用率未达理论最大值67%。
并将测试样本的dll和api信息特征视图、格式信息特征视图以及字节码n-grams特征视图输入步骤s2训练得到的多模态深度集成模型中,对测试样本进行检测并得出检测结果。实验结果与分析(1)样本数据集选取实验评估使用了不同时期的恶意软件和良性软件样本,包含了7871个良性软件样本和8269个恶意软件样本,其中4103个恶意软件样本是2011年以前发现的,4166个恶意软件样本是近年来新发现的;3918个良性软件样本是从全新安装的windowsxpsp3系统中收集的,3953个良性软件样本是从全新安装的32位windows7系统中收集的。所有的恶意软件样本都是从vxheavens网站中收集的,所有的样本格式都是windowspe格式的,样本数据集构成如表1所示。表1样本数据集类别恶意软件样本良性软件样本早期样本41033918近期样本41663953合计82697871(2)评价指标及方法分类性能主要用两个指标来评估:准确率和对数损失。准确率测量所有预测中正确预测的样本占总样本的比例,*凭准确率通常不足以评估预测的鲁棒性,因此还需要使用对数损失。对数损失(logarithmicloss),也称交叉熵损失(cross-entropyloss),是在概率估计上定义的,用于测量预测类别与真实类别之间的差距大小。
先将当前软件样本件的二进制可执行文件转换为十六进制字节码序列,然后采用n-grams方法在十六进制字节码序列中滑动,产生大量的连续部分重叠的短序列特征,提取得到当前软件样本的二进制可执行文件的字节码n-grams的特征表示。生成软件样本的dll和api信息特征视图,是先统计所有类别已知的软件样本的pe可执行文件引用的dll和api信息,从中选取引用频率**高的多个dll和api信息;然后判断当前的软件样本的导入节里是否存在选择出的某个引用频率**高的dll和api信息,如存在,则将当前软件样本的该dll或api信息以1表示,否则将其以0表示,从而对当前软件样本的所有dll和api信息进行表示形成当前软件样本的dll和api信息特征视图。生成软件样本的格式信息特征视图,是从当前软件样本的pe格式结构信息中选取可能区分恶意软件和良性软件的pe格式结构特征,形成当前软件样本的格式信息特征视图。从当前软件样本的pe格式结构信息中选取可能区分恶意软件和良性软件的pe格式结构特征,是从当前软件样本的pe格式结构信息中确定存在特定格式异常的pe格式结构特征以及存在明显的统计差异的格式结构特征。特定格式异常包括:(1)代码从**后一节开始执行,(2)节头部可疑的属性,。从传统到智能:艾策科技助力制造业升级之路。
步骤s2、将软件样本中的类别已知的软件样本作为训练样本,基于多模态数据融合方法,将训练样本的dll和api信息特征视图、格式信息特征视图以及字节码n-grams特征视图输入深度神经网络,训练多模态深度集成模型;步骤s3、将软件样本中的类别未知的软件样本作为测试样本,并将测试样本的dll和api信息特征视图、格式信息特征视图以及字节码n-grams特征视图输入步骤s2训练得到的多模态深度集成模型中,对测试样本进行检测并得出检测结果。进一步的,所述提取软件样本的二进制可执行文件的dll和api信息的特征表示,是统计当前软件样本的导入节中引用的dll和api;所述提取软件样本的二进制可执行文件的pe格式结构信息的特征表示,是先对当前软件样本的二进制可执行文件进行格式结构解析,然后按照格式规范提取**该软件样本的格式结构信息;所述提取软件样本的二进制可执行文件的字节码n-grams的特征表示,是先将当前软件样本件的二进制可执行文件转换为十六进制字节码序列,然后采用n-grams方法在十六进制字节码序列中滑动,产生大量的连续部分重叠的短序列特征。进一步的,采用3-grams方法在十六进制字节码序列中滑动产生连续部分重叠的短序列特征。进一步的。艾策检测以智能算法驱动分析,为工业产品提供全生命周期质量管控解决方案!软件检测公司 郑州
策科技助力教育行业:数字化教学的创新应用 。安徽第三方软件测试
第三方软件检测机构在开展第三方软件测试的过程中,需要保持测试整体的严谨性,也需要对测试结果负责并确保公平公正性。所以,在测试过程中,软件测试所使用的测试工具也是很重要的一方面。我们简单介绍一下在软件检测过程中使用的那些软件测试工具。众所周知,软件测试的参数项目包括功能性、性能、安全性等参数,而其中出具软件测试报告主要的就是性能测试和安全测试所需要使用到的工具了。一、软件测试性能测试工具这个参数的测试工具有loadrunner,jmeter两大主要工具,国产化性能测试软件目前市场并未有比较大的突破,其中loadrunner是商业软件测试工具,jmeter为开源社区版本的性能测试工具。从第三方软件检测机构的角度上来说,是不太建议使用开源测试工具的。首先,开源测试工具并不能确保结果的准确性,虽然技术层面上来说都可以进行测试,但是因为开源更多的需要考量软件测试人员的测试技术如何进行使用,涉及到了人为因素的影响,一般第三方软件检测机构都会使用loadrunner作为性能测试的工具来进行使用。而loadrunner被加拿大的一家公司收购以后,在整个中国市场区域的销售和营销都以第三方软件检测机构为基础来开展工作。安徽第三方软件测试