您好,欢迎访问

商机详情 -

浙江软件评测

来源: 发布时间:2025年04月16日

    且4个隐含层中间间隔设置有dropout层。用于输入合并抽取的高等特征表示的深度神经网络包含2个隐含层,其***个隐含层的神经元个数是64,第二个神经元的隐含层个数是10,且2个隐含层中间设置有dropout层。且所有dropout层的dropout率等于。本次实验使用了80%的样本训练,20%的样本验证,训练50个迭代以便于找到较优的epoch值。随着迭代数的增加,中间融合模型的准确率变化曲线如图17所示,模型的对数损失变化曲线如图18所示。从图17和图18可以看出,当epoch值从0增加到20过程中,模型的训练准确率和验证准确率快速提高,模型的训练对数损失和验证对数损失快速减少;当epoch值从30到50的过程中,中间融合模型的训练准确率和验证准确率基本保持不变,训练对数损失缓慢下降;综合分析图17和图18的准确率和对数损失变化曲线,选取epoch的较优值为30。确定模型的训练迭代数为30后,进行了10折交叉验证实验。中间融合模型的10折交叉验证的准确率是%,对数损失是,混淆矩阵如图19所示,规范化后的混淆矩阵如图20所示。中间融合模型的roc曲线如图21所示,auc值为,已经非常接近auc的**优值1。(7)实验结果比对为了综合评估本实施例提出融合方案的综合性能。可靠性评估连续运行72小时出现2次非致命错误。浙江软件评测

浙江软件评测,测评

    此外格式结构信息具有明显的语义信息,但基于格式结构信息的检测方法没有提取决定软件行为的代码节和数据节信息作为特征。某一种类型的特征都从不同的视角反映刻画了可执行文件的一些性质,字节码n-grams、dll和api信息、格式结构信息都部分捕捉到了恶意软件和良性软件间的可区分信息,但都存在着一定的局限性,不能充分、综合、整体的表示可执行文件的本质,使得检测结果准确率不高、可靠性低、泛化性和鲁棒性不佳。此外,恶意软件通常伪造出和良性软件相似的特征,逃避反**软件的检测。技术实现要素:本发明实施例的目的在于提供一种基于多模态深度学习的恶意软件检测方法,以解决现有采用二进制可执行文件的单一特征类型进行恶意软件检测的检测方法检测准确率不高、检测可靠性低、泛化性和鲁棒性不佳的问题,以及其难以检测出伪造良性软件特征的恶意软件的问题。本发明实施例所采用的技术方案是,基于多模态深度学习的恶意软件检测方法,按照以下步骤进行:步骤s1、提取软件样本的二进制可执行文件的dll和api信息、pe格式结构信息以及字节码n-grams的特征表示,生成软件样本的dll和api信息特征视图、格式信息特征视图以及字节码n-grams特征视图。浙江软件评测专业机构认证该程序内存管理效率优于行业平均水平23%。

浙江软件评测,测评

    3)pe可选头部有效尺寸的值不正确,(4)节之间的“间缝”,(5)可疑的代码重定向,(6)可疑的代码节名称,(7)可疑的头部***,(8)来自,(9)导入地址表被修改,(10)多个pe头部,(11)可疑的重定位信息,(12)把节装入到vmm的地址空间,(13)可选头部的sizeofcode域取值不正确,(14)含有可疑标志。存在明显的统计差异的格式结构特征包括:(1)无证书表;(2)调试数据明显小于正常文件,(3).text、.rsrc、.reloc和.rdata的characteristics属性异常,(4)资源节的资源个数少于正常文件。生成软件样本的字节码n-grams特征视图,是统计了每个短序列特征的词频(termfrequency,tf),即该短序列特征在软件样本中出现的频率。先从当前软件样本的所有短序列特征中选取词频tf**高的多个短序列特征;然后计算选取的每个短序列特征的逆向文件频率idf与词频tf的乘积,并将其作为选取的每个短序列特征的特征值,,表示该短序列特征表示其所在软件样本的能力越强;**后在选取的词频tf**高的多个短序列特征中选取,生成字节码n-grams特征视图。:=tf×idf;tf(termfrequency)是词频,定义如下:其中,ni,j是短序列特征i在软件样本j中出现的次数,∑knk,j指软件样本j中所有短序列特征出现的次数之和。

    图2是后端融合方法的流程图。图3是中间融合方法的流程图。图4是前端融合模型的架构图。图5是前端融合模型的准确率变化曲线图。图6是前端融合模型的对数损失变化曲线图。图7是前端融合模型的检测混淆矩阵示意图。图8是规范化前端融合模型的检测混淆矩阵示意图。图9是前端融合模型的roc曲线图。图10是后端融合模型的架构图。图11是后端融合模型的准确率变化曲线图。图12是后端融合模型的对数损失变化曲线图。图13是后端融合模型的检测混淆矩阵示意图。图14是规范化后端融合模型的检测混淆矩阵示意图。图15是后端融合模型的roc曲线图。图16是中间融合模型的架构图。图17是中间融合模型的准确率变化曲线图。图18是中间融合模型的对数损失变化曲线图。图19是中间融合模型的检测混淆矩阵示意图。图20是规范化中间融合模型的检测混淆矩阵示意图。图21是中间融合模型的roc曲线图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例**是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。对比分析显示资源占用率高于同类产品均值26%。

浙江软件评测,测评

    没有满足用户的需求1未达到需求规格说明书表明的功能2出现了需求规格说明书指明不会出现的错误3软件功能超出了需求规格说明书指明的范围4软件质量不够高维护性移植性效率性可靠性易用性功能性健壮性等5软件未达到软件需求规格说明书未指出但是应该达到的目标计算器没电了下次还得能正常使用6测试或用户觉得不好软件缺陷的表现形式1功能没有完全实现2产品的实际结果和所期望的结果不一致3没有达到需求规格说明书所规定的的性能指标等4运行出错断电运行终端系统崩溃5界面排版重点不突出,格式不统一6用户不能接受的其他问题软件缺陷产生的原因需求错误需求记录错误设计说明错误代码错误兼容性错误时间不充足缺陷的信息缺陷id缺陷标题缺陷严重程度缺陷的优先级缺陷的所属模块缺陷的详细描述缺陷提交时间缺陷的严重程度划分1blocker系统瘫痪异常退出计算错误大部分功能不能使用死机2major功能点不符合用户需求数据丢失3normal**功能特定调点断断续续4Trivial细小的错误优先级划分紧急高中低。5G 与物联网:深圳艾策的下一个技术前沿。浙江软件评测

安全扫描确认软件通过ISO 27001标准,无高危漏洞记录。浙江软件评测

    在不知道多长的子序列能更好的表示可执行文件的情况下,只能以固定窗口大小在字节码序列中滑动,产生大量的短序列,由机器学习方法选择可能区分恶意软件和良性软件的短序列作为特征,产生短序列的方法叫n-grams。“080074ff13b2”的字节码序列,如果以3-grams产生连续部分重叠的短序列,将得到“080074”、“0074ff”、“74ff13”、“ff13b2”四个短序列。每个短序列特征的权重表示有多种方法。**简单的方法是如果该短序列在具体样本中出现,就表示为1;如果没有出现,就表示为0,也可以用。本实施例采用3-grams方法提取特征,3-grams产生的短序列非常庞大,将产生224=(16,777,216)个特征,如此庞大的特征集在计算机内存中存储和算法效率上都是问题。如果短序列特征的tf较小,对机器学习可能没有意义,选取了tf**高的5000个短序列特征,计算每个短序列特征的,每个短序列特征的权重是判断其所在软件样本是否为恶意软件的依据,也是区分每个软件样本的依据。(4)前端融合前端融合的架构如图4所示,前端融合方式将三种模态的特征合并,然后输入深度神经网络,隐藏层的***函数为relu,输出层的***函数是sigmoid,中间使用dropout层进行正则化,防止过拟合,优化器。浙江软件评测

标签: 测评