本篇文章2511字,读完约6分钟

如何使人工智能更实用地辅助网络安全 机器学习和人工智能最近受到了很多关注,人们对这一技术也很感兴趣。机器学习的发展使得安全系统在处理动态情况时更容易训练和更灵活,但是并不是所有的用例都以同样的效率受益。 机器学习和人工智能最近受到了很多关注,人们对这一技术也很感兴趣。机器学习的发展使得安全系统在处理动态情况时更容易训练和更灵活,但是并不是所有的用例都以同样的效率受益。

如何使人工智能更实用地辅助网络安全

副作用之一是一切都被重新贴上机器学习的标签,这使得很难确定术语。正如云这个词被用来指代互联网上发生的任何事情一样,人工智能将很快发展到几乎所有涉及计算机的东西都会被贴上这个标签的地步。

普华永道美国分析创新主管阿南德。老说:炒作太多了。每个人都在说人工智能正在变得超级智能,并将取代人类和人类的决策。

安全工作的一个常见任务是确定新下载或安装的应用程序是否是恶意的。传统方法是非常基本的专家系统。应用程序的特征是否符合已知的恶意软件?

这种标准防病毒方法的缺点是,它需要随着新的恶意软件的出现而频繁更新,并且防范非常脆弱。恶意软件只需很少的修改就能轻易逃脱检测。

一家初创公司Deep Nation正在利用近10亿个已知恶意软件样本用于培训的事实,将深度学习技术应用于这个问题。

公司首席技术官阿里。大卫说:深度学习已经彻底改变了许多领域。计算机视觉每年增长20%到30%,要花几分钟才能达到超人的视觉。和语音识别。你不认为网络安全不好吗?

甚至基于概率的机器学习系统也有局限性。有太多的因素可以被专家识别和衡量,然后再进行微调以获得更好的结果。与此同时,无数其他因素被丢弃,因为它们太小或不相关。

你扔掉的大部分数据。

深度本能的模型是,深度学习系统是在实验室中训练的,并以所有已知恶意软件的样本为基础。培训过程需要一天时间,需要一个强大的图形处理器(GPU)来分析数据。

经过培训的系统大小约为1GB,对于大多数应用程序来说太大了,然后公司将其缩减到只有20MB。任何终端设备都可以轻松安装,包括移动设备,最慢的机器可以在几毫秒内分析进入系统的威胁。

1MB大小的常见文件的分析时间不应超过1毫秒。实验室的超高端基础设施完成了所有复杂的工作,客户得到的是集中的大脑。与此同时,在实验室里,新的恶意软件样本不断地被添加到数据集中,每3到4个月左右,运行在终端设备上的所有大脑都会收到更新和升级。

但是即使大脑已经6个月没有更新了,它也可以继续检测新文件。深度学习对新的修改或变化非常敏感。

每天出现的数百万个新恶意软件样本中,大多数只是现有恶意软件的微小变化。

即使是由高级威胁黑客和民族国家黑客开发的全新零日攻击程序,也有80%与旧版本相似。传统方法无法检测到它们。但是深度学习很容易被发现。

该公司正与一家独立的测试实验室合作,对测试结果进行量化。然而,对财富500强客户的早期测试显示,该公司的深度学习方法比现有解决方案的恶意软件检测率高20%至30%。

我们最近测试了美国一家大银行的10万份文件。现有的解决方案在测试当天进行了更新,我们的版本是两个月前的版本。我们的解决方案实现了99.9%的检测率,而他们的是40%。

找出原因

最新的深度学习系统的一个缺点是它们可以给出答案,但它们可能无法解释如何给出答案。

然而,情况并非总是如此。事实上,Nutonian的人工智能专利引擎Eureqa的主要工作是找出这些事情发生的原因。例如,面对物理数据,Eureqa可以重新发现牛顿定律。

公司创始人兼首席技术官迈克尔。施密特说:它可以找到最简单、最优雅的方式来描述发生了什么以及它们之间的关系。

该公司向研究人员免费开放了该引擎,并帮助了至少500篇期刊文章。例如,在医学领域,该引擎有助于发现黄斑变性和阑尾炎等疾病的新诊断模型。在网络安全方面也有对该引擎的引用。

最困难的问题之一是分析网络攻击。Eureqa的人工智能应用是自动完成这个过程。

一旦客户注册了基于云的系统,他们将花费大约一个小时等待引擎分析数据,然后各种答案很快就会出来。

他们花了几个月或几年才得到结果,而我们只花了几分钟就复制了它们。

本地和全球培训

在网络安全领域,任何机器学习系统都需要频繁更新,因为情况变化太快。

没有定期更新,所有的系统都会过时,因为人类总是会遇到新的东西。员工又在玩新的小玩意了,制造商改变了他们的应用,顾客的消费模式也改变了,等等。当然,黑客也不例外,专门设计新的恶意软件绕过现有系统是黑客的日常生活。

同时,在下一次更新之前总会有一个感染窗口。特别是,坏人也可以购买安全软件并测试他们的攻击,直到他们找到有效的方法来躲避它们。

迈克,主机网络公司马士基通信的首席科学家。斯图尔特警告说:在下一次更新之前,恶意软件变体可以在供应商的客户身上使用。解决方案之一是改变许多安全系统制造商使用的平均代码。

本地模式、对等模式、行业模式等。可以设置为以不同的速率更新。

马塞吉利用一系列全球因素来发现可疑事件的发生,然后将它们与特定的本地指标联系起来。全球系统只能关注有限的投入。范围太大,所以最好找到那些最频繁出现的特性。

附加的局部焦点允许添加更多的输入。在本地模式下,不需要将输入压缩到较小的特征集。这不仅会带来独特性,还会带来更好的准确性。

局部和全局模式的结合也是锐敏解决方案采用的方法,其BluVector产品使用机器学习来检测网络威胁。

基于美国政府机构的先进研究项目,该系统已经开始了几年的良好软件输出,并知道良性代码的所有方面。

敏锐首席执行官克里斯。勒弗乔伊说:我们的引擎擅长代码分析,可以指出给定的代码是否缺乏良性代码的特征。该引擎还结合了个人客户的新知识。

在将发动机交付给客户之前,我们已经对其进行了预先培训。这就像一个孩子离开了家,将继续在顾客的环境中学习。

主引擎还将根据全球数据进行季度更新,但不会在系统间共享唯一的客户相关数据。

这使得每种产品的部署略有不同,并针对每个客户进行了定制。即使攻击者购买了一个系统并开发了可以规避的代码,它也没有任何用处。

这是一场体育防御战,不能逆向工程,因为这些技术是针对客户环境的。

标题:如何使人工智能更实用地辅助网络安全

地址:http://www.yunqingbao.cn/yqbxx/2331.html