近日,谷歌在其博文中宣布开源了一款名为Magika的人工智能工具。Magika基于深度学习模型,能够快速高效地识别文件格式和内容类型。
据谷歌透露,Magika采用了一个定制的、高度优化的深度学习模型,在CPU上运行时可以在几毫秒内精确识别文件类型。在100多种格式的100万个文件的基准评估测试中,Magika的性能比现有工具高出约20%。其精确度和召回率均达到99%以上。
谷歌内部已经利用Magika来加强用户安全。该系统已经大规模部署,用于将Gmail、Drive和安全浏览中的文件发送到适当的安全和内容策略扫描器。与以前依赖手工创建规则的系统相比,谷歌通过Magika发现文件类型识别的准确率提高了50%。
此外,谷歌还表示VirusTotal集成了Magika之后,进一步提高了平台的效率和准确性。在对文件进行分析之前,Magika将起到预过滤的作用,并使用谷歌的生成式人工智能来检测恶意代码。