介 绍

Owl 是一款开源项目依赖分析工具,可以快速在指定的项目目录下查找符合某些特征的源代码文件或者依赖文件。为何开发了这款工具?例如很多时候我们项目太大,项目文件夹下有很多依赖文件,如一个 Java 项目引入了 Log4j 这个 jar 依赖,在项目中某文件存在循环依赖问题。当某个依赖包出现了漏洞时,本工具能快速扫描项目目录下存在的可疑依赖文件,并且给出依赖文件所在的地址,帮助开发者能快速进行定位到可疑文件。

主仓地址:https://github.com/Tencent/CodeAnalysis/tools/owl,代码也不多就 1000 行左右,感兴趣读者可以去看看,实现原理下面也介绍了,觉得不错的话你可以给按一个🌟

Owl🦉

A dependency module feature scanning detection tool for static analysis.


原 理

目前版本的功能比较简单,工作原理很简单,工具会对特定目录进行扫描通过内置的特征码算法匹配到特定文件,然后收集与其特征码匹配的文件地址,然后展示出来,也可以重定向到一个固定 json 文件中保存。

Owl 类似于杀毒软件一样,和杀毒软件的工作原理差不多, Owl 会根据依赖文件的特征码来扫描整个项目,和杀毒病毒库工作原理类似。当然如果严格按照杀毒软件那种标准做的话,可能涉及一些汇编相关的,目前 owl 功能实现还没有那么复杂,后面会版本会加入 codeql 代码分析引擎,通过 codeql 的数据库来做静态分析功能增强。

快速开始

如何使用 owl ?你可以克隆仓库然后通过如下命令:

git clone github.com:Tencent/CodeAnalysis.git

然后将目录切换到 tools\owl 下,如下:

cd CodeAnalysis/tools/owl

在仓库内部有一个 Makefile 文件可以快速帮助你构建相应平台的二进制文件,例如:

$: make help
make darwin    | Compile executable binary for MacOS platform
make linux    | Compile executable binary for Linux platform
make windows    | Compile executable binary for Windows platform
make clean    | Clean up executable binary

Owl 起因也是为 CodeAnalysis 所编写的特征检测工具,所以你也可以在:https://github.com/Tencent/CodeAnalysis 这个项目下面的 tools 目录找到已经编译好的二进制可执行文件,下载对应平台的二进制文件即可。

如何使用

程序构建完成会得到一个二进制文件,程序名称为 owl ,如下为 owl 执行效果,一些子命令参数都已经列出:

$: ./owl

             _____  _    _  __
            (  _  )( \/\/ )(  )
             )(_)(  )    (  )(__
            (_____)(__/\__)(____) 🦉 v0.1.3

 A dependency module feature scanning detection tool for static analysis.


Usage:
  owl [command]

Available Commands:
  completion  Generate the autocompletion script for the specified shell
  help        Help about any command
  hex         File hex encoding
  md5         Collection file md5
  run         Execute the scanner
  version     Version information

Flags:
  -h, --help   help for owl

Use "owl [command] --help" for more information about a command.

如果不知道子命令如何使用,可以在对应的子命令后面参入 --help 参数,即可得到帮助信息:

例如如果你要查找 Log4j ,你首先要通过 owl 计算 Log4j 特征码,命令如下:

$: ./owl md5 --path=/Users/ding/Downloads/log4j-1.2.17.jar

注意这里的特征码计算必须使用 owl 程序的算法,因为 owl 里面的算法针对大文件我是采用分数据块方案计算的,提升程序运行速度,所以如果使用其他软件的算法那么就会出现问题!

结果如下:

你也可以使用十六进制字符串特征去查找:

$: ./owl hex --path=/Users/ding/Downloads/log4j-1.2.17.jar

程序会将对应的文件转成十六进制字符串展示,如下图:

现在就可以使用扫描器进行扫描了,匹配模式可以指定为 md5 或者 hex ,未来可能会添加跟多的模式,命令如下:

$: ./owl run --dir=/Users/ding/Downloads/ --mode=md5 --code=04a41f0a068986f0f73485cf507c0f40

搜索得到具体依赖文件:

搜索结果如果过多,可以通过 --out 参数将结果重定向保存到文件中保存,文件格式为 Json !

SDK方式

上面介绍完是 Command Line 方式进行的,Owl 程序本身就是一个 Command Line ,核心逻辑在 github.com/auula/owl/scan 这个包中编写的,如果想二次开发,那么就可以直接使用 go get github.com/auula/owl 安装这个模块到你项目里面,然后直接通过硬编码的方式进行自定义编程;

一个简单实例,通过自定义代码方式进行依赖文件扫描和收集:

package main

import (
    "fmt"

    "github.com/auula/owl/scan"
)

func main() {
    // 创建扫描器
    scanner := new(scan.Scanner)
    // 设置扫描器路径     
    scanner.SetPath("github.com/auula/owl") 
    // 返回对应路径所有文件特征码
    res, _ := scanner.List() 
    fmt.Println(res)

    // 设置指定的匹配器,其他匹配器查看API文档
    scanner.SetMatcher(new(scan.Md5Matcher))
    // 搜索包含特征码文件,返回文件记录集合
    res, _ = scanner.Search("xxxx")

    // 打开一个文件描述符
    file, _ := os.OpenFile("res.json", os.O_CREATE|os.O_RDWR|os.O_TRUNC, 0666)
    // 将结果保存到指定文件中
    scanner.Output(file, res)
}

以上就是通过 SDK 方式自定义编码完成依赖特征检测。

其他

有问题欢迎提 issue ,工具不错的话记得按一个 ,另外更强代码分析工具使用:https://github.com/Tencent/CodeAnalysis

本文已参与「开源摘星计划」,欢迎正在阅读的你加入,活动链接:https://github.com/weopenprojects/WeOpen-Star

便宜 VPS vultr
最后修改:2023 年 07 月 05 日
如果觉得我的文章对你有用,请随意赞赏 🌹 谢谢 !