研发效能 JCCI(Java 代码改动影响分析) 新实现分享

白开水pp · 2024年04月09日 · 最后由白开水pp 回复于 2024年10月10日 · 10695 次阅读

JCCI 自发布以来，收到了大家积极的回应，并反馈了许多问题，如分析效率，分析准确性和展示样式等问题。

为了彻底解决这些问题，JCCI 重新重构并完成重构上线，重点包含以下几个方面：

重构思路

总体思路是：JCCI 使用 sqlite3 存储 Java 文件解析结果，拆分成 project class import field methods 几个表，分别存储对应信息，然后通过 sql 查询方法调用

sqlite3 表结构

表结构如下

CREATE TABLE project (
    project_id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,
    project_name TEXT NOT NULL,
    git_url TEXT NOT NULL,
    branch TEXT NOT NULL,
    commit_or_branch_new TEXT NOT NULL,
    commit_or_branch_old TEXT,
    create_at TIMESTAMP NOT NULL DEFAULT (datetime('now','localtime'))
);

CREATE TABLE class (
    class_id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,
    filepath TEXT,
    access_modifier TEXT,
    class_type TEXT NOT NULL,
    class_name TEXT NOT NULL,
    package_name TEXT NOT NULL,
    extends_class TEXT,
    project_id INTEGER NOT NULL,
    implements TEXT,
    annotations TEXT,
    documentation TEXT,
    is_controller REAL,
    controller_base_url TEXT,
    commit_or_branch TEXT,
    create_at TIMESTAMP NOT NULL DEFAULT (datetime('now','localtime'))
);

CREATE TABLE import (
    import_id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,
    class_id INTEGER NOT NULL,
    project_id INTEGER NOT NULL,
    start_line INTEGER,
    end_line INTEGER,
    import_path TEXT,
    is_static REAL,
    is_wildcard REAL,
    create_at TIMESTAMP NOT NULL DEFAULT (datetime('now','localtime'))
);

CREATE TABLE field (
    field_id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,
    class_id INTEGER,
    project_id INTEGER NOT NULL,
    annotations TEXT,
    access_modifier TEXT,
    field_type TEXT,
    field_name TEXT,
    is_static REAL,
    start_line INTEGER,
    end_line INTEGER,
    documentation TEXT,
    create_at TIMESTAMP NOT NULL DEFAULT (datetime('now','localtime'))
);


CREATE TABLE methods (
    method_id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,
    class_id INTEGER NOT NULL,
    project_id INTEGER NOT NULL,
    annotations TEXT,
    access_modifier TEXT,
    return_type TEXT,
    method_name TEXT NOT NULL,
    parameters TEXT,
    body TEXT,
    method_invocation_map TEXT,
    is_static REAL,
    is_abstract REAL,
    is_api REAL,
    api_path TEXT,
    start_line INTEGER NOT NULL,
    end_line INTEGER NOT NULL,
    documentation TEXT,
    create_at TIMESTAMP NOT NULL DEFAULT (datetime('now','localtime'))
);

主要介绍 methods 表 method_invocation_map 字段，存储解析方法用到的类和方法，便于后续查询哪些方法用到了某类或方法。
method_invocation_map 字段存储示例：

{
    "com.XXX.Account": {
        "entity": {
            "return_type": true
        }
    },
    "com.XXXX.AccountService": {
        "methods": {
            "functionAA(Map<String#Object>)": [303]
        },
        "fields": {
            "fieldBB": [132]
        }
    }
}

分析调用

这部分主逻辑改成分析改动的类或方法被哪些方法调用，通过 sql 的方式查询结果，示例代码：

SELECT
    *
FROM
    methods
WHERE
    project_id = 1
    AND (json_extract(method_invocation_map,
    '$."com.xxxx.ProductUtil".methods."convertProductMap(QueryForCartResponseDTO)"') IS NOT NULL
    OR json_extract(method_invocation_map,
    '$."com.xxxx.ProductUtil".methods."convertProductMap(null)"') IS NOT NULL)

展示方式

之前展示方式由树图和关系图展示，但是树图展示链路不清晰，关系图节点坐标不合理，这部分也进行了优化，根据节点关系计算节点坐标，关系链路越长，横坐标越大，展示更清晰，示例代码：

def max_relationship_length(relationships):
    if not relationships:
        return {}
    # 构建邻接列表
    graph = {}
    for relationship in relationships:
        source = relationship['source']
        target = relationship['target']
        if source not in graph:
            graph[source] = []
        if target not in graph:
            graph[target] = []
        graph[source].append(target)

    # BFS遍历计算每个节点到起点的最长路径长度
    longest_paths = {node: 0 for node in graph.keys()}
    graph_keys = [node for node in graph.keys()]
    longest_paths[graph_keys[0]] = 0
    queue = deque([(graph_keys[0], 0)])
    while queue:
        node, path_length = queue.popleft()
        if not graph.get(node) and not queue and graph_keys.index(node) + 1 < len(graph_keys):
            next_node = graph_keys[graph_keys.index(node) + 1]
            next_node_path_length = longest_paths[next_node]
            queue.append((next_node, next_node_path_length))
            continue
        for neighbor in graph.get(node, []):
            if path_length + 1 > longest_paths[neighbor]:
                longest_paths[neighbor] = path_length + 1
                queue.append((neighbor, path_length + 1))
    return longest_paths

新增分析方式

JCCI 除了原先的分析同一分支两次提交的影响，还新增了分析指定类、分析两个分支的功能，示例：

from path.to.jcci.src.jcci.analyze import JCCI

# 同一分支不同commit比较
commit_analyze = JCCI('git@xxxx.git', 'username1')
commit_analyze.analyze_two_commit('master','commit_id1','commit_id2')

# 分析一个类的方法影响, analyze_class_method方法最后参数为方法所在行数，不同方法行数用逗号分割，不填则分析完整类影响
class_analyze = JCCI('git@xxxx.git', 'username1')
class_analyze.analyze_class_method('master','commit_id1', 'package\src\main\java\ClassA.java', '20,81')

# 不同分支比较
branch_analyze = JCCI('git@xxxx.git', 'username1')
branch_analyze.analyze_two_branch('branch_new','branch_old')

灵活配置

可以在 config 文件配置 sqlite3 db 存储路径、项目代码存储路径和忽略解析的文件等，示例：

db_path = os.path.dirname(os.path.abspath(__file__))
project_path = os.path.dirname(os.path.abspath(__file__))
ignore_file = ['*/pom.xml', '*/test/*', '*.sh', '*.md', '*/checkstyle.xml', '*.yml', '.git/*']

展示效果

最终还是会生成 cci 格式的文件，存储分析生成的关系图数据和影响接口列表数据的 json
关系图的效果展示：

结语

项目地址：JCCI，
欢迎大家继续试用并反馈，期待大家的 star~
联系方式等都在 GitHub 项目的 readme 中，谢谢~~

12 个赞

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！

打赏支持

共收到 3 条回复时间点赞

小土豆 #1 · 2024年04月11日 1 个赞

效率和准确性比之前高不少，大佬 666

又活了一天在回归测试遇到的问题求助中提及了此贴 05月10日 18:18

底层贫困人员在结合 Jcci！生成代码提交影响分析报告！中提及了此贴 07月09日 08:41

wjy07507 #3 · 2024年10月09日

大佬你好，这个工具生成结果后，
1、我们这边数据库主要是看 method 这张表的 method_name 和 method_invocation_map，但是这个 method_name 对应哪个 class 是需要用 classid 去 class 表里去查的是吧？
2、然后这个工具生成的数据库，实际是整个代码仓里对应的所有的 class 和方法，不是只有变更项的吧？变更项是需要用 cci 那个文件，用 jcci_result.html 自己去读，然后找到变更项后自己在 method 表里去查 method_invocation_map 对应的方法么

白开水pp #2 · 2024年10月10日 Author

对

wjy07507 回复

项目里有我微信，加我微信咨询吧

需要登录后方可回复, 如果你还没有账号请点击这里注册。