一个测开老兵的 26 年个人成就计划


2026 年测试智能化升级技术实现方案 v3

1. 核心背景与重构目标

本项目 llmcase-v3 旨在通过最先进的 RAG(检索增强生成)与 Multi-Agent(多智能体)代理技术,对老旧的线性流水线进行彻底重构。

1.1 核心攻关痛点

1.2 核心目标


2. 总体架构设计 (Technical Stack)

层次 选型 作用
应用编排 (Orchestration) LangChain & LangGraph 管理复杂的状态流转与· Agent 协作。
知识检索 (RAG) FAISS / Milvus 存储文档片段与历史用例,提供上下文。
可观测性 (Obs.) LangSmith 链路追踪、调试、数据集沉淀、Prompt 管理。
质量评估 (Eval) Ragas & Legacy Scorer 量化计算 Faithfulness 等指标,辅以规则校验。
模型引擎 (LLM) doubao / qwen 强逻辑推理,核心生成引擎。

2.2 技术选型与判定逻辑 (Technology Selection Logic)

基于 demos/ 目录下的技术验证,制定了以下选型与判定逻辑,作为本案的实施基石:

  1. 文档解析与加载提取 (Data Loader)

  2. 文档分块策略 (Chunking Strategy)

  3. 检索架构 (Retrieval Architecture)

2.3 逻辑架构图 (LangGraph Flow)

graph TD
    User([需求文档 Word/Text]) -->|Input| Start((开始))

    subgraph "知识层 (Knowledge Base)"
        History[历史 Excel 用例] -->|ETL| VectorStore[(向量数据库)]
        Doc[当前需求] -->|Loader| VectorStore
    end

    subgraph "智能体层 (LangGraph Core)"
        Start --> Entity[实体提取 Agent]
        Entity --> Point[测试要点生成 Agent]
        Point --> Case[测试用例生成 Agent]

        VectorStore -.->|Few-Shot Samples| Point
        VectorStore -.->|Context Metadata| Case

        Case --> Eval[Ragas 评估 Agent]
        Eval -->|分数 < 0.8| Opt[重构优化 Agent]
        Opt -->|改进建议| Case
        Eval -->|分数 >= 0.8| Output[最终测试方案]
    end

    LangGraph -->|全链路 Trace| LangSmith
    Output -->|Result| User

3. 详细模块实现方案

3.1 闭环 RAG Pipeline 实现

  1. 加载器 (Data Loader):
  2. 动态分块 (Chunking):
  3. 高级检索流程 (Advanced Retrieval Flow):

3.2 现有功能逻辑复用 (Legacy Logic Integration)

3.3 LangGraph 状态机与自愈机制

3.4 LangSmith 增强功能

3.5 Few-Shot 详细设计实现机制

为了确保 生成 Agent 能够输出高可用、格式标准的测试用例,我们基于演示验证 (demos/rag_04_langgraph.py) 设计了 Few-Shot 的专门处理与应用机制:


4. 实施阶段 (Roadmap)

  1. Phase 1: 基础设施搭建与 Legacy 逻辑原子化封装。
  2. Phase 2: 构建 RAG 知识库与两路检索链路。
  3. Phase 3: 实现 LangGraph 闭环并集成 Ragas + LangSmith。

5. 核心拓展方案设计评估 (Extensions)

5.1 输入内容定义机制评估

考虑到不同用户角色的使用习惯及诉求,方案定义了 “三核触发模式”:

  1. 主流程(用户提供 docx 策划文档)
  2. 知识库底座录入(用户提供 excel 策划文档)
  3. 即时探索流程(不录入文档直接提问)

5.2 动态分块与多模态处理方案评估

结合实际带有配图的需求文档,形成如下处理链路:

5.4 全链路详细节点与数据流转设计 (Detailed Implementation Flow)

- 略

6. 实施现状与后续工作规划 (Implementation Status & Future Planning)

6.1 当前落实情况 (v3.0 Release State)

在当前版本的优化中采取了 “技术思想先行,轻量化落地” 的策略。具体应用如下:


↙↙↙阅读原文可查看相关链接,并与作者交流