如果你的本地知识库已经有,应该可以通过 api 进行调用。
这里我推荐另外一个 python 库(rankify),建议自己实现 RAG,方便对技术的理解。你可以看下这个微信推文
欢迎各位提出新的见解:
我 review 了一下代码
我后面琢磨一下,怎么优化。
纯视觉的可以研究看一下这个例子
https://github.com/X-PLUG/MobileAgent/blob/main/README_zh.md
在自动化脚本执行失败,大模型介入进行 “诊断”。
解决弹窗,还有一种使用 OCR 的方式,但实现逻辑比较复杂。
大佬,受教了,后面研究一下
嗯,这种尝试过的,给大模型手机分辨率后,让模型返回按钮坐标。
这种对模型的能力要求有些高。之前尝试过,返回的坐标容易不正确。
但可以看一下 mobile_agent 这部分代码,是阿里视觉模型的,没有依赖页面结构
好的补充上了
常规自顶
嗯,会越来越好的
自己顶一下
全部重新更新了一下,再不行就没辙了
我怎么看的都是正常的
任就可能不清就看这个吧:
https://power-filament-0e1.notion.site/11c8ae0baa5f803c9121edc4e4d15b81?pvs=4
自己顶一下
微调、蒸馏,一起都用上吧。有这块的新的发现,到时候一起分享一下
办公智能,以后企业内部的 API 是一个很大的接入口(企业 API 知识库)。Agent 来分配哪些事情让 LLM 调用什么 API 库。(API 统一化管理进行安全监控)感觉https://www.eolink.com/ 可以朝这块走走
(dify 不错、Flow-RAG 也可行)
市面上优秀的 LLM_OPS 类轻应用配置平台那么多,为像接口测试一样配置,不伦不类哈。
现在这种测试平台说实话,轻应用有很大局限性的。限制想象力
行业就是存在变化,每 3 年什么体系都会变,平台的更新都赶不上技术的发展....
知识库肯定要有,没有垂直业务知识,做的东西都是跟现实脱节的,但现在知识库召回效果不咋滴哦。
AI 员工,这种都是测热度,自嗨,随便部署一套的吧。
第一步应该是 要把事情分成几步,几个角色,解决具体问题的 AI Agent
积累多几个 Agent
然后再 多 Agent 联合更好的完成一件事情,组一个 AI Agent 团队
实际现实的工作,1 个脑袋怎么想的全...多几个试试