测试之家
  • 社区
  • 问答
  • 招聘
  • 社区学堂新
  • 开源项目
  • 活动
  • Wiki
  • 注册
  • 登录
会员
andyguo (andyguo)
第 83 位会员 / 2012-12-27
香港科技大学 @ 香港
16 篇帖子 • 64 条回帖
40 关注者
22 正在关注
4 收藏
GitHub Public Repos
  • xiaohongshu 0

  • scrapyLocalWebsite 0

  • SoulX-Podcast 0

    SoulX-Podcast is an inference codebase by the Soul AI team for generating high-fidelity podcasts ...

  • XHS-Downloader 0

    小红书(XiaoHongShu、RedNote)链接提取/作品采集工具:提取账号发布、收藏、点赞、专辑作品链接;提取搜索结果作品、用户链接;采集小红书作品信息;提取小红书作品下载地址;下载小红书...

  • SoraWatermarkCleaner 0

    This project is to remove the watermark from the sora2 generated videos, with best quality.

  • xhs-ai-writer 0

    这是一个专为小红书内容创作者打造的AI工具,能够智能分析热门笔记并生成高质量的爆款文案。

  • AI-Video-Transcriber 0

    Transcribe and summarize video content using AI. Open-source, multi-platform, and supports multi...

  • droidrun 0

  • English-learner 0

    为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件 / Words learning and English muscle memory training software designed fo...

  • awesome-chatgpt-prompts 0

    This repo includes ChatGPT prompt curation to use ChatGPT and other LLM tools better.

More on GitHub
  • 个人信息
  • 专栏
  • 话题
  • 回帖
  • 收藏
  • 关注中
  • 关注者
  • 大模型稳定性测评:从理念到实现的完整技术方案 at 2025年12月01日

    没个题都是 3 个模型测评,当然也可以选择一个

  • 大模型稳定性测评:从理念到实现的完整技术方案 at 2025年12月01日

    90% 都是对的,我用 gpt 和 Gemini 双模型测评

  • 大模型稳定性测评:从理念到实现的完整技术方案 at 2025年11月18日

    我是 3 个模型同时测评,如果 2 个都一样就默认模型评测结果是可靠的,如果不一样就需要人工审核

  • 最新的《Top 20 AI Prompt 编程语言》榜单 at 2025年11月12日

    我同事中了 5 个 +

  • 测试兼职 - 测试内推 at 2025年11月06日
    仅楼主可见
  • 测试兼职 - 测试内推 at 2025年11月05日
    仅楼主可见
  • 测试兼职 - 测试内推 at 2025年11月05日
    仅楼主可见
  • 大模型稳定性测评:从理念到实现的完整技术方案 at 2025年11月03日

    其实设计这个目的就是测评我们系统 temperature 的设置对模型返回内容的影响,有的时候会出现矛盾的回答,还有一些小模型的分流是否正常

  • AI 模型测评平台工程化实战(第一讲:从手工测试到系统化的觉醒) at 2025年10月14日

  • Cursor 团队代码规范与开发规则 at 2025年10月10日

    我的很多测试系统还是纯 ai 写的呢,ai 时代想法和动手能力很重要,不要对 ai 输出的东西就认为是垃圾

  • 大模型 + Search 的评估方法 - 从人工标注到第三方模型测评的系统性实践 at 2025年10月09日

    是这样的,我们是大学,所以人多,研究生 博士多的很

  • 大模型 + Search 的评估方法 - 从人工标注到第三方模型测评的系统性实践 at 2025年10月09日

    你说的是幻觉,其实难的实时搜索的准确性

  • 大模型 + Search 的评估方法 - 从人工标注到第三方模型测评的系统性实践 at 2025年10月09日

    有固定答案的基本上裁判模型就搞定了,专业的问题 我们会找对应方面的人去做审核,比如粤语口语需要本地 local 才可以,法律就找法律的学生

  • 大模型 + Search 的评估方法 - 从人工标注到第三方模型测评的系统性实践 at 2025年10月09日

    一部分开源系统,一部分根据开发优化方向自己编写 + 部分 ai 生成,第三部分就是生成环境用户访问的记录,主要是香港都是粤语,对粤语的方言不是很了解,所以生成环境来的居多,同时学校有大量的香港 local 帮忙编写和核实

  • AI 模型测评平台工程化实战(第一讲:从手工测试到系统化的觉醒) at 2025年10月09日

    大模型不做系统测评,没办法测试了

  • 仿真测试-HiL 测试全解析 at 2023年03月01日

    目前人还不多,我也是刚入门一年左右

  • 仿真测试-HiL 测试全解析 at 2023年03月01日

  • 今天到公司早整理一下对车路协同的一些认知 at 2023年03月01日

    这些感知识别,基本上都是政府采购,不是那个公司可以随便安装的,这样就会有安全问题了,谁都可以监控到所有的路过的车辆信息了,这些信息是非常值钱的,而且这些数据监管比较严格的。
    你说的接收数据,目前已经有了这样的统一协议 V2X 可以了解一下
    车路协同是单车无人驾驶的补充,还是单车无人驾驶为主目前是这样的情况

  • 今天到公司早整理一下对车路协同的一些认知 at 2023年03月01日

    现在已经这样做了,无人驾驶亦庄示范区还有很多高速都按照, 就像手机基站,只要量大 有使用场景肯定能收回成本,而且说不定盈利,这个在车路协同中叫 RCU 雷摄一体机,而且是 100ms 实时上报数据,我们计算完成实时下方,这就需要边缘计算 +v2x 这些 ,不过目前网络仍是主要瓶颈

  • loadrunner 和 jmeter 大 PK at 2017年05月17日

    其实性能测试的难点不是脚本开发上,而是在于测试场景的设计上,如何更加真实的模拟线上的情况,问题定位和调优一直是性能测试最大的挑战,这块才是能够体现一个性能测试工程师能力的核心。而不是在工具的选择上和脚本的开发上

  • loadrunner 和 jmeter 大 PK at 2017年05月17日

    lr 虽然笨重,但是能通过 c 语言实现很多复制的业务逻辑,有时需要模拟一些加解密的算法都可以很快写一套出来,关于 lr 的 Linux 版本,在之前的公司都是压力机用 Linux,办公机只是做数据收集和展示,对办公网压力基本上没影响。jmeter 也有很多优点,开源可以做持续集成,但是有时候要做复杂的业务逻辑和断言就有点麻烦,可能个人能力有限,关于对 jmeter 做二次开发的能力不够,所有在脚本开发上感觉 lr 还是很强大的,但是就是收费的

  • HTTPS 是大势所趋?看腾讯专家通过 Epoll+OpenSSL 在高并发压测机器人中支持 https at 2016年12月05日

    如何对 https 返回结果内容的正确性做检查呢/?

  • [北京] 360 招聘测试&测试开发工程师 (15~30K) at 2016年07月01日

    继续招聘了,又有新的职位了

  • [北京] 360 招聘测试&测试开发工程师 (15~30K) at 2016年05月12日

    继续求简历中,又来一批

  • [北京] 360 招聘测试&测试开发工程师 (15~30K) at 2016年04月05日

    继续求简历啊

  • 1
  • 2
  • 3
  • 下一页
  • 关于 / 活跃用户 / 中国移动互联网测试技术大会 / 反馈 / Github / API / 帮助推广
    TesterHome社区,测试之家,由众多测试工程师组织和维护的技术社区,致力于帮助新人成长,提高测试地位,推进质量发展。Inspired by RubyChina
    友情链接 WeTest腾讯质量开放平台 / InfoQ / 掘金 / SegmentFault / 测试窝 / 百度测试吧 / IT大咖说
    简体中文 / 正體中文 / English

    ©testerhome.com 测试之家   渝ICP备2022001292号
      渝公网安备 50022202000435号    版权所有 © 重庆年云聚力信息技术有限公司