在当今快速演进的数字时代,人工智能(AI)技术已成为革新传统行业和构建未来智能系统的关键力量。在众多对 AI 的应用研究与实践中,计算机视觉 (CV) 作为其中一项至关重要的领域,正在影响着我们与周遭世界互动的方式。
通过模拟人类视觉系统的功能,计算机视觉技术让机器能够以前所未有的精度和效率执行图像和视频分析,并在诸多行业场景中得以落地,比如医疗诊断、自动驾驶、安防监控、内容审查等。即使在日常生活中,它也为我们带来了极大的效率提升,比如图片搜索、车牌识别、智能电子秤等。
由异步图书和 TesterHome 社区联合策划,人民邮电出版社 2025 年 2 月出版的《人工智能计算机视觉算法测试与应用指南》(电子书) 一书便是在这样的背景下产生的。
阅读渠道:
1.微信读书
点击阅读
2.京东读书
点击阅读
本书由资深专家邹军、鲁四喜、陈雲飞倾力打造,他们在人工智能与计算机视觉领域拥有多年丰富的经验和深刻的洞察力。全书分为四个部分,层层递进,涵盖了从理论基础到实践应用的全方位知识体系,凝结作者多年来积累的质效经验和技术实践。作者希望将人工智能(AI)测试及其智能化应用的方法转化为文字,以帮助那些对此领域充满好奇与热情的读者。
邹军:北京邮电大学硕士,毕业于信号与信息处理专业。从 2006 年开始陆续加入过外企、创业公司和互联网企业,主要从事软件相关的研发测试工作,也曾参与测试标准的撰写与评定,具备多年的技术质量实践经验与团队管理经验。目前在效能研发领域负责一站式测试平台及效能平台的建设。
鲁四喜:美国伊利诺伊大学香槟分校(UIUC)计算机数据科学硕士。目前有超过 18 年软件研发经验,10 年以上的技术团队管理经验。加入过外企、创业公司和互联网大厂。从事过多种不同的行业,包括网络安全、互联网家装、数字音乐、区块链、金融科技等。在互联网大厂从事过计算机视觉相关的 Al 算法及产品的专项测试工作。目前致力于通过先进的技术手段来保障金融产品质量及提升研发效率。
陈雲飞:北京理工大学计算机科学与技术专业硕士。在计算机视觉领域有丰富的研发测试经验,对深度学习算法测试有深入理解。在智能驾驶领域深耕多年,熟悉国内外智能驾驶测试标准和规范,参与多个智能驾驶相关国家测试标准的讨论和制定,为规范和推动我国智能驾驶行业的发展做出了重要贡献。现任视觉算法&智能驾驶团队质量负责人,带领团队专注于 AI 算法测试技术的研究与应用。
本书向读者介绍了人工智能(AI)的理论知识,探讨构建计算机视觉软件产品质量体系的方法,分享智能化测试的实践技巧,并解释大语言模型应用与评测。
第一部分是人工智能(AI)的理论知识,以此作为本书知识框架的基础。
这部分包含 5 章,“人工智能的前世今生”、“Al 数学逻辑”、“CV 知识背景”、“神经网络入门”、“心算法模型的评估指标”,我们从 AI 的历史开篇,深入浅出地讲解计算机视觉中的数学知识、神经网络的基础架构以及常见的算法评估标准。对于 AI 初学者来说,此部分是进入 AI 世界的基础。对于有经验的专业人士,它则提供了一个坚实的回顾与参照。
第二部分是人工智能(AI)产品质量体系建设实践,以计算机视觉 (CV) 系统为例讲解 AI 系统的测试策略。
这部分包含了章,“AI 工程质量”、“Al 数据质量”、“Al 模型质量”,我们从传统软件测试与 Al 系统测试的异同开始,探讨工程、数据、模型三个维度的质量建设方法。这里会涉及数据采集、数据增强和模型的分层测试技术。此部分可以帮组读者了解如何去构建一个针对 AI 应品的质量保障体系。
第三部分是智能化测试探索,讨论计算机视觉 (CV) 技术在测试中的具体应用。
这部分包含 4 章,“智能 UI 自动化”、“UI 异常检测”、“UI 遍历技术”、“大模型时代的挑战与机遇”,我们展示了将 CV 技术融入 UI 自动化测试的实践方法,探索利用深度学习构建的异常检测机制,以及讨论 CV 技术在 UI 遍历测试中的具体运用场景。最后,我们延伸到大模型,介绍了其在评测与文生图上的应用示例。此部分可以作为读者应用 AI 的导引,为读者在自己所在领域内实施 AI 技术打开视野。
第四部分是大语言模型 (LLM) 应用与评测,介绍大语言模型基础知识、在测试领域的应用与评测技术等。
这部分包含两章,“迎接大语言模型时代”、“大语言模型测试应用及其评测”,我们从大语言模型的定义开始,介绍了 LLM 演进历史、应用场景与技术、以及局限性。并对其在测试领域应用,进行了示例说明。然后,我们探讨了大语言模型在图像领域的应用,解释了大语言模型基础能力、文生图能力、文生视频能力等三种能力的评测技术与指标框架。此部分可以作为读者认识大语言模型的知识基础,为在实践中应用 LLM 评测 LLM 能力提供指导。
结合当下行业趋势来看,人工智能和计算机视觉技术的发展势头正猛,各行各业都在积极探索和应用这些技术。而这本书正是紧跟时代步伐,为我们提供了一本既有深度又具实用性的参考书。它不仅能够帮助我们深入了解 AI 和计算机视觉技术的测试与应用,还能够激发我们对于这些技术的浓厚兴趣和探索欲望。
这本书为读者在技术不断演进的今天获得全面的知识框架做了很好的梳理,也希望通过实用技术与案例的介绍,能有更多的同路人一起探索 AI 应用的场景。无论你是 AI 图像领域的从业人员、研学者还是爱好者,相信这本书都将对你有所裨益。
总之,《人工智能计算机视觉算法测试与应用指南》是一本值得一读的好书。它以其全面的内容、深入的探讨和实用的案例,为我们揭示了 AI 和计算机视觉技术在测试与应用中的奥秘和魅力。无论你是 AI 领域的专业人士,还是对 AI 技术感兴趣的普通读者,这本书都将是你不可多得的良师益友。让我们一起走进这本书的世界,共同探索 AI 和计算机视觉技术的无限可能吧!
希望本书能够成为读者在计算机视觉学习和应用过程中的综合性指导手册,助力理论探索和实践操作,为读者提供实质性的帮助和指导。
但由于作者的认知所限,书中难免有所疏漏,恳请读者们的批评指正。
最后,在本书将近一年的写作过程中,张涛、肖利琼、袁肇飞给予了很多意见,而唐文博书写了第十一章的大部分内容,对此表示感谢。由于三位作者身在北京、杭州、深圳三地,为此进行了几十次线上会议过程十分有趣,期望再次合作。
感谢您的阅读与支持。