比如我有一堆 bug 的特性信息:
bug 类型 (空指针/组数越界/非法传参) 或是堆栈信息,
bug 出现的手机系统 (10/9/8),
bug 出现的页面 (A/B/C) 怎样转化为特征值,
然后去训练出 出现频次最高的 bug 类型以及系统呢?😭
只是简单举个栗子,想以这样的栗子 作为更深入理解 机器学习实践的入门方式(网上的栗子都是一堆数据情况下的)
小白入门,轻喷~
不太理解你想问啥,是想找出这些数据中的出现频次最高的 bug 类型以及系统,还是以后的 BUG 数据做一个预测呢?
这些数据中的出现频次最高的 bug 类型以及系统——这个
猜想数据量非常大。而且 bug 堆栈信息有些类似,想以这样方式训练