数据测试关于 python 数组筛选的问题

Alpha · 2017年12月18日 · 最后由 Alpha 回复于 2017年12月19日 · 4183 次阅读


a = np.array([['项目A','薛之谦','费用1',200],
                      ['项目A','薛之谦','费用2',100],
                      ['项目B','薛之谦','费用3',300],
                      ['项目C','张韶涵','费用4',600],
                      ['项目C','张韶涵','费用5',300]])


b = np.array([['项目A',2000,3000],
                    ['项目B',5000,2000],
                    ['项目C',3000,1000]])

# 需求：
# 1、需要从a中取出薛之谦的所有项目：项目A和项目B
# 2、从b中根据"a_project"，将b中包含有"a_project"的列的后两列累加，即：2000+3000+5000+2000

# 实现：
# 1、
a_project = np.unique(a[a[:,1] == '薛之谦',:][:,0]) #['项目A' '项目B']

# 2、

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！

打赏支持

共收到 6 条回复时间点赞

Alpha #1 · 2017年12月18日 Author

第 2 点如何实现？

rywu #2 · 2017年12月18日

np.where(np.in1d(b[:,0],a_project),np.sum(b[:,1:].astype('float'),axis=1),0).sum()

1 将第一列拿出来，然后跟 a_project 比较不同

scondition=np.in1d(b[:,0],a_project)
#      [ True  True False]

2 然后将 b 的后两列相加

data=np.sum(b[:,1:].astype('float'),axis=1)
#    [ 5000. 7000. 4000.]

3 筛选并求和

np.where(scondition,data,0).sum()

缺点:
效率不是太好

Alpha #3 · 2017年12月18日 Author

对

rywu 回复

你这个有点霸王硬上弓的意思啊...

Alpha #4 · 2017年12月18日 Author

对

rywu 回复

这样可以省去一个 where...哈哈哈，是不是更便于理解

b[np.in1d(b[:, 0], a_project)][:, 1:3].astype(np.float).sum(axis=1).sum()

rywu #5 · 2017年12月18日

#4 楼 @yoyoalphax
是不是还可以简写
b[np.in1d(b[:,0]，a_project),1:].astype('float').sum()

—— 来自 TesterHome 官方安卓客户端

8楼已删除

Alpha #7 · 2017年12月19日 Author

对

rywu 回复

哈哈！对！！！

Alpha 关闭了讨论 03月01日 00:01

需要登录后方可回复, 如果你还没有账号请点击这里注册。

数据测试 关于 python 数组筛选的问题

数据测试 关于 python 数组筛选的问题

数据测试关于 python 数组筛选的问题

数据测试关于 python 数组筛选的问题