1. python pandas如何过滤剔除数据
import pandas as pd
khhlist = pd.read_excel('客户号.xlsx')
hmdlist = pd.read_excel('黑名单.xlsx')
khhlist = khhlist[~khhlist['客户号'].isin(hmdlist['黑名单客户'].values)]
renamelist = {'客户号':'优质客户'}
yzkhlist = khhlist.rename(columns=renamelist)
yzkhlist.to_excel('优质客户.xlsx', encoding='utf8')
这个简单,用isin函数,前面加上~取反即可
2. pandas 怎么根据另一个dataframe来筛选
首先我们创建一个DataFrame,该DataFrame包含的数据如下
假如我们想要筛选D列数据中大于0的行版
使用&符号权可以实现多条件筛选,当然是用"|"符号也可以实现多条件,只不过他是或的关系。
假如我们只需要A和B列数据,而D和C列数据都是用于筛选的,可以这样写:只返回了AB两列数据‘
我们以上用到的方法都是通过一个布尔索引完成的,我们看一下这样的运算返回的值是什么
我们还可以使用insin方法来筛选特定的值,把要筛选的值写到一个列表里,如alist
假如选择D列数据中,有alist中的值的行
3. 06 pandas DataFrame - 数据过滤、NaN处理、统计方法
个人觉得并没有什么用,完全可以用切片或索引器代替
原数据:
1、删除nan
2、设置NaN的值
使用nan下一行的值进行填充 (axis=1列填充)
使用nan上一行的值进行填充 (axis=1列填充)
按列填充
值替换 将语文成绩中88分换成99分
1、 计数方法count只记非nan值 (axis=1 按列)
2、总统计值
3、最值、累加
4、中位数 quantile median
5、 最大值的索引值
6、 偏科程度(判断一组数据的最大值和最小值差别是不是瞎察芹磨毕很大)
7、 样本值累计和
本行值没判加上一行的值,88+33=121
8、变化率
第一行NaN,因为上一行没有数据,无法计算变化率
正的是增长的百分率,负的是减少的半分率
4. python 中的pandas怎么筛选csv文件中
import pandas as pd
df1 = pd.read_csv('1.csv')
df2 = pd.read_csv('2.csv')
idx_for_df1 = df1['列标'].isin(df2['列标']) # 使用DataFrame.isin 筛选列标字符一样的行
df_final = df1[idx_for_df1] # df_final 是你想要的结果