1. python pandas如何過濾剔除數據
import pandas as pd
khhlist = pd.read_excel('客戶號.xlsx')
hmdlist = pd.read_excel('黑名單.xlsx')
khhlist = khhlist[~khhlist['客戶號'].isin(hmdlist['黑名單客戶'].values)]
renamelist = {'客戶號':'優質客戶'}
yzkhlist = khhlist.rename(columns=renamelist)
yzkhlist.to_excel('優質客戶.xlsx', encoding='utf8')
這個簡單,用isin函數,前面加上~取反即可
2. pandas 怎麼根據另一個dataframe來篩選
首先我們創建一個DataFrame,該DataFrame包含的數據如下
假如我們想要篩選D列數據中大於0的行版
使用&符號權可以實現多條件篩選,當然是用"|"符號也可以實現多條件,只不過他是或的關系。
假如我們只需要A和B列數據,而D和C列數據都是用於篩選的,可以這樣寫:只返回了AB兩列數據『
我們以上用到的方法都是通過一個布爾索引完成的,我們看一下這樣的運算返回的值是什麼
我們還可以使用insin方法來篩選特定的值,把要篩選的值寫到一個列表裡,如alist
假如選擇D列數據中,有alist中的值的行
3. 06 pandas DataFrame - 數據過濾、NaN處理、統計方法
個人覺得並沒有什麼用,完全可以用切片或索引器代替
原數據:
1、刪除nan
2、設置NaN的值
使用nan下一行的值進行填充 (axis=1列填充)
使用nan上一行的值進行填充 (axis=1列填充)
按列填充
值替換 將語文成績中88分換成99分
1、 計數方法count只記非nan值 (axis=1 按列)
2、總統計值
3、最值、累加
4、中位數 quantile median
5、 最大值的索引值
6、 偏科程度(判斷一組數據的最大值和最小值差別是不是瞎察芹磨畢很大)
7、 樣本值累計和
本行值沒判加上一行的值,88+33=121
8、變化率
第一行NaN,因為上一行沒有數據,無法計算變化率
正的是增長的百分率,負的是減少的半分率
4. python 中的pandas怎麼篩選csv文件中
import pandas as pd
df1 = pd.read_csv('1.csv')
df2 = pd.read_csv('2.csv')
idx_for_df1 = df1['列標'].isin(df2['列標']) # 使用DataFrame.isin 篩選列標字元一樣的行
df_final = df1[idx_for_df1] # df_final 是你想要的結果