如何使用Python 對缺失值進(jìn)行處理
問題描述
最近項(xiàng)目一直在研究如何處理缺失值,因?yàn)槟脕矸治龅臄?shù)據(jù)多種多樣,缺失值也占了一小部分,讓人頭痛的有兩個(gè)問題:1.R語言里有一個(gè)專門處理缺失值的mice包,那么萬能的Python里有沒有相似的呢?2.如何對含有字符串類型的缺失值進(jìn)行填充呢?聚類啊回歸都是相對于數(shù)值型來說的,那么對于字符型有什么好的算法或者有什么好的封裝的包來處理呢?求大神解答。PS:額,樣例的話,比較不好描述,就如下:name,password,age,address張三,123456,15.3,sichuang李四,12,12.2,wuhan王五,232,12,錢六,,23,nanchang哈哈,123456,,lal啦啦,123123,,mmm
我們希望如R語言中的mice包一樣,能使用Python很快的填充里面的缺失值(當(dāng)然這個(gè)例子里面的信息關(guān)聯(lián)性不大,但是要處理的數(shù)據(jù)里關(guān)聯(lián)性比較多),再也如例子中,通過其他的屬性,將屬于字符串類型的address填充完整,就是第二個(gè)問題。
問題解答
回答1:#文本保存到1.txt,刪除最后一行的address值name,password,age,address張三,123456,15.3,sichuang李四,12,12.2,wuhan王五,232,12,錢六,,23,nanchang哈哈,123456,,lal啦啦,123123,,
import pandas as pddf = pd.read_table(’1.txt’, header=0, sep=’,’)#添加一列df[’new’] = ’新值’#按當(dāng)前行的其他列,填充address值df[’address’] = df.apply(lambda x: x[’new’] if pd.isnull(x[’address’]) else x[’address’], axis=1)print df回答2:
PyMICE is a Python? library for mice behavioural data analysis.你可以看看是不是你要的?https://neuroinflab.wordpress...http://neuroinflab.github.io/...
相關(guān)文章:
1. 安全性測試 - nodejs中如何防m(xù)ySQL注入2. javascript - 關(guān)于apply()與call()的問題3. html - eclipse 標(biāo)簽錯(cuò)誤4. python 利用subprocess庫調(diào)用mplayer時(shí)發(fā)生錯(cuò)誤5. python - Pycharm的Debug用不了6. datetime - Python如何獲取當(dāng)前時(shí)間7. 請問PHPstudy中的數(shù)據(jù)庫如何創(chuàng)建索引8. python - pycharm 自動刪除行尾空格9. python文檔怎么查看?10. javascript - nginx反向代理靜態(tài)資源403錯(cuò)誤?
