pandas做数据的清洗

xiaoxiao2021-02-28  121

    转换之后的经纬度的数据出现很多的问题,重复,特殊值,,,所以我就是做了一个简单的清洗使用 Python里面的pandas。

#coding:utf8 import pandas as pd import numpy as np # import csv df = pd.read_csv(r'D:\MobileFile\fangjia2.csv', encoding='gbk')#读取房价文件 df2 = pd.DataFrame(df)#数据传入 df3 = df2.replace(df2[df2['jiage']<2000],np.nan)#找出jiage里面2000以下的数据替换为空 df4 = df3.dropna(how='any')#删除为空值的行 df5 = df4.drop_duplicates()#去重 print df5.duplicated()#显示是否重复 df5.to_csv(r'D:\MobileFile\fangjia5.csv',encoding='utf-8')#存储新的csv文件
转载请注明原文地址: https://www.6miu.com/read-40068.html

最新回复(0)