一、数据导入
(一)读取CSV文件
1、读取本地CSV
#先创建一个CSV文件,存入数据,数据之间以“逗号”分割。 数据源来源于网络。
import pandas as pd df = pd.read_csv("D:\\pycharm\\data\\data.csv") print(df) 引用pandas需要先安装pandas包。 输出结果:2、读取网络数据CSV
import pandas as pd data_url = "https://...csv" #网络读取 df = pd.read_csv(data_url) (二)读取EXCEL文件 #读取excel之前先打开命令行,安装xlrd。即在命令行中输入pip install xlrd。
import pandas as pd df = pd.read_excel("D:\\pycharm\\data\\test.xlsx") print(df) 输出结果:
(三)读取MySQL数据 #安装MySQLdb包,假设读取用户名username,密码password,读取mydb数据库中的数据
import pandas as pd #读取mysql import MySQLdb mysql_cn= MySQLdb.connect(host='localhost', port=3306,user='username', passwd='password', db='mydb') df = pd.read_sql('select * from test;', con=mysql_cn) mysql_cn.close() 二、数据导出 (一)导出到CSV文件 import pandas as pd df = pd.read_excel("D:\\pycharm\\data\\test.xlsx") print(df) df.to_csv("D:\\pycharm\\data\\testcsv.csv", encoding='utf-8', index=False)#数据导出到tsetcsv.csv# 将test.xlsx的数据导入到testcsv.csv文件中 #数据中含有中文,使用‘utf-8’,index=false去掉行名称导出
(二)导出到EXCEL文件 #先安装openpyxl包
import pandas as pd import openpyxl df = pd.read_excel("D:\\pycharm\\data\\test.xlsx") df.to_excel("D:\\pycharm\\data\\excel2excel.xlsx", encoding='utf-8', index=False)#数据导出到excel2excel.xlxs# dt = pd.read_excel("D:\\pycharm\\data\\excel2excel.xlsx") print(dt)