文件
1. 文件的介绍
大多数情况下我们要处理的文件都是文本文件其他文件都是二进制进行读写的
2. 文件打开
open函数打开文件
file1 =
open(文件路径)
open参数详解
第一个参数参数路径第二个参数打开方式(r(只读),w(只写),rb(二进制读),a(追加写入),wb(二进制写))返回值是一个文件对象
3. 文件读取三种方式
read函数
file1.
read()
read函数参数详解
第一个参数读取的字符个数,不写默认全文件读取
read函数例子
文件内容:I Love You!
str1 = file1.
read(
5)
print(str1)
I Love
readlines函数
fileList =
file1.readlines()
readlines函数参数详解
返回值是一个列表,列表元素是每一行的数据
readlines函数例子
文件内容:
I Love You!
I Love You!
I Love You!
I Love You!
fileList = file1.readlines()
print(fileList)
打印:
[
"I Love You!",
"I Love You!",
"I Love You!",
"I Love You!"]
readline函数
mystr =
myfile.readline()
readline函数
返回值为读取到的一行数据数据为字符串格式读取不到返回None
readline函数例子
文件内容:
I Love You!
I Love You!
I Love You!
I Love You!
mystr = myfile.readline()
"I Love You!"
4. 文件写入(w:覆盖写入,a:追加写入)
write函数
file.
write(
"123")
write函数参数
第一个参数为要写入的字符串
5. 文件关闭
file1.
close()
close函数介绍
close之后才会将数据写入文件
6. 缓冲区
因为磁盘读写次数是有限的,为了保持磁盘的寿命,所以有了缓冲区的概念
file1.flush函数
file1
.flush() 数据刷新到文件中
flush函数介绍
数据实时刷新
7. file的函数
文件的方法描述
f.close()关闭文件(要不然会内存泄漏)f.read(size=-1)从文件中读取size个字符,当未给定参数或者给定参数为负数的时候,读取所有的字符并返回f.readline()读取一行数据,返回值是读取到的一行数据f.readlines()读取整个文件所有数据f.write(str)将字符串str写入文件f.writelines(seq)向文件中写入字符串序列seq,seq应该是一个返回字符串f.seek(offset, from)在文件中移动文件指针,从from开始偏移offset个字节f.tell()返回当前在文件中的位置
8. 字符串查找的详情
find 函数
post = "hello".find("llo")
find 函数详解
如果找不到指定字符串就返回-1
find 函数例子
post =
"hello".find(
"llo")
print(
post)
2
split 函数
myList = "".split(",")
split 函数详解
第一个参数为要按照分割的字符返回值是一个列表
split 函数例子
myList =
"123,456,789".
split(
",")
print(myList)
[
"123",
"456",
"789"]
window cmd 数据预览指令
1. type 文件名(查看全部数据)
2. more 文件名(查看文件按百分比)
数据清洗
数据清洗就是将非法数据和数据格式不对的进行剔除好的数据和坏的数据都需要进行保存中间数据会特别多