python - csv 文件读取、处理、写入
前言
python csv数据读取-转换-保存: 参考:https://blog..net/bryanwang_3099/article/details/119731390
https://www.jb51.net/article/217415.htm 这个较为详细 许多小操作都有详尽记载
一、csv文件
CSV是一种以逗号分隔数值的文件类型,在数据库或电子表格中,常见的导入导出文件格式就是CSV格式,CSV格式存储数据通常以纯文本的方式存数数据表。 csv 库中有4个常用的对象:
csv.reader:以列表的形式返回读取的数据。 csv.writer:以列表的形式写入数据。 csv.DictReader:以字典的形式返回读取的数据。 csv.DictWriter:以字典的形式写入数据。
csv形状如下所示:上面为表头 下面为数据
二、两种python 读取csv方式
1.csv库
代码如下(示例):
import csv csv_reader = csv.reader(open("data.csv")) for row in csv_reader: print(row)
注意 这里读取的为每一行
2.pandas
代码如下(示例):
import pandas as pd df = pd.read_csv("data.csv",encoding="utf-8") print(df)
该处df为结构体 DataFrame(x,y)。 如 data.csv 文件中 有多个表头,多列。 写入的时候提取出的 DataFrame 需要转为列表 两者是可以相互转换的 如 tolist()等是十分好用的。
import pandas as pd df = pd.read_csv("data.csv",encoding="utf-8") df_array = np.array(df)#将pandas读取的数据转化为array df_list = data_array.tolist()#将数组转化为list
三、读取csv文件某列、某行
1.读取某几列
import pandas as pd path = data.csv data = pd.read_csv(path) #data为结构体 #读取某两列 x = data[[top, left]] print(x) #读取某一列 y = data[[top]] print(y)
实际上如果只读取一列数据 可以通过 data[i] 来读取
2.读取某行
import csv csv_reader = csv.reader(open("data.csv")) i= 0 for row in csv_reader: if i % 2 == 0: print(row)
读取某几行 如第一行 第二行和第四行的所有数据
import pandas as pd path = data.csv data = pd.read_csv(path) print(data.ix[[0,1,3],:])
四、csv写入方式
# 1. 创建文件对象(指定文件名,模式,编码方式)a模式 为 下次写入在这次的下一行 with open("file.csv", "a", encoding="utf-8", newline="") as f: # 2. 基于文件对象构建 csv写入对象 csv_writer = csv.writer(f) # 3. 构建列表头 name=[top,left] csv_writer.writerow(name) # 4. 写入csv文件内容 z = [ [0, 31], [1, 30], [2, 32] ] csv_writer.writerow(z) print("写入数据成功") # 5. 关闭文件 f.close()
关于写入,需要注意: 当然可以以便读取文件,一边写入。
在打开文件时,需要添加newline = “”。否则,会在每2行有效内容之间添加一行空白。 如果要保存的内容有中文,而且之后需要用Excel打开文件,那么需要选用utf-8-sig编码。如果使用utf-8编码,会导致使用Excel查看文件时中文乱码。
总结
数据会有很多问题,主要是要看数据类型,调试的时候看清楚