关于Pandas的文件导入输出
一、pandas是什么?
是一个开源的,BSD许可的库,为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。
二、Panda IO工具
Pandas I / O API是一组顶级reader函数访问,如pandas.read_csv(),通常返回一个pandas对象。相应的writer函数是对象方法,其访问方式类似于 DataFrame.to_csv()。
1.常用Reader和Writer函数
我们经常用到的Reader和Writer函数如下表所示
2.read_csv常用相关参数
- header:指定行数用来作为列名,数据开始的行数。如果文件中没有列名,则默认为0。若header=0,表示数据第一行作为标题行。当header=None时,表示数据没有列索引,需要自己给定索引名,或者函数会自己加上自动加上列索引。
- names和index_col:可以实现自己定义行索引的列名(index_col)和结果的列索引(names),names参数一般为列表形式.
- usecols: 函数将读取usecols指定列,得注意一下索引从0开始。
使用示例如下所示:
import pandas as pd names = [B, A, R, I, O] df = pd.read_csv(text.py, header = None, names = names,usecols = [0, 1, 2, 3, 4, 5])
以上的路径为相对路径,python文件应与text.py于统一目录下才可以读取成功。 以上只是列举了比较常用的几个参数,还有许多许多参数,需要的话可以参考
通过reader函数得到的数据即为pandas特有的数据类型Series、DataFrame。另外,在使用writer函数时也有类似的参数(一般只需要文件路径filepath_or_buffer参数即可),此时也需要使用该类型的数据格式。
总结
上一篇:
IDEA上Java项目控制台中文乱码