数据的概念及处理 中国大学mooc

数据的格式化以及处理

一维数据的概念:

由对等关系的有序或无序数据构成,采用线性方式组织。

二维数据的概念:

由多个一维数据构成,是一维数据的组合形式。

表示形式如表格。

多维数据的概念:

由一维数据或二维数据在新的维度上扩展形成。

高维数据的概念:

仅利用最基本的二元关系展示数据间的复杂结构。

如键值对之间的复杂逻辑关系表示方式。

数据的操作周期:

存储----------+表示-----------+操作

一维数据的表示:

有序:采用列表类型来表示[]

无序:采用集合类型来表示{}

上面的两种结构都可以采用for循环遍历整个结构中的数据类型

一维数据的存储:

方式一:空格分隔(使用一个或者多个空格进行分隔存储,不换行。)

缺点是数据中不能存在空格。

方式二:逗号分隔(英文逗号分隔,不换行)

缺点是数据中不能存在英文逗号。

其他方式:(特殊符号分隔)

缺点是数据中不能出现相同的符号。

一维数据的处理:

1、从空格分隔的文件中读入数据

txt = open(fname).read()

ls = txt.split()

f.close()

完成数据的读入

2、特殊符号的文件中读入数据

txt = open(fname).read()

ls = txt.split(“特殊符号”)

f.close()

完成数据的读入

上述为将数据表示为列表


采用空格分隔的方法将一维数据写入文件

ls = [‘中国’‘美国’‘日本’]

f = open(fname, ‘w’)

f.write(’’.join(ls)) #注意join函数的用法,可以复习字符串那一节。

f.close()

完成操作。

特殊符号也是大同小异:

ls = [‘中国’‘美国’‘日本’]

f = open(fname, ‘w’)

f.write(‘特殊符号’.join(ls)) #注意join函数的用法,可以复习字符串那一节。

f.close()

完成操作。

二维数据的表示:

统一使用二维列表表示

CSV格式:用逗号来分隔值的一种表示方式

表示格式要求:

···如果某个元素缺失,逗号仍要保留

···二维数据的表头可以作为数据存储,也可以另行存储

···逗号为英文半角逗号,逗号与数据之间无额外空格

···一般的存储格式是先行后列


从csv格式的文件中读入数据

fo = open(fname)

ls = []

for line in fo:

line = line.replace(" ","")

ls.append(line.split(","))

fo.close()


将列表中的数据写入CSV格式的文件中

ls = [[],[],[]] #二维列表格式的数据

f = open(fname,“w”)

for item in ls:

f.write(’,’.join(item)+’ ’)

f.close()


遍历二维数据

ls = [[1,2],[3,4],[5,6]] #二维列表格式的数据

for raw in ls:

for column in raw:

print(column)


split()方法应当根据需求进行操作(看具体的实例)

经验分享 程序员 微信小程序 职场和发展