机器学习错误2 将DataFrame完整导出成csv文件
生成DataFrame
在写代码时,我们会用到DataFrame来更直观的观察代码
当然在此之前,需要在第一行import所需要的各种包 生成数据后,用pd.DataFrame()但是这个表是简略版的,如果需要完整查看,就需要导出成CSV文件
导出代码
outputpath=C:/Users/DANNY/Desktop/DataFrame导出.csv result_df.to_csv(outputpath,sep=,,index=False,header=True)
其中1处是导出的位置,需要注意的是复制过来的是要改成/ 比如:C:UsersDANNYDesktop ----> C:/Users/DANNY/Desktop/
其中2处是导出文件的名称,可以自己取,我这里是叫DataFrame导出
其他outputpath = .csv是不变的 第二行
result_df.to_csv(outputpath,sep=,,index=False,header=True)
只需要改变False和True即可,需要index就把index=False 改成 index=True
导出结果
机器学习8
全文代码
import pandas as pd import numpy as np from sklearn.cluster import KMeans from sklearn.cluster import DBSCAN from matplotlib import pyplot as plt ### KMeans算法 #### 准备数据集 data = pd.read_csv(销售利润表.csv) data data.shape data.info() data.head() data.describe() data.drop(columns="Unnamed: 0",inplace=True) #删除未命名那列 data.head() #### 构建KMeans模型 KMeans? km = KMeans(n_clusters=8,max_iter=300,tol=0.01) #写km = KMeans()也可以,因为是默认值 #### 训练模型 km.fit(data) #### 查看属性 #质心 km.cluster_centers_ #属于哪个簇 km.labels_ #误差平方和 km.inertia_ #### 最优模型(调参) result = [] for n_clusters in range(2,10): for max_iter in range(300,601,50): #最大迭代次数 for tol in range(2,10): tol=tol*1e-5 km = KMeans(n_clusters=n_clusters,max_iter==max_iter,tol=tol) km.fit(data) d={ n_clusters:n_clusters,max_iter:max_iter,tol:tol,inertia:km.inertia_} result.append(d) result = [] for n_clusters in range(2,10): for max_iter in range(300,601,50): #最大迭代次数 for tol in range(2,10): tol=tol*1e-5 km = KMeans(n_clusters=n_clusters,max_iter=max_iter,tol=tol) km.fit(data) d={ n_clusters:n_clusters,max_iter:max_iter,tol:tol,inertia:km.inertia_} result.append(d) # 一个模型的参数放在字典d里面,用result.append(d)把所有模型的参数存起来到result列表 result result_df = pd.DataFrame(result) #主要DataFrame的DF都大写 result_df outputpath=C:/Users/DANNY/Desktop/DataFrame导出.csv result_df.to_csv(outputpath,sep=,,index=False,header=True)
上一篇:
通过多线程提高代码的执行效率例子
下一篇:
echarts如何引入市级地图