Machine Learning(机械学习)
前言
最后,如果内容有什么错误的理解,希望大家不吝赐教,指正,谢谢!
【机器学习系列】【第二章:】
第一章 介绍
1.1 定义与理解
Tom Mitchell provides a more modern definition: "A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."
我的理解:Machine learning就是让一个机器学会像人一样有思考学习的能力,先通过观察人的行为获得experience,再进行和人一样的行为,给他一些task,并学会思考下一步该怎么做,这个过程就是machine learning。通俗的来讲,例如让机器人学会下象棋,人如何下象棋的过程是experience E,让机器人学会下象棋是task T,让机器人做出下一步怎样来赢对手就是performance P。
1.2 Machine learning的分类
Machine learning大体分为两种:supervised learning和unsupervised learning。supervised learning(监管学习)就是一组人工标记的数据推测出假设函数的学习方法输入和输出之间是有一种函数关系的,我们给个输入,输出的结果是我们已经知道的正确范围内的,就是可以预测结果的。supervised learning又分为regression(回归)和classification(分类)。Unspervised learning(无监管机器学习)用的 Training data(训练数据) 没有标签。系统会试着自学。
- 2.1 Regression(回归)
用来预测目标值,输出的结果不是只有两种的,是一个连续的问题。(在后续的内容中会有详细的分析)
Attribute(属性) 是一种数据类型,比如汽车的里程。Feature 根据语境有几种意思,一般它表示的就是:属性 + 值,比如 里程:15,000,有时候这两个名词也会交替使用。
图1 regression
- 2.2 Classification(分类)
预测的结果只有两种,是一个离散的问题,例如邮件垃圾过滤器得到一个邮件,会知道它的类别属于正常邮件还是垃圾邮件。或者对一个肿瘤分析是良性还是恶性,结果都是两种,可以简单地用0和1来表示。
图2 classification
- 2.3 Unsupervised learning(无监管机器学习)
没有给任何的特征,进行学习。(关于这个后面还会进行详细分析)
图3 unsupervised learning