暑假博客——ML第一天

xiaoxiao2021-02-28  81

ML的入门总结

ML的入门总结 1什么是ML ML的两种定义 2两种基本的ML类型 Supervised learning监督学习 Regression Learning回归Classification Learning分类 Unsupervised Learning非监督学习 3Cost Function代价函数这个翻译的不形象

1-什么是ML:

ML的两种定义:

“在没有精确编程的情况下,让机器自动学习。”

the field of study that gives computers the ability to learn without being explicitly programmed.——–Arthur Samuel

更加现代的定义:“以E为学习经验,以T为目标任务,以P为学习效果的检验方式。在以T为任务下,经由P的测试下,在E的促进下进步”(翻译很困难)

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E. ——Tom Mitchell

2-两种基本的ML类型:

Supervised learning–监督学习

重点是,监督学习中,给定了学习数据的答案,要求学习后能给出按照要求的答案类型(有多少,是否是…)。通过数据和答案学习。在Andrew Ng 的例子中,主要是从点阵中,得出自变量和因变量的(函数)关系。

监督学习分两类:

Regression Learning–回归:

求量:通过数据得出相关变量的连续的关系,相关变量的图像是一条连续的线。通常,通过将给定的已知数据预测出“有多少”,“多大”,“多长”等明确数据的结果。

Classification Learning–分类:

判断:通过数据得出相关变量的非连续的关系,从给定的数据判断出想要的结果。通常将通过给定的已知数据判断出结果“是否是”,“是哪类”。 E.G.:

已知部分房子的面积及房价。预测出给定的已知其面积的房子的房价。-回归已知部分肿瘤的大小及其性状(良性、恶性)。预测出新的已给定大小的肿瘤的性状(是否是恶性肿瘤)。-分类

Unsupervised Learning–非监督学习。

非监督学习并未给出数据的相关答案。它重点是让机器自动分类。

从商场获得的顾客数据将顾客分类。分析DNA芯片的数据,将基因分类 。学习各大网页,将新闻分类。

3-Cost Function–代价函数(这个翻译的不形象)

在最简单的Supervised Learning中,我们有一个变量,要得出一个结果。建立的函数是一元一次的。

hθ(x(i))=θ0+θ1x 简写为: h(x(i))=θ0+θ1x 我们不知道在  θ0  θ1 取何值时,函数最接近给定的数据。于是用代价函数: J(θ0,θ1)=12mi=1m(h(x(i)y(i))2 来确定函数是否是最佳的猜测函数(hypothesis function)。在  θ0,θ1 取某一值时,这个方差最小(我不明白为什么要除2,说是便于梯度计算什么的)。那么这时,所求的函数就是 minθ1,θ212mi=1m(h(x(i)y(i))2 Cost Function 是用于确定某函数的最好的参数的。这有利于ML的学习过程。

转载请注明原文地址: https://www.6miu.com/read-59950.html

最新回复(0)