视频地址:https://www.youtube.com/watch?v=mbyG85GZ0PI
Lecture 1 The Learning Problem 示例学习的组成部分一个简单的学习算法感知机PLA学习的分类Puzzle预测用户对电影的评分
机器学习的本质:
存在pattern不能用数学方法完成(所以需要学习)拥有数据比喻:银行借贷的信用评价
申请人信息:
年龄性别年薪定居时间债务…23岁男$300001年$15000…公式化:
输入: x (客户信息) 输出: y (客户好/坏)目标函数: f:X→Y (理想的信用评估公式) 所有机器学习问题里,目标函数是未知的数据: (x1,y1),(x2,y2),...,(xN,yN) (历史数据)
↓↓↓
假设: g:X→Y (将使用的公式)解决部分:
假设集合 H={h}g∈H
学习算法
二者在一起成为了算法模型
对于输入 x=(x1,...,xd) (用户的属性)
若∑i=1dwixi>threshold,则信用通过
若∑i=1dwixi<threshold,则信用不通过
线性公式 h∈H 可写为:
h(x)=sign((∑i=1dwixi)−threshold)改写为:
h(x)=sign((∑i=1dwixi)+w0) 引入 x0=1 : h(x)=sign(∑i=0dwixi) 向量形式: h(x)=sign(wTx)对于一个误分类点,即 sign(wTxn)≠yn ,更新权重 w←w+ynxn
学习的基本前提:
using a set of observations to uncover an underlying process
监督学习(input,correct output)非监督学习(input,?)强化学习(input, some output,grade for this output)