最常见的
function set
利用并行计算(上图),GPU加速,要矩阵运算,CALL GPU来做矩阵运算
output layer 之前的看做feature engineering 这组feature是经过很复杂的变换过来的
output layer 看做multi-class classifier
对应到每一个数字的概率
deep learing并不是比其他模型优越多少,问题在于,做其他模型的时候,我们不需要去想这个结构,重点在feature extraction;而在做deep learning的时候,
虽然我们不需要再去想如何做feature extraction,但我们要去想如何设计neural network structure.所以说这可以看成是一个问题的转移而已。
看哪个容易选哪个?
用于语音、图像识别,文字来说, dl相对好些。 因为特征对人而言太过抽象。
算微分,用toolkit