李宏毅ml--why deep

mac2022-06-30 43

参数越多，对于宽的network的表现是不太好的，对于越深的network是可以提高错误率的。这是为什么？

模组化 modularization

假如我们在做影像辨识的任务，我们需要辨识四种目标，对每一种目标都训练一个分类器，但是由于长头发男生的训练样本很少，所以训练出来的分类器是很weak的可以用模组化的概念，假定我们现在不是去直接解那个问题，而是把问题分成一小类问题，比如我们可以训练一些分类器去找一些attributes.这些基本的分类器都会有充足的数据来训练。后面的分类器可以利用基本的分类器来判断，需要的data很少，因为任务简单，复杂都被基本分类器做了。模组化和深度学习的关系，每一个神经元都是一个基本的分类器，第一层神经元是最基本的神经元，第二层把第一层当作module，依次类推。很神奇的一件事是模组化这件事是网络自动从数据中学习到的。模组化的好处是让我们的模型变简单了，把一个问题分解成很多的小问题，就算我们训练数据没有那么多时，我们也可以把task做好的。其实这一点是和我们认知相违背的，我们以为是很多数 big data才导致deep Learing 生效的，假设现在我们在做影像分类的问题，我们有很大的data,其包含全世界的img,test集上所有的图片都在我的database里面，何必去做机器学习。当我们训练数据不够的情况下，才去需要做机器学习，让机器可以举一反三。下面部分都是李宏毅老师为了讲解模块化的定义，以及使用DNN是为了在有限的训练数据的情况下得到较好的结果，只大概听了一下。没有细听所以对于讲解部分很少。

语音识别中模块化的应用

语音辨识是一件非常复杂的事情，第一步是一个分类问题，把acoustic feature分类成不同的state

output是feature属于每个state的机率，相比于传统方法，每个音素都单独被model,而使用DNN则是所有state共用一个DNN.

最新回复(0)