李宏毅ml--why deep

mac2022-06-30  26

参数越多,对于宽的network的表现是不太好的,对于越深的network是可以提高错误率的。这是为什么?

模组化 modularization

假如我们在做影像辨识的任务 ,我们需要辨识四种目标,对每一种目标都训练一个分类器,但是由于长头发男生的训练样本很少,所以训练出来的分类器是很weak的 可以用模组化的概念,假定我们现在不是去直接解那个问题,而是把问题分成一小类问题,比如我们可以训练一些分类器去找一些attributes.这些基本的分类器都会有充足的数据来训练。 后面的分类器可以利用基本的分类器来判断,需要的data很少,因为任务简单,复杂都被基本分类器做了。 模组化和深度学习的关系,每一个神经元都是一个基本的分类器,第一层神经元是最基本的神经元,第二层把第一层当作module,依次类推。很神奇的一件事是模组化这件事是网络自动从数据中学习到的。 模组化的好处是让我们的模型变简单了,把一个问题分解成很多的小问题,就算我们训练数据没有那么多时,我们也可以把task做好的。其实这一点是和我们认知相违背的,我们以为是很多数 big data才导致deep Learing 生效的,假设现在我们在做影像分类的问题,我们有很大的data,其包含全世界的img,test集上所有的图片都在我的database里面,何必去做机器学习。当我们训练数据不够的情况下,才去需要做机器学习,让机器可以举一反三。 下面部分都是李宏毅老师为了讲解模块化的定义,以及使用DNN是为了在有限的训练数据的情况下得到较好的结果,只大概听了一下。没有细听所以对于讲解部分很少。

语音识别中模块化的应用

语音辨识是一件非常复杂的事情,第一步是一个分类问题,把acoustic feature分类成不同的state

output是feature属于每个state的机率,相比于传统方法,每个音素都单独被model,而使用DNN则是所有state共用一个DNN.

最新回复(0)