词向量

mac2022-06-30  82

词向量维度可以128或者300维

现在百度用的是300维的,比较好。

如果你有十万个词,然后300维向量,那么就是[100000,300],这里神经网络更新的是词向量。

有些词出现的次数比较多,有些词出现的比较少。当我们进行训练的时候,可以先进行筛选。比如前5万的正常构造,后边的设为unknow

 

转载于:https://www.cnblogs.com/shixisheng/p/9498321.html

最新回复(0)