首页 > 代码库 > Efficient Vector Representation for Documents through Corruption-by Minmin Chen阅读

Efficient Vector Representation for Documents through Corruption-by Minmin Chen阅读

关键词: 词向量、文档向量、文档表示

 地址:https://openreview.net/forum?id=B1Igu2ogg&noteId=B1Igu2ogg

首先,论文解决的是Word2Vec,Paragraph Vectors一样的,文档表示形式的问题。如何来表示一个文档,从而进行相关的文档分类,语义理解,感情分析。。。

然后,和其他方法不同的是,这里直接用文档中所有的词向量的平均来代表文档的向量表达,还有用到了随机的替换文档中的词语,这个不理解意义在哪?没有读懂。

最后给出了好多实验,效果比已有的算法比如Word2Veec都要好。

Efficient Vector Representation for Documents through Corruption-by Minmin Chen阅读