95、自然语言处理svd词向量

首页 > 代码库 > 95、自然语言处理svd词向量

95、自然语言处理svd词向量

2024-11-26 01:16:38 203人阅读

import numpy as np
import matplotlib.pyplot as plt
la = np.linalg
words = ["I","like","enjoy","deep","learning","NLP","flying","."]
X = np.array([[0,2,1,0,0,0,0,0],
              [2,0,0,1,0,1,0,0],
              [1,0,0,0,0,0,1,0],
              [0,1,0,0,1,0,0,0],
              [0,0,0,1,0,0,0,1],
              [0,1,0,0,0,0,0,1],
              [0,0,1,0,0,0,0,1],
              [0,0,0,0,1,1,1,0]])
U,s,Vh=la.svd(X, full_matrices=False)
for i in range(len(words)):
    print(U[i,1],U[i,1],words[i])
    plt.text(U[i,0],U[i,1],words[i])
plt.xlim(-1,1)
plt.ylim(-1,1)
plt.show()

技术分享

这是根据斯坦福cs224d课程写出来的，

这是课程里边最开始所讲的词向量，

1、首先将所有的词组织成一个词典

2、对于词典中的每一个词，

扫描词典中的其他词，

对于扫描到的每一个词，

统计原始词在被扫描到的词的前边或者后边出现的次数，

这样就构成了一个由词频所构成的对角阵

3、对该对角阵进行SVD分解得到

技术分享

得到的U矩阵便是经过降维后的词向量矩阵

将每个词的词向量前两个值画在图中

便得到了如最上面图所示的

词关系图

Thanks

WeiZhen

95、自然语言处理svd词向量

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 95、自然语言处理svd词向量

95、自然语言处理svd词向量

看完仍有疑问？有类似问题直接问程序猿