shell脚本

2024-08-03 13:51:26 230人阅读

之前还是处理好评论的差评和好评的分析，之后进行如下操作：

Linux版本：

cd Downloads/yihaodian

cd trunk 进入trunk目录就可以进行训练了

训练的命令： sh train.sh ../seg_good.data good.data 你的模型文件的名字

训练完事，就可以进行测试了：./distance good.data

这是后控制台出现 enter word or sentence:

你输入：很好

会出现一系列和很好相关的词和相应的cosine distance

接下来：

现在有每个词的表示了，就是每个词的向量，每个词可以表示为一个向量，这样两个词可以根据cosine计算相似度了。从而，对词，可以进行相似聚类。

你就知道好评里面的词有哪些类别了。假如说，你聚类得到，质量，物流，客服，效果四个类别，每个类别有一个聚类中心，就是k-means的中心。

新来一个评论，你先分词，分词的结果是，四个词，有三个是和物流的中心很近，那么就是物流的分类。

shell脚本

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们