首页 > 代码库 > shell脚本
shell脚本
之前还是处理好评论的差评和好评的分析,之后进行如下操作:
Linux版本:
cd Downloads/yihaodian
cd trunk 进入trunk目录就可以进行训练了
训练的命令: sh train.sh ../seg_good.data good.data 你的模型文件的名字
训练完事,就可以进行测试了:./distance good.data
这是后控制台出现 enter word or sentence:
你输入: 很好
会出现一系列和很好相关的词和相应的cosine distance
接下来:
现在有每个词的表示了,就是每个词的向量,每个词可以表示为一个向量,这样两个词可以根据cosine计算相似度了。从而,对词,可以进行相似聚类。
你就知道好评里面的词有哪些类别了。假如说,你聚类得到,质量,物流,客服,效果四个类别,每个类别有一个聚类中心,就是k-means的中心。
新来一个评论,你先分词,分词的结果是,四个词,有三个是和物流的中心很近,那么就是物流的分类。
shell脚本
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。