文本分类——机器学习常用工具

首页 > 代码库 > 文本分类——机器学习常用工具

文本分类——机器学习常用工具

2024-07-18 05:21:00 220人阅读

文本分类现已比较成熟，各类开源工具不少，现推荐几个比较常用简单的工具：1、scikit-learn：http://scikit-learn.org/stable/index.html python编写调用，里面有各种分类算法svm、随机森林、贝叶斯等，和特征提取，如字、ngram等，几行代码便可以构建一个分类任务。2、WEKA：http://www.cs.waikato.ac.nz/ml/index.html 具有图形界面，但是感觉速度有点慢3、libsvm ：http://www.csie.ntu.edu.tw/~cjlin/libsvm/ 仅提供svm的核心算法，不具备特征提取，需自行编写，相对较为灵活分词工具：1、计算所的分词工具：http://ictclas.org/ 该分词工具，计算所暂时没有维护2、哈工大的分词工具在计算所的基础上又增加了训练数据，相对来说，分词效果优于计算所的3、ansjsun：http://www.nlpcn.org/demo# 继承于计算所的分词工具，效果和调用方式等都较为简单。

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 文本分类——机器学习常用工具

文本分类——机器学习常用工具

看完仍有疑问？有类似问题直接问程序猿