首页 > 代码库 > Stanford Corenlp学习笔记——词性标注
Stanford Corenlp学习笔记——词性标注
使用Stanford Corenlp对中文进行词性标注
语言为Scala,使用的jar的版本是3.6.0,而且是手动添加jar包,使用sbt添加其他版本的时候出现了各种各样的问题
添加的jar包有5个
代码
import edu.stanford.nlp.pipeline.{Annotation, StanfordCoreNLP} /** * Created by common on 17-5-13. */ object NLPLearning { def main(args: Array[String]): Unit = { val props="StanfordCoreNLP-chinese.properties" val pipeline = new StanfordCoreNLP(props) val annotation = new Annotation("这家酒店很好,我很喜欢。") pipeline.annotate(annotation) pipeline.prettyPrint(annotation, System.out) } }
词性标记
动词,形容词(4):VA,VC,VE,VV
名词(3):NR,NT,NN
定位(1):LC
代词(1):PN
限定词和数词(3):DT,CD,OD
度量词(1):M
副词(1):AD
介词(1):P
连词(2):CC,CS
助词(8):DEC,DEG,DER,DEV,SP,AS,ETC,SP,MSP
其他(8):IJ,ON,PU,JJ,FW,LB,SB,BA
Stanford Corenlp学习笔记——词性标注
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。