首页 > 代码库 > 代码19
代码19
这是text_tech1文件的样子:
这是调用corenlp的命令行:
java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLP\
-props StanfordCoreNLP-chinese.properties -file file.log -outputFormat text
-file后接的要处理的文件
-outputFormat text中的text只是一种格式
为了在更细的粒度下利用corenlp进行相关操作,将每一行用逗号结尾,句号结尾的也是一行。
但直接调用corenlp命令行进行文件操作时,却发现corenlp不是以文件一行一行进行处理,而是以一个句号或者问号进行处理。解决方法是:将每一个逗号写进文件,每次让corenlp处理只含一个逗号的文件。当然需要每次调用命令行。
#!/bin/sh touch file.out for line in $(cat text_tech1) do touch file.log echo $line > file.log java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLP -props StanfordCoreNLP-chinese.properties -file file.log -outputFormat text cat file.log.out >> file.out rm file.log done
可以学习:对终端多次输入命令行
代码19
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。