首页 > 代码库 > 汉语树库

汉语树库

汉语树库
本文旨在介绍CoNLL格式的中文依存语料库(汉语依存树库)、CoNLL格式相关工具,以及提供两个公开的中文依存语料库下载。最近做完了分词、词性标注、命名实体识别、关键词提取、自动摘要、拼音、简繁转换、文本推荐,感觉HanLP初具雏形。现在希望拿下依存句法分析,这样我就做出了史上第一个(?)民间句法分析库了(至少是空白学术背景下功能最全面的自然语言处理基础工具库)。树库的类型谈到依存语料库,还是少不了介绍一下树库的类型。根据所描述结构的不同 ,  树库大体上可以分为两类 :  短语结构树库...

继续阅读:码农场 » 汉语树库

原文链接:http://www.hankcs.com/nlp/corpus/chinese-treebank.html

汉语树库