首页 > 代码库 > 自然语言理解——introduction

自然语言理解——introduction

1.基本概念:

NLP:自然语言处理是研究如何利用计算机技术对语言文本(句子、篇章或话语等)进行处理和加工的一门学科,研究内容包括对词法、句法、语义和语用等信息的识别、分类、提取、转换和生成等各种处理方法和实现技术。

语言的基本属性:语音和文字

2.研究内容:

image

3.基本问题:

a)形态学(morphology)问题:研究词(word) 由有意义的基本单位-词素(morphemes)的构成问题。单词的识别/ 汉语的分词问题。词素:词根、前缀、后缀、词尾。

image

b)语法学(syntax)问题:研究句子结构成分之间的相互关系和组成句子序列的规则 。为什么一句话可以这么说也可以那么说?如何建立快速有效的句子结构分析方法?

image

c)语义学(semantics)问题:研究如何从一个语句中词的意义,以及这些词在该语句中句法结构中的作用来推导出该语句的意义。

image

d)语用学(pragmatics)问题:研究在不同上下文中语句的应用,以及上下文对语句理解所产生的影响。从狭隘的语言学观点看,语用学处理的是语言结构中有形式体现的那些语境。相反,语用学最宽泛的定义是研究语义学未能涵盖的那些意义。

image

e)语音学(phonetics)问题:研究语音特性、语音描述、分类及转写方法等。

4.主要困难:

a)大量歧义

image

imageimage

image

image

imageimage

image

b)大量新词和未知语言:

imageimage

5.研究方法:

imageimage

image

imageimage

image

image

image

6.研究现状:

imageimage