首页 > 代码库 > 斯坦福NLP笔记48 —— Using Patterns to Extract Relations

斯坦福NLP笔记48 —— Using Patterns to Extract Relations

上一节最后讲到了建立一个extractor的方法,手工建立和机器学习等,这一节详细阐述手工建立pattern的方法。引用Jurafsky教授常说的话:

let‘s look at the intuition.


Jurafsky教授讲话总是微皱着眉头,感觉很较真的样子,十分可爱。

人工模式的概念很简单,譬如这样一句话:和毓婷一样,新斯诺滴丸是一种避孕药。

假如你年纪还小不知道什么是新斯诺滴丸,那你看到“XXX是一种XXX”这样一个模式以后,你也会知道新斯诺滴丸就是一种避孕药。“和XXX一样也是一种模式”,譬如你就知道了新斯诺滴丸和毓婷属于同一种东西。


手工模式的优缺点(Plus and Minus)

优点:

准确率高、能够定制某些特点的行业

缺点:

召回率低、麻烦、想这些模式要想破脑袋


以前做车牌识别最后匹配字模的时候就用到了手工模式,精准是精准,确实很麻烦,而且不具通用性。