首页 > 代码库 > 百度技术沙龙-自然语言处理技术及应用笔记整理

百度技术沙龙-自然语言处理技术及应用笔记整理

第一场由百度这方面的大拿吴华分享:

NLP技术支持大多数百度产品

搜索引擎从关键词到语义理解搜索

应用未来趋势:1、知识语义搜索;2、对话式搜索;3、主动推荐,不搜即得;4、精准个性化服务.

NLP的挑战:需求识别、知识挖掘、用户引导、结果组织和展现.

理解文本的目标是理解用户、用户建模、用户行为预测

百度翻译免费API

实体名词挖掘:分类、需求、ontology建设

query理解。

DNN用于软聚类

Parser技术用于复杂query理解。

基于shift-reduce的依存决策分析算法--多层的逻辑推理.

语用分析用于智能交互

用户模型维度:LBS、兴趣、SNS、消费(其它见演讲PPT_p42)

个体用户、群体用户、全体用户。

人、内容、场景的综合:NLP是互联网金矿的炼金术。

------------------------------------------------------

NLP落地互联网由李志飞分享:

机器翻译的实现:

1、词对齐;2、语义抽取;3、Decoding a test sentence ;4、Transition Ambiguity;5、language model

HyperGraph:超图,更通用的结构,引入统计概念成为权重超图

创业公司工具化、自动化水平很高

好的框架和工具倍增生产力

团队基因:科学家工程师,实用至上,基础技术架构

创业公司的捷径:开源软件。

 
 

百度技术沙龙-自然语言处理技术及应用笔记整理