首页 > 代码库 > 百度工作总结

百度工作总结

1,项目方面

1)数据准入,geocoding项目

完成文本地址和空间地址的映射

预处理:父子集成时候的,同次判断,错别字判断,习惯用户判断,字符串相似性。编辑距离

2)phoneNormal项目

完成电话格式规范和电话区号升级功能。

包括四类:固定电话,企业电话,特殊号码,移动号码

2,业务方面

整个数据端的宏观了解:

功能:数据(uid——bid);数据间的映射(uidmap,bidmap)

环节:准入、关联、整合+外部存储(同步redis,一部mysql);最上游来源:新数据,离线数据,策略数据

 

3,技能方面

1)superTest自动化测试工具:

一个模块级的测试框架,基于ruby

Supertest的产品线lib库下主要有 pipes,actions,patterns,case这几个目录。

最核心的是pipes,然后是actions动作部分,接下来是patterns,最高层是case。

它们之间的关系类似于函数的封装概念,pipes为较底层的数据封装操作,做了一些数据的编解码工作;actions可以规定一些基本的较通用的函数单元操作,如创建驱动和桩,创建索引,拷贝数据,修改配置文件或者配置项等;patterns是对一组case中通用模式的抽象;case中则为具体的测试逻辑。

什么是pipe?

同一个Pipe既可以充当下游桩,也可以充当上游桩。

对于模块A,Pipe可以模拟模块B返回的数据,既是下游桩。

对于模块B,Pipe可以模拟模块A发送的数据,既是上游桩.

无论怎样,它的作用就是接入一根管道,将上游模块发出的数据取到,然后解码,做逻辑处理或者验证,然后将制定的数据再编码成需要的格式,发送给下一个模块

 

2)常见的shell命令。性能相关;进程的启动,查看和杀死;awk和sed等

 

4,建立资料汇总wiki,完善文档,为后人奠定基础

1)小到测试机如何登录,权限如何申请

2)大到shell,superTest,ruby等的资料讲解

我走了,留下了当初的积累和思考