首页 > 代码库 > 百度工作总结
百度工作总结
1,项目方面
1)数据准入,geocoding项目
完成文本地址和空间地址的映射
预处理:父子集成时候的,同次判断,错别字判断,习惯用户判断,字符串相似性。编辑距离
2)phoneNormal项目
完成电话格式规范和电话区号升级功能。
包括四类:固定电话,企业电话,特殊号码,移动号码
2,业务方面
整个数据端的宏观了解:
功能:数据(uid——bid);数据间的映射(uidmap,bidmap)
环节:准入、关联、整合+外部存储(同步redis,一部mysql);最上游来源:新数据,离线数据,策略数据
3,技能方面
1)superTest自动化测试工具:
一个模块级的测试框架,基于ruby
Supertest的产品线lib库下主要有 pipes,actions,patterns,case这几个目录。
最核心的是pipes,然后是actions动作部分,接下来是patterns,最高层是case。
它们之间的关系类似于函数的封装概念,pipes为较底层的数据封装操作,做了一些数据的编解码工作;actions可以规定一些基本的较通用的函数单元操作,如创建驱动和桩,创建索引,拷贝数据,修改配置文件或者配置项等;patterns是对一组case中通用模式的抽象;case中则为具体的测试逻辑。
什么是pipe?
同一个Pipe既可以充当下游桩,也可以充当上游桩。
对于模块A,Pipe可以模拟模块B返回的数据,既是下游桩。
对于模块B,Pipe可以模拟模块A发送的数据,既是上游桩.
无论怎样,它的作用就是接入一根管道,将上游模块发出的数据取到,然后解码,做逻辑处理或者验证,然后将制定的数据再编码成需要的格式,发送给下一个模块
2)常见的shell命令。性能相关;进程的启动,查看和杀死;awk和sed等
4,建立资料汇总wiki,完善文档,为后人奠定基础
1)小到测试机如何登录,权限如何申请
2)大到shell,superTest,ruby等的资料讲解
我走了,留下了当初的积累和思考