首页 > 代码库 > 舌尖上的 Data Miner

舌尖上的 Data Miner

谨以此文纪念过去两年的幸福时光~~~


按下Shift-Alt-s, 这个来到DM最熟练的组合键,不用看跳出的对话框,直接按下Enter键。资深Data Miner提交Job都是这么帅的。Miner一边美滋滋的看着提交Job的圆圈,一圈一圈的转,一边在另一个屏幕上,浏览cnbate。对于上万行代码经验的Miner,他们的Code一般不会在提交30秒以内出现错误,那些语法错误通常是新手才会犯的。Miner的code错误一般会在编译一分钟以后才出现,更高级的是在运行中才会失败。遇到这种bug,Miner一边为又浪费了几千个PN Hour惋惜,一边狠狠抱怨一下编译器的白痴。

Miner,挖矿者,古已有之。在童话白雪公主中,七个小矮人就是Miner,他们在岩洞中开采水晶,过着快乐而苦逼的生活。直到YY中的女神进入他们生活,他们为之疯狂,甚至用毕生开采的水晶打造棺木,为被王后毒死的公主守护。可惜最终他们的女神却被白马王子接走,还是活的。这也许是Miner中最悲催的遭遇,但肯定不是唯一的一个。

Job还没有运行完,一瞬间,流量曲线又回到了 Miner 的记忆里 -- 这周流量又TM下降了。为了得到这份大自然的馈赠,Scope、SLAPI、Rover、Cube、Excel,这些在Miner心中隐隐自豪的符号,浑然融会在一起,涌到心头。只要几分钟,Miner 已经可以感觉到在 Pivet Table 中尽情的畅游的快感,这是多少人羡慕的意境。一条条曲线,一个个insight,表达着对这份馈赠的谢意。

Miner 从前辈那里接过 Pipeline,接过 Scorecard,不过令人惊讶的是,到了这一代,很多东西都遗失了,寻找着代码里的 bug,核对着表格中的 number,Miner 从中体会着前辈苦涩的味道。这些苦涩并不是 Miner 生活的全部,Miner 知道四季轮回的等待最终将换来丰收的时候 -- Q Review。这是 Cosmos 最繁忙的季节,一屏一屏被 queue 在队列里的 job,就像一个个跃跃欲试的士兵,士兵的钢枪里塞满了饱含 insight 的子弹。这些士兵马上就要奔驰在大洋彼岸偏僻的 Farm 上。Miner 想,那些发明和搭建 Farm 的人,一定会彪炳史册,他们实现了这么一种伟大的消耗能源的方式,应该和人类使用火相提并论。生活就是这么有趣,一些人的旅行计划会影响美国电力消耗的波动,这也许就是 impact 吧,对人类的 impact,Miner 想。

丰收的季节肯定不是只有一个,还有H review,D review,J review,XX review,这些 review 让Miner 收获丰硕的果实 -- 一个个令人震惊的计划,2% share,10% share,20% share!这些计划把我们的竞争对手从战略的高度无情的抛在身后,全然不顾及别人的感受。Miner 听着纯正地道的英语演讲,心里想象着竞争对手被我们的计划吓得难以入睡的神情,终于从心灵上和 leader 们高度 align 了。

在 Miner 中还有一个细分行业,称作 Machine Learner,他们对大多数人保持着神秘感和极大的心理优越感,即使是普通的 Miner,也对他们抬头仰望。MLearner 从浩如烟海的数据中,找到对未来的预测。其实这是一个极为古老的职业,可以追溯到人类诞生之初。那时的名字称为占卜师,他们通常使用简单的工具,如艾草,龟甲,为他们复杂的推演产生 seed,至于推演的过程长则几年,短则几分,视问题的复杂而定。推演的细节只有占卜师们知道。如今很多 MLearner 仍然依靠 seed 作为启示,通过一些称作“统计”的工具来得到占卜的结果。在远古,占卜师虽然被人们视为神明,但如果预测的结果长期不靠谱,常常会被人们赶下神坛,乱石砸死。现代的 MLearner 为了降低生存的风险,不得不将推演的过程公之于众,这样在推演失败的时候,还能给出一些托词,不至于被人砍死。其实占卜师这种用性命做抵押进行预测的方式远比 MLearner 来的严肃和谨慎,这也是他们当时能受到远比现在 MLearner 更高的崇敬的原因。



来自为知笔记(Wiz)