2006-07-31

统计

  过了一周非常痛苦的日子,痛苦是说,一点神都不能走,掐着小时看书,我留了足足4本500多页的资料要在最后一周里头全部看完。来不及啊来不及。但这怨谁呢,谁让自己不死到临头就不会猛抱佛脚呢。
  结果终于在考试前半小时翻完了。
  当时自我感觉很好,觉得这样学习了一把,终于概念清晰,想通了许多奥妙的地方,顿时觉得牛哄哄起来。结果考试满难的,这样全力复习之后还是有地方不会,题目挺高明,立马又帮助我谦逊了下来。小蔡同学前两天还在电话里诉说,发现人的修养真是难以维持啊,比如从前知道自己很菜的时候,是多么谦虚有礼啊,结果如今自己开始熟悉了那些通讯专利啊课题啊,就开始丧失耐心,觉得提的问题是多么愚蠢而提问人为什么怎么都明白不过来,结论是,这时候才体现人的修养啊。她说这些的时候,主要是觉得我可能会有那么点修养,比如出于职业习惯啥的,但她其实不知道我们经常烦躁地在办公室里骂骂咧咧,非常没有修养。
  不论怎么说,修养都是多么重要,保持谦虚也是多么必要啊,BW是多么复杂精深啊。
  不管怎么说,我总算借着考试的东风,把早该看的书都看完了,这是好事。
  考试结果挺有意思,BPS部分得分最高,这是最后看的一本书,记忆犹新,加上题目简单(因为这部分他要想考点略难的就难得没法做了);然后其次好的居然是BEX,这是唯一一本本周没看的书,充分说明备课讲课具有多么神奇的效果,本来是一点都不会的部分居然都搞清楚了。modeling其实还是考的BEX,但是是how to,真难啊。然后auth最差,本来以为自己还是知道点auth的,看来知道的全不怎么对头,:-|
  这周如此单调疲劳,以至于早班都不痛苦了,看,多了几个小时时间呢,而且居然一大早讨论客户问题也相当于休息,好歹不是在看那些讨厌的书吧。周二出了岔子,结果大家开会检讨。但本周和WP讨论的AFS IM处理非常有意思,对non cumulative理解增加,最终dev那边给的结论也和我们先前的讨论是一致的,可以混用。另一个比较有意思的讨论是关于load韩语的,最后没有能说服对方,但我这边的条理基本理清楚了,除了些细节。重点是lane告诉我必须除英语外另装两个以上codepage才是MDMP,我说我怎么老看不明白这家伙老在叽叽歪歪说什么死活不想多装codepage啥的。在我看来他日后conversion的时候也难逃这条路,除非这部分数据不要了,但显然他无法面对这样的事实还在挣扎中,让别人再加上些铁的事实去说服他吧。另外一个有意思的是上周了,LJ本来是要问问题的,结果被我抢先问了个ORA上面performance搞不定的事,真是送上门来,我觉得该做的都做了,stats也update过了,再无出路了,最后LJ问几号update的,我说六月二十几号,属于比较新的了,他问哪里的客户,我说澳洲,他说那就对了,澳洲是六月底财年关帐,这几天数据正是变得一塌糊涂的时候,要重做,然后刷刷写了两条命令过来。果然,那边一下就被打倒了,牛得很啊。这也让我明白过来原来那家的DBA很不灵,估计前两次都是不懂装懂在糊弄我呢,做出来的结果都灰常奇怪,不可信啊不可信。
  
  不能太走神,所以只能按照书里的逻辑略微放放马,比如突然躺在席子上想,如果所有的博客都不光维护了友情链接,也就是事实上的友人生活,还维护了:怡情链接,就是自己爱好相关的,赏心悦目的;多情链接,就是自作多情长期去潜水的,然而多半自己在那个领域插不上啥嘴或者完全不明白的;以及滥情链接,就是不分好坏,杂七杂八都去探头探脑的;再或者情情链接,就是那些充满了跌宕起伏人生故事的;最后是无情链接,就象老罗的站点上就挂着两个他长年批判的人物做为参考文献,乐此不疲地笔诛口伐。那么,我们就有了非常有实际含义的属性或者维度了,那么通过对这些数据的modeling我们就可以回答很多有趣的问题啦,是啊是啊可以有很多有趣的问题,而且应该是高明的,这让我几乎想不出具体问题来。比如,统计上来讲,是不是类似的怡情链接都远在你的友情范围之外,它们都在哪里,你因此是不是要移动移动;有多少比例的滥情链接会转变为怡情,最终转为友情,多久会,以后还值得大面积去滥情吗,这需要时间相关的历史信息;情情的主人家是不是也会无情多些,或者被无情多些,等等等等。
  当然这不是什么新奇的念头,比如早就有揭示这个世界关联的网络地图啦,但我没真用过,打不开,等啊等啊也等不出结果来。website map
  不过草草现在用的这个关于自己站点的统计就很好玩:关键字
  
  关于统计还有这个有趣的故事预测
  我是这样听说这个故事的,年初的时候我和FEW讨论初三往东走这件关系到财运的非常有意义的活动,我说这个本年运程非常准确,你看它说我肠胃等会有问题,果然大病一场,又说今年不是换单位就是公司要搬家,其实是必然要搬的,等等等等。然后FEW说,那你听过这个著名的关于足球算法的故事没。然后他流着口水讲了一通,说这个人多么聪明啊,他给1万个人发信说我们现在发明了一种非常准确的算法预测输赢,可试用五次,这次的结果会是。。。他给一半人发了A,一半B。然后给准确的那一半继续发,依次类推。五次后他给最后留下三四百人发信说试用结束,要获得更多预测信息,请付款500磅至某帐号。这时候FEW口水流得更多了,想想,哪怕就十分之一的人信了他,那也是很大一笔钱啊,多么聪明的算法啊。这个故事还被打断了几次,因为其间武林外传搞了几次笑。所以完了,我很严肃地问,你说这个故事干吗,和初三往东走有关系吗?FEW不予回答了。好吧,有关系。然后我又说,那你什么意思呢,你要反对初三往东走吗?不不,我们当然往东走,我们当然争取发财。好吧,这是个很好的故事,你真聪明啊,懂得讲这么复杂的故事……FEW开始感到很高兴……来说明这么简单的道理。哈哈

  然而统计说起来远比直接面对的时候轻松得多。我们隔三岔五地要对客户说,你的stats不对,改去。然而当张猫对我说,统计上来说,二至五年是高复发期,我的脑子就转不动了。统计?Statistically?她到底什么意思?半天说不上话来。她只好解释,这并不是什么确切的治疗结论,只是统计学上得来的数据,就是一般而言都在二到五年会复发的。这样的时段含义是多么模糊啊,为什么五年之后就不是高发期了,是因为治愈了吗?不,因为那时候样本量小下去了!这些想法让我没法思考。所以我只能说,我不知道,我现在一直都觉得会治好,没有想过,受不了。张猫这时候又变回了职业医生,那当然那当然,是可以治好的,要有信心。
  所以当我向主治医生询问用药量的时候,医生人很好,然而类似的统计含义翻译更令人无从思考。我问上海的治疗方案一般都用药重些,他说是的,疗效统计的实际含义是这样的,就是上海方案的早期存活率会更低,但是二到五年的存活效果和质量比我们这种更好。至此我脑子又当掉。统计而言,统计而言,你选哪一个,你要选哪一个?

  名人名言看上去最近很有生命力,比较容易被人景仰,所以看wheatherman的时候,里面的名言过目不忘,大家共勉吧,那就是:There is no easy thing in the adults' life. 这样想就宽慰多啦,反正都是一样的,就一件一件来,沉稳些吧。

No comments:

Post a Comment