Archive

Archive for March, 2010

以讹传讹

March 27th, 2010 7 comments

我坚信言论自由,每个人都有说任何话的自由,哪怕说得话再荒唐——这是一个社会追求民主法制所必需付出的代价。言论大致可以分成两种:阐述观点的和阐述事件的。阐述观点的言论即便再荒唐,对于好思辨的人带来的危害都不是太大。从我个人感情上讲,我更反感那些不对事件真实性负责任的言论。在信息时代,太多消息都只不过是道听途说,一人的捏造造成万人的流传,令人唏嘘不已。

看几个例子

  • 在网上盛传一时的《耶鲁大学炮轰中国高校》讲述了斯密德先生对中国高等教育的甚多批评(见Google搜索结果)在中文互联网界吸引了很多人的眼球,并且被很多在我看来可信度较高的网站转载。而只要随便google一下,就能知道这篇文章纯属子虚乌有。搜索结果中的第三个链接指向如下页面:

Yale University Statement Regarding Alleged Remarks Made by Former Yale President

Published: September 29, 2009

  • 更火爆的一个。《美中情局灭亡中国十诫》也是阴谋论。稍微有脑子的人仔细想想都会知道这多不可靠。一篇证伪的文章见这里
  • Google退出中国是因为打不过百度?是因为“传播”色情信息??要知道,谷歌的搜索提示功能是根据网民搜索频率高低自动生成的,在搜索提示中出现大量低俗词汇并不是谷歌的低俗,而是这个语言使用者的低俗——当然,我并能不同意看看黄色图片、发发段子就能算是低俗。
  • 《塑料瓶的秘密》:瓶子底下的数字代表塑料的毒性?重复使用多次会中毒?MD,刚一搜索发现这还上了黄山区环保网的网站,真是符合政府的一贯作风。同样用脑子想想就知道:如果真是会引起中毒,那么厂商为什么不在瓶子上贴个大大的警告语,而采用那么隐晦的方式让人们惶恐造谣呢?用关键字 bottle +bottom +triangle +number搜索,经过跳转之后可以到达这个维基页面

上面的四个例子仅仅是我临时能想得起来的,而我们参与四处传播的假信息肯定不止那么点:911的阴谋论,布什的那段话(嘿,曾子墨也参与其中)……

诚然,你我肯定无法彻底避免信息的错误传播,个人的求证能力终归有限;但假若我们每个人在传播信息的时候多少能带上一点负责任的意识,哪怕思考一下,转载的时候把出处给写出来,相信中文世界这以讹传讹的糟糕氛围多少会好一些。

Categories: 思考 Tags:

Google.CN

March 22nd, 2010 6 comments

Google stops self-censorship in China and redirects visitors from google.cn to google.com.hk, which reads:”welcome to Google’s new home in China”.

This links to a page that offers a summary of Google service accesibility from within mainland China.

Categories: 未分类 Tags:

推荐Picasa

March 13th, 2010 6 comments

一直以来我旅游的时候对拍照兴趣都不大:拍景自然有人拍得比我更好,上网搜搜就行了;拍自己就更没什么好拍的了。游历记在心里就行了,多拍无益,还浪费硬盘空间,更重要的是,浪费大量的整理照片的时间。

昨天开始玩Picasa,有个新功能是人脸识别,好玩的很。我花了一个多小时的时间是标记出134个人的照片(点击看大图,有了计算机的智能识别,这是如此高效!),晚上回家还打算继续识别以前的照片。

才发现看看以前的照片原来可以那么有意思!

Categories: 未分类 Tags:

转载:刘瑜-权利的道德捆绑[20100325更新未删减版]

March 13th, 2010 No comments

刘瑜这篇文章写得实在太好。原文地址:http://www.infzm.com/content/42417

未删减版地址:http://www.drunkpiano-liuyu.net/?p=554

同时强力推荐她的《民主的细节》:豆瓣|当当

以前我在街边的水果摊买樱桃、葡萄之类的水果时,总想挑出其中最新鲜好看的,但是常常受到摊主的阻挠:不许挑!不许挑!也是,如果我把好的都挑走了,坏的 他怎么卖呢?其实岂止卖葡萄樱桃,卖企业也是一样:几年前中国产权改革如日中天的时候,为了甩掉一些不良企业,据说一些地方政府采取的办法是:哪个投资者 要想买好资产,就得接受与之“搭售”的差资产。可见无论是卖葡萄还是卖企业,好坏搭配是推销之道。

后来我慢慢意识到,很多集权政府的治国之道亦是如此,甚至可以说,很多集权政府的成功秘诀正在于此:为了推销强权的苦咖啡,得搭售道德的白砂糖,咖啡加 糖,专制也就打开了销路。其实道理很简单,要说服民众放弃权利、财产、自由是很难的,甚至是不可能的,但是如果能让民众在打倒假丑恶的过程中“不知不觉” 地放弃其权利和自由,那么民众对集权政府俯首帖耳就水到渠成了。

最典型的例子莫过于朱元璋,其治国之策可以说是政治酷寒和道德狂热的成功会和。一方面,其治下不但有锦衣卫这种秘密警察制度,明初的里甲制度也比任何时代 更严密,志在把全民都变成秘密警察,“如鸟之在笼,兽之在柙,虽欲放逸,有不可得”。朱元璋不但利用胡惟庸案、蓝玉案等清洗成千上万潜在的政治威胁,而且 还用强制民众迁徙的方式开发地广人稀之地,用强制子承父业的方式干预民众的从业自由。其暴虐到什么程度呢?据说某个街头老妇没有尊称其为皇上,而称之“老 头”,朱元璋一怒之下,不但杀掉老妇,而且顺便干掉了老妇所在街区的所有其他人。

但是另一方面,这位老头又对道德纯洁性有着孜孜不倦的追求。他不喜酒肉,不荒淫无度,别的皇帝用金制物品,他要求以黄铜代之,“朕本农夫,深知民间疾 苦”。对贪官他嫉恶如仇,“官吏宿娼,罪亚杀人一等”,贪污六十两银子,就剥皮实草。他甚至对地方官员的“截访”行为也深恶痛绝,认为应当给民众伸冤开绝 对的绿灯,有个地方官员试图截访,被他发现后,阉之为奴。他还要求各乡各里建申明亭作为思想品德教育的宣传站,提醒人们尊老爱幼长幼有序。

如果他是纯粹暴君,民间可能早就揭竿而起了。但是朱元璋同时又是这样一个道德清教徒,很多人喝着咖啡加糖就给喝晕了:杀贪官?好!于是在迎接道德的特洛伊 木马的过程中,不知不觉也迎接了“木马”腹中的皇权统治。

朱元璋肯定不是这种治理术第一个或者最后一个使用者。在我们的无产阶级专政的革命期间,如何动员亿万群众加入残酷的政治斗争?很大程度上还是要靠权力和道 德的“打包”上市。要让民众接受“错抄一句语录就会被打成现行反革命、收听外国广播就要挨批斗”的制度安排,当然很难,但是假如接受这一安排的“收益”是 可以批斗那些以前颐指气使的、享受特权的“修正主义走资派”,“出一口恶气”,也许这个交易还算划算?所以革命的历程似乎就成了民众在打倒土豪劣绅、打倒 张子善刘青山、打倒官僚主义的道德欢呼声中逐渐拱手交出个体自由和权利的历程。

权力和道德捆绑也不是中国特产。比如今天的伊朗,女人穿衣服不能有伤风化,同性恋被抓住甚至可能被绞死,好莱坞电影一概取缔——谁让它充满了色情和暴力? 这种对“道德”纯洁性的追求在某些宗教原教旨主义者中深得人心,而这些原教旨主义者刚好构成伊朗政教合一政权的统治基础。

道德和权力的这种结盟不足为奇。早在中世纪,马基雅维利就在《君王论》中指出,一个成功的统治者要同时具有狮子的凶猛和狐狸的狡诈,要在被惧怕的同时被爱 戴。当然,道德和权力的共生性未必只是统治策略:一些专制者很可能“真心”地追求道德纯洁性,而这种追求恰恰与人类对纯洁性的迷恋契合。纯洁固然美好,但 是它对世界丰富性和复杂性的敌视,它天然的非黑即白世界观,本身就为专制提供了最好的精神土壤。因为深知道德如何在历史上给权力如虎添翼,所以我虽然敬重 一切洁身自好的个体,但是对一切来自有权阶层的整风、反低俗、打黑运动都心存疑虑,此类口号一出,总想看看这是不是一只特洛伊木马,肚子里有没有藏着什么 猫腻。

Categories: 好看的书, 转载 Tags:

砖家的预计——推断统计之痛

March 3rd, 2010 4 comments

小时候一直很好奇诸如这类的专家预测:

到2020年中国个人消费将超过2.5万亿美元,成为仅次于美国和日本的世界第三 …

预计1999全市可完成肉类总产量9.7万吨,比上年增加1万吨,增长11.5%;禽蛋产量1.5万吨,比上年减少776吨,下降近5%

直到高中了,我还是没有想通凭什么他们敢这样预计呢?向来复杂、变化的世界如何能在这些专家的笔下,变得如此具体而又必然?

还是本科时的统计课上,我才恍然大悟地意识到他们(很大一部分)是怎么做的——玩弄数字。

先抛开数据背后的一切涵义不看,假设我们有两组数据X和Y,他们之间是否存在因果关系未知。作图如下

这组数据显得是如此线性,几乎是很自然地,我们就会构想出一条直线,从而预测X>20的所有对应的Y值,我们甚至还运用统计方法估计出了这条直线的方程

这条直线是如此完美以至于拟合度(R-squared)达到了99.95!依据这个方程,于是有人断言:“当X=25的时候,Y的预计值为1.5448”。然后又有砖家放炮(举个夸张的例子):“当X=1000的时候,Y的值预计为23.0923”。他可能甚至还给出了预测值的置信区间,告诉你95%的情况下Y的范围在哪里。

但是,当X被延伸到1000的时候,图像会变成这样:

在真实的数据中,X=25时,Y=1.5625——预测还是很精确的;但是当X=1000的时候,Y的真实值是121,和预测值相差十万八千里。事实上,如果画出预测直线的话,图片会是这样:

两者在X<=42时,相差还能在5%以内;当X=1000的时候,相差超过了80% (相对真实值而言)。事实上,蓝色曲线的方程是Y=(1+X/100)^2。

当然,如果有好的工具(比如说计算机),人们是可以通过20个样本数据正确推断出方程的(因为这个方程里没有随机量)。但是,如果Y=(1+X/100)^2+e; e~N(0,1),用20样本找到真实方程的难度显然倍增。更不用说Y=(1+e/10+X/(100+f))+g; e, f, g~N(0,1)了。

我们都知道,运用小样本来预测是非常危险的,即便两个变量的关系是线性的。(置信区间的大小和样本容量的平方根成反比)意味着容量越小,置信区间平方增大,从而推断越不可信。

但是,即便运用大样本,在缺乏其背后理论支持的情况下,模型错误的概率都是很大。

这就是很多人运用统计推断方法进行数据研究的悲哀——我们都希望数字能够按照我们感知的趋势变动,而悲哀的是,我们的感知常常是错误的;且不用说在有些时候,数字的变化确确实实是100%随机的。

当麦肯锡作出2020年中国个人消费的预测的时候,我并不太怀疑所用模型计算上的正确性:有了电脑,能把回归算错的概率实在不是很大。但重要的是,模型只和它的假设一样正确(我不知道该怎么翻译: a model is only as good as its assumptions)——如果假设是错误的,再漂亮的模型也只不过是Garbage-in, Garbage-out.

与其多跑几次回归分析匆匆得出结论,还不如踏踏实实研究数据变动背后的理论来得实际;即便前者往往更酷更炫。人们都喜欢用模型来简化世界,但是世界从来就没有简单过,简化来简化去最后的结果只是简化了自己结论的可信度。

比如说这个玩的很炫的预测,其实一点reasonable的支持都没有:http://www.ted.com/talks/hans_rosling_asia_s_rise_how_and_when.html

Categories: 思考, 谈点专业 Tags: