十一月初出席了一项数学,统计学及其应用的国际学术研讨会。会议的其中一位受邀主讲人,Prof Regina Liu分享了美国人对统计学的看法及统计学毕业生的就业前景。非常有趣。在此与大家分享其摘要:
--Dream job of this decade: being a statistician..... (New York Times, Washington Post)
"...The really sexy job in the 2010's is to be a statistician because they are the people that can make data tell a story...." (Hal Varian, Google Chief Economist)
" The ability to take data - to be able to understand it, to process it, to extract value from it, to visualize it, to communicate it .... that's going to be a hugely important skill in the next decades" (忘了是谁说的)
毋庸置疑,统计学对各领域和学科的贡献与影响是非常深远的。在这谁掌握资讯,谁就掌握先机的竞争模式社会里,我们必须很客观地应用各种统计学工具来发掘埋藏在大量数据背后的正确资讯。而这种工作除了有赖于统计学家的努力外,更重要的是一个国家/社会各阶层对统计学的认知和观念取向是否正确。回顾这些年来,无论是马来西亚政府机构,政治人物和媒体人在处理数据时充斥着(故意或非故意)人为偏差及普罗大众对统计学的盲从或无知的现象来推测,这一条路我们还需走很远。
2010年2月24日星期三
五官与思维
请别误会!今天我们并非要谈如何欣赏俊男美女,更不是为大家看相占卦。今天我们来谈谈一个看似浅易,但却往往是许多人所缺乏的一种素质。今天的题目主体内容是身体器官的局限性及让大家了解客观和独立思考的重要性。这是每一个人,尤其是我国政治和社团领袖所必须具备的素质,以免闹出更多的笑话。
在此,让我们回答三道问题。第一道比较哲学性的问题:人为什么可以称之为“人”?或者问:人的基本条件是什么?
相信很多人第一个典型的答案是:人之所以为“人”,因为“人”拥有口、眼、鼻、耳、身的五官形体。这个答案并没有错,但也不完全正确。因为其他动物也都具备五官形体。那么,“人”就无法简单的以五官形体来区别于其他动物了。我们总不可以把同样有口、眼、鼻、耳、身的老鼠当成是人吧!
人之所以为“人”,除了五官形体以外,更重要的是“人”是一种有思考能力的动物。因为有思考能力,所以“人”成为比动物更高级的生物。因为能够思考,所以“人”产生了情感和扬善弃恶的道德规范。也因为有了思考,”人“才能够自我提升,带动着社会与科技的进步和趋向完善。
因此,人之所以为“人”必须是由两个部分组成:五官与思维。如果以电脑来作比喻,那么五官好比人的硬件(Hardware),而思维就是人的软件(Software)。人类通过五官对现实世界的接触,然后将五觉即味觉、视觉、嗅觉、听觉和触觉的信息传送到脑部的思维处理后,才形成对外在世界 的正确认知和内心世界的丰富情感。图表一为人类建立知识和情感的简单流程。
我们今天所得到的第一个结论是:
人类是依靠五官对现实世界的接触来获取认知事物,道德判断及感情依归所需的信息。
接下来第二道问题是:你认为你的五官所传达的信息可靠吗?你相信你所看到的,所听闻的和所触摸的东西吗?
在大家回答这一道问题之前,先让我们一起来看看以下的例子和试验。相信各位都曾经听过瞎子摸象的故事。如果瞎子在完全没有接触过大象的情况下触摸大象的不同部位,那么他将得到不同的答案。这个故事告诉我们人是无法单单依靠触觉来认识这个世界。
至于味觉,听觉和嗅觉,相信大家或多或少都有一些尴尬的经历是由味、听、嗅三觉所引起。最简单的试验是把一种不知名的味道,气味或声音让不同的人猜测。也许你会得到五花八门的答案。
最后的几项试验是关于我们的视觉。眼睛是我们的灵魂之窗,是人类认识世界的过程中最主要的器官。试验一(图表二)[1]是两条直线各有不同方向的箭头。请你以肉眼来区别上下哪一条横线比较长。
如果你的答案是上方横线比较长,那么我要恭喜你。因为你的视觉正常,可惜你的答案是错的。但如果你说下方横线较长,那么我劝告阁下去看眼科医生,因为你的答案不但是错误的,而你的眼睛也极有问题。图表二的真正答案是上下两条横线都一样长。
人类是依靠五官对现实世界的接触来获取认知事物,道德判断及感情依归所需的信息。
接下来第二道问题是:你认为你的五官所传达的信息可靠吗?你相信你所看到的,所听闻的和所触摸的东西吗?
在大家回答这一道问题之前,先让我们一起来看看以下的例子和试验。相信各位都曾经听过瞎子摸象的故事。如果瞎子在完全没有接触过大象的情况下触摸大象的不同部位,那么他将得到不同的答案。这个故事告诉我们人是无法单单依靠触觉来认识这个世界。
至于味觉,听觉和嗅觉,相信大家或多或少都有一些尴尬的经历是由味、听、嗅三觉所引起。最简单的试验是把一种不知名的味道,气味或声音让不同的人猜测。也许你会得到五花八门的答案。
最后的几项试验是关于我们的视觉。眼睛是我们的灵魂之窗,是人类认识世界的过程中最主要的器官。试验一(图表二)[1]是两条直线各有不同方向的箭头。请你以肉眼来区别上下哪一条横线比较长。
如果你的答案是上方横线比较长,那么我要恭喜你。因为你的视觉正常,可惜你的答案是错的。但如果你说下方横线较长,那么我劝告阁下去看眼科医生,因为你的答案不但是错误的,而你的眼睛也极有问题。图表二的真正答案是上下两条横线都一样长。
在试验二中(图表三),我们所看到的八条斜线都是非平衡线(Parallel lines)。但是当你用尺度量他们的距离时就会发现他们其实都是平衡线。
同样的效果发生在以下的横线图(图表四)和方形图(图表五)。这是线条对眼睛带来的曲线效果。
接下来的试验指出空间效果对视觉造成的错觉。图表六的三根一样长的柱子,由于远近空间的不同,结果看起来越后面的柱子越长。而图表七的两个几何三角形的面积是一样的。因为其排列方式的不同而造成下方的三角形缺了一个口,使人以为其面积较小。再来,图表八所显示的到底是一个相纸合或一间房子?从下往上看,它是一个相纸合(左图)。但从另一个角度看,它确是一间房子的墙角。这就是角度对视觉造成不同的影响。
R L
图表十一 最后的一项试验测试颜色对视觉产生的效果。在这项测试中,请别把图表十二的英文字念出来。你只需要大声的把其颜色一一的念出来就可以了。如果你可以把所有的颜色正确的念出来,那证明了你的意志不受视觉所影响。另一项异曲同工的试验是让某人重复大声的念“老鼠”十次,然后要他立刻回答老鼠吃什么。多数人的答案将会是“猫”。那是因为人的意志或观念往往会被重复的事物所改变。好比一个人说的东西你会肯定它是假的,两个人说同样的东西你认为它还是假的,三个人说时你认为也许是假的,直到很多人说同样的话时你就会认为它是真的。
YELLOW BLUE ORANGE
BLACK RED GREEN
PURPLE YELLOW RED
ORANGE GREEN BLACK
BLUE RED PURPLE
GREEN BLUE ORANGE
图表十二
以上种种的例子清楚地告诉我们一个非常残酷的事实。原来我们从小到大一直努力地认识这个世界,但是我们最信任的自己,我们所依赖的五官却无时无刻都有可能在欺骗着自己。由于五官传达了错误的信息,导致我们作出了错误的判断。由于五官存有模糊地带,使我们把一些无法解释的错觉视为神奇力量,结果有人堕入神棍老千的圈套。由于五官的感性原素(element)大于理性原素,使我们错把伪科学信奉为真真理。
因此,我们得到的第二个结论是:
身体五官是骗子。盲目的相信感觉或权威将导致我们无法作出正确的判断。
最后的第三道问题是:如果五官是一个潜在的骗子,那么我们有什么方法监察各种虚假的信息呢?如何作出理性、客观及独立的判断?
答案非常简单,就是应用你的思考来监察。你的思维能力能够让你将所接受到的信息进行更系统化和客观的分析。通过理性思维的方式,我们能把正确与错误的信息区分开来。将事物的矛盾处点破,将理性建立于感性之上,把作出错误判断的机率降至最低。
何谓理性思维?简单的说,理性思维是一种概括了逻辑思考(Logical Thinking)能力和分析思考(Critical and Analytical Thinking)能力的思维模式。让我们搁置深奥难懂的理论,以最简单的方式说明逻辑思考和分析思考。首先,如果你看见天空乌云满布时,你就会赶紧的把屋子外面的衣服收回来。为什么呢?因为你已经运用了以下的逻辑推理而得到结论[2]:
1) 因为乌云满布,所以就快要下雨了。
2) 因为下雨,屋子外面的衣服会被淋湿。
3) 不希望衣服被淋湿,那么天就不要下雨或是把衣服先收起来。
当然,这个推理过程的结果是你不可能决定下不下雨,所以你选择了把衣服收起来。其次,当你眼看辛辛苦苦经营的生意销量一落千丈。为了挽救生意,你开始收集顾客的意见,调查市场的走向,找出生意滑落的原因时,你其实正在进行着分析工作。所以,逻辑思考和分析能力不是大学殿堂里的专用品,而是每一个人都具备的基本能力之一。分别只是谁强谁弱而已。
现今的社会充斥着许许多多的伪信息,让人真假难分。听听我们官老爷和领袖们似是而非的言论。听起来头头是道,可是仔细的想一想,你也许发现这些言论言过其实,自相矛盾或漏洞百出。再看看一些夸大其词的宣传广告和促销活动,里头也许三分真实七分假或七分真实三分假,那就得看你有多大的智慧而不掉入圈套。还有就是人们对权力(如政治、宗教、娱乐等领域)的盲目崇拜和迷信行为一而再,再而三的发生在我们的四周。如果你缺乏理性思维能力,也许你就是被愚弄的受害者之一。
让我告诉大家第三个结论是:
理性思维是一个监察员,它能协助你扫除许多的伪信息,让你作出个人最正确的决定。
最后,让我们以几个例子来测试自己的思维能力[3]。看看你能够找出多少的伪信息或矛盾处。(在此我们假设报章内容无误)
例子一
例子二
例子三
资料来源:
[1] 以上图表二至图表十二皆取之于http://scientificpsychic.com/graphics/
[2] 李万千(1993),’白马非马:普通逻辑简介’,东方企业出版.
[3] 马来西亚各中文报章.
注:
我设立部落格的主要目的是教育群众以正确和理性的视野来解读有关数字的言论。除了正确解读相关的言论外,了解和学习如何正确使用数学/统计学等工具及思考方法也是本部落格的重点讨论内容。通过这种双向交流(读者的意见),不但能提升读者的知识,同时使我对有关课题的思考和掌握更深入,更全面及更扎实。
这一篇‘五官与思维’是我几年前发表在青团运雪州分会会讯《新青年:创刊号》的文章,内容主要点出从感官所吸取的资讯不一定正确,理性的思考才是检视真理的方法。
2010年2月21日星期日
街头罪案下降7.6%?
农历大年初三,意外地在多份中文报章看到一则由内政部所刊登的半页广告。标题非常醒目,“街头罪案下跌7.6巴仙”。大大的标题似乎专为我们的总警长和内政部长的KPI进行催情式的加分,誓必要KPI达标200%。至于对大马子民的生命和财产安全指数产生多大作用,还得靠各自的努力和祖先保佑才行。为了不让内政部的一番美意付诸东流,我还是很努力的从广告中寻找一些富有娱乐性的数字与大家分享。为大马火炎的二月天气增添些许的乐趣。
根据广告宣称,2009年第四季(12月份)的街头罪案和重罪(index crimes)较同年的第二季(7月份)分别下跌7.6%和3.7%。为此,我们的内政部长满脸'春'意的宣布,这项初步成效显示政府转型计划已全面落实中。这里让我产生两个疑问。
1)为什么2009年第四季的罪案数据要与同年的第二季作比较?而不是与同年的第三季或2008年的第四季比较?我们常看到一些经济数据是以上一季(数据的连续性)或上一年同季(数据的对比)作比较。虽然其结论的可靠性存有争议,但至少它比较的基础是正确的。那到底以2009年第二季的数据做比较的基础是什么?既不是让读者对罪案数据连续起来,也不是与同时期的数据作对比。难道只为它单纯地呈现某些人所要的效果?如果证是如此,以下两个假设或许能让我们推敲当局不以2009年第三季的罪案数据为比较基础的原因:
(一)此季的罪案率与2009年第四季相同或稍为高少许,因此它无法突显出所达到的成就。
(二)此季的罪案率高于2009年第四季。至于真正的答案是什么,只有等到当局公布完整的数据才能知晓。
2)上面提到,以两个数据作比较而得的结论存有可靠性的争议。这是统计学里基本常识。你不可能从两个数目(7月和12月)中推论出一个全新的数目。举个简单的例子:我给你两个号码5和10,请问接下来的号码是什么?答案没有人知道。但如果有三个号码5,10,15,我们比较有信心的说接下来的号码是20。也就是说,数据越多,我们的预测就能越准确。另外一个说法,这种预测其实反映出我们更想要知道的是一种趋势(Trend),而这种罪案率的下降趋势必须有一时列数据(Time series data)来支撑。如果只以单一数据做推论,就如我们的内政部长般宣誓政府转型计划已全面落实,万一明年的罪案率稍为高少许,那我们是否再推论说政府转型计划已全面失败?连这种简单道理都搞不懂,真怀疑内政部长和他后面的智囊们‘智慧’有多高。难怪前部长要用ISA来保护平民百姓。
根据广告中的定义,街头罪案(在公众场所发生的罪案之统称)是重罪(包括暴力刑事罪如谋杀,强奸,各类抢劫和各类盗窃等)的一部分或两者至少是有交替的。另一方面,报告却明确的说明街头罪案下降7.6%的数据只是从掠夺窃案,持械/无持械打劫计算所得。而重罪案件减少3.7%是从产业盗窃组和暴力案件组计算所得。非常巧合地,产业盗窃组和暴力案件组中就完全包含了以上所列的街头罪案。这里又出现两个问题了:
1)如果子集(subset)下降了7.6%,而父集(superset)只减少3.7%,这又是否意味着重罪里的某些罪案(如谋杀,强奸等)可能不减反增而拉低了内政部的灭罪成果?举个运算的例子:假设在2009年时,A=30,B=70,C=60和D=40。到了2010年,我们知道A=25,B=67.4及第一组(A+B)减少了7.6%。如果2010年,已知第二组(A+B+C+D)下降了3.7%,那C和D在2010年的值是多少?从以上所得C+D=192-25-67.4=92.8。也就是说,在2010年有两个可能的C和D答案:(一)C和D的值可能都小于2009年,但(C+D)会比(A+B)大,(二)C或D的值其中一个小于2009年,另一个却大于2009年。因此,如果答案是(一),那内政部为何不一起公布C和D的数据呢?这至少也是一项正面的成绩单。不会是版位不够吧!看看广告的三分之一内容都是重复的就可否定这项说法。那,这是否是内政部又一次的选择性的发布资料呢?还是由大家自己去联想猜测吧。
2)内政部长说街头罪案是政府的重点关注的领域,但为什么街头罪案只提供掠夺和打劫的数据而不是全部罪案类型的数据如贩毒,破坏公物和伤害等?如果大家记性还不差的话,内政部在过去短短时间内已经成功逮捕了40多个伊朗籍毒贩。这里有太多的猜测性问题,我就不谈了。
批评了这么多,千万别误会我在漠视警员在打击罪犯的努力和成果。如果7.6%是真实的数据,那肯定是大马子民的福气。我们都会为广大的警察部队‘干爸爹’(Ganbatte)。但如果7.6%只是某些人选择性地用来误导民众和为自己的KPI加分,那人民是有权力知道背后的真相。当然,也要提醒为部长执笔的智囊们,不要拿了高薪只做马屁精。有些事骗得了你的老板却骗不了大家。
博客:张运华
2010年2月21日
根据广告宣称,2009年第四季(12月份)的街头罪案和重罪(index crimes)较同年的第二季(7月份)分别下跌7.6%和3.7%。为此,我们的内政部长满脸'春'意的宣布,这项初步成效显示政府转型计划已全面落实中。这里让我产生两个疑问。
1)为什么2009年第四季的罪案数据要与同年的第二季作比较?而不是与同年的第三季或2008年的第四季比较?我们常看到一些经济数据是以上一季(数据的连续性)或上一年同季(数据的对比)作比较。虽然其结论的可靠性存有争议,但至少它比较的基础是正确的。那到底以2009年第二季的数据做比较的基础是什么?既不是让读者对罪案数据连续起来,也不是与同时期的数据作对比。难道只为它单纯地呈现某些人所要的效果?如果证是如此,以下两个假设或许能让我们推敲当局不以2009年第三季的罪案数据为比较基础的原因:
(一)此季的罪案率与2009年第四季相同或稍为高少许,因此它无法突显出所达到的成就。
(二)此季的罪案率高于2009年第四季。至于真正的答案是什么,只有等到当局公布完整的数据才能知晓。
2)上面提到,以两个数据作比较而得的结论存有可靠性的争议。这是统计学里基本常识。你不可能从两个数目(7月和12月)中推论出一个全新的数目。举个简单的例子:我给你两个号码5和10,请问接下来的号码是什么?答案没有人知道。但如果有三个号码5,10,15,我们比较有信心的说接下来的号码是20。也就是说,数据越多,我们的预测就能越准确。另外一个说法,这种预测其实反映出我们更想要知道的是一种趋势(Trend),而这种罪案率的下降趋势必须有一时列数据(Time series data)来支撑。如果只以单一数据做推论,就如我们的内政部长般宣誓政府转型计划已全面落实,万一明年的罪案率稍为高少许,那我们是否再推论说政府转型计划已全面失败?连这种简单道理都搞不懂,真怀疑内政部长和他后面的智囊们‘智慧’有多高。难怪前部长要用ISA来保护平民百姓。
根据广告中的定义,街头罪案(在公众场所发生的罪案之统称)是重罪(包括暴力刑事罪如谋杀,强奸,各类抢劫和各类盗窃等)的一部分或两者至少是有交替的。另一方面,报告却明确的说明街头罪案下降7.6%的数据只是从掠夺窃案,持械/无持械打劫计算所得。而重罪案件减少3.7%是从产业盗窃组和暴力案件组计算所得。非常巧合地,产业盗窃组和暴力案件组中就完全包含了以上所列的街头罪案。这里又出现两个问题了:
1)如果子集(subset)下降了7.6%,而父集(superset)只减少3.7%,这又是否意味着重罪里的某些罪案(如谋杀,强奸等)可能不减反增而拉低了内政部的灭罪成果?举个运算的例子:假设在2009年时,A=30,B=70,C=60和D=40。到了2010年,我们知道A=25,B=67.4及第一组(A+B)减少了7.6%。如果2010年,已知第二组(A+B+C+D)下降了3.7%,那C和D在2010年的值是多少?从以上所得C+D=192-25-67.4=92.8。也就是说,在2010年有两个可能的C和D答案:(一)C和D的值可能都小于2009年,但(C+D)会比(A+B)大,(二)C或D的值其中一个小于2009年,另一个却大于2009年。因此,如果答案是(一),那内政部为何不一起公布C和D的数据呢?这至少也是一项正面的成绩单。不会是版位不够吧!看看广告的三分之一内容都是重复的就可否定这项说法。那,这是否是内政部又一次的选择性的发布资料呢?还是由大家自己去联想猜测吧。
2)内政部长说街头罪案是政府的重点关注的领域,但为什么街头罪案只提供掠夺和打劫的数据而不是全部罪案类型的数据如贩毒,破坏公物和伤害等?如果大家记性还不差的话,内政部在过去短短时间内已经成功逮捕了40多个伊朗籍毒贩。这里有太多的猜测性问题,我就不谈了。
批评了这么多,千万别误会我在漠视警员在打击罪犯的努力和成果。如果7.6%是真实的数据,那肯定是大马子民的福气。我们都会为广大的警察部队‘干爸爹’(Ganbatte)。但如果7.6%只是某些人选择性地用来误导民众和为自己的KPI加分,那人民是有权力知道背后的真相。当然,也要提醒为部长执笔的智囊们,不要拿了高薪只做马屁精。有些事骗得了你的老板却骗不了大家。
博客:张运华
2010年2月21日
订阅:
博文 (Atom)