Wednesday, April 30, 2014

开源码的原始精神今安在?

开源码(Open Source) 风起云涌于九十年代,以Linus Torvalds免费开放其开发的Linux操作系统核心源代码为主要高潮,当时的目的是为了对抗强大的微软帝国,让被微软视窗统治多年的电脑世界有另一个新的窗口。当年登高一呼,许多软件工程师纷纷响应,牺牲工余时间,集合科技众人的智慧与力量,为Linux的开源纷纷贡献自己的一份心力。基于开源的观念,一些在Linux开发的应用软件如也提供了源代码,并且也让用户免费使用

但是,发展到今天,Open Source的原始观念已经荡然无存,与当年的对抗精神也相去甚远。今天,免费,无私的付出都已经不是Open Source开源字典里的词汇了。很多商业公司都利用了这些无私奉献的热情牟利。例如,一些软件工程师工余无偿的debug核心源代码,商业公司就包装进他们的商业配套里去卖钱了。

例如,Linus Torvalds还是一个单纯朝九晚五默默付出的软件工程师,但围绕着Linux操作系统提供各种收费附加价值的Red Hat公司,刚公布的业绩是15.3亿,盈利为1.78亿。

而后期的许多开放给任何人自由撷取的开源码一开始开放原始码就已不再单纯,他们带有的是浓浓的目的,主要是利用开放及免费作为号召和吸引条件请君入瓮,让你深陷,最后再通过收费昂贵的附加价值的各种应用狠狠的砍你,让你血流如注。而且,这些环绕在开源码系统的应用虽然以Open Source作为销售号召,但他们的源代码却深锁,一点也不开放

例如基于大数据而推出的Hadoop开源码,其创始人早早就加入了基于Hadoop开发的商用套装软件公司Cloudela找钱

开源码在今天,已经是一种商业手段,别被其亮丽的外衣所蒙蔽。

Wednesday, April 2, 2014

大数据的大智大悟


这一两年我们常常听到大数据(Big Data),由于这个词平凡无奇,不深入分析的听者会觉得小题大作:“这有何了不起,电脑不就是越来越快,数据越来越大吗?”

大数据藏着智能化瑰宝

如果从纯粹字面上意义来看,的确如此。只是今天我们谈大数据的时候,不是谈Gigabyte、Terabyte、Petabyte、Exabyte、Zettabyte等不断增加的大容量储存,而是大数据里头埋藏着的智能化瑰宝。因为没有大数据,就没有所谓的智能化!而智能化,就是今天科技的大未来啊!

可能我们会问,大数据既然造就智能化,之前政府及大机构掌握的数据也非常庞大,为何不催生智能化,要等到今天大家谈大数据才往这个方向迈进?

其实之前的大数据服务于政府和大企业,纵有智能,一般人也感受不到。电脑一开始是以政府和大企业机构应用为主,80年代后虽然发展到个人电脑时代,有着逐渐下放之趋势,但还是停留在从大企业走入中小企业为服务的目标。直至互联网兴起,智能手机抬头,紧接着个人佩戴智能产品(Wearable Gadget)及智能家居,个人科技(Personal Technology)在2010年过后才真正进入以个体作为服务目标的主流市场。




大企业如何应用智能化?例如当你在刷信用卡时,银行累计你的购物数据知道你的购物习惯,特别推荐一些类似商品的购物优惠。但这些数据的智能化深锁在企业的服务机里头,服务大企业多过服务消费群众。

现在互联网兴起,服务对象一下转移,我们能体会到最基本的智能化功能如,你利用谷歌搜索,还没打完一行字,可能要搜索的完整句子和建议就出现了。谷歌又怎么知道呢?谷歌一天处理超过24 Petabytes的数据,其分析系统根据概率就知道你要搜索的是什么了。

智能化就是个性化

智能化的极致说穿了就是个性化,即根据你个人的喜好自我调节。例如,你的智能手机在使用了一段时期后,有你的通讯录和下载的Apps,用来分外得心应手。但这些都是你手动逐渐累计的个性化成果,只能勉强说是半智能。

但如果你打算进市区,想知道堵不堵车,你可以打开手机的Waze或Google Maps来查看,好过困进车龙里才听每每来不及的电台交通报告。这些智能导航系统怎样知道的呢?他们是通过实时(Realtime)采集每一条路上的智能手机所传出的讯号的总数量并分析其密集程度而得出塞不塞车的结论。

当你的手机加上Google Now设定了明天11点在KLCC有会议,你的手机第二天还帮你收集了交通情报通知你要启程了,不然会迟到,这智能化的程度就升级了。但这些智能化的大数据分析不在你的手机里,而是在遥远的谷歌的大数据主机里头。

当庞大的个人数据可以无限量的被采集、收藏和分析,那判断的准确性就会提高。例如,通过社交网站数据,可以轻易的预测《一路有你》的票房走势,或一样新品会否受欢迎。还有,你每天在Facebook上面“写日记”,Facebook就知道了你的嗜好、政治倾向、饮食习惯等等,不难在你的Timeline发布量身订造的广告。而Twitter的其中主要收入就是靠外卖大数据给市场分析所用。

N = all

当以前个人数据无法大量和无节制的收集和分析时,企业在做市场调研只能抽样调查;通过市场问卷,先假设,设定问题,圈定受众范围,访问,分析,得出结论,从小范围预测大范围的一种科学方法。

但自从有了大数据,在N=all的时候,完全不需要再假设调研了,有一亿个受众的资料就全部倒进去分析,无需省略,免除了回答“为什么”(Why),直接给予“是什么”(What)的答案,颠覆了传统的调研方法,而整个社会也因此进入了另一场天翻地覆的改变。

老大哥在看着你



有大数据和有能力分析大数据的公司将在未来掌握智能化的发展方向。谷歌在去年底一口气买下8间研究机器人的创始公司就是一例。上个世纪末,有趋势大师说美国未来强软件,日本未来强硬件,当时会这么说是因为微软(Microsoft)是世界霸主,而日本致力于发展机器人有所成。但是,缺乏了大数据,日本的机器人只能做到自动化的功能(适合在工厂使用),在智能化方面却一片空白。而掌握大数据的美国公司,如今的特点也显露出来,任何的硬件要智能化,大数据是不可或缺的。例如,未来如果有机会养个机器人女佣,“她”当然是能很好分析你的家庭状况,知道你几点回家先调好让你洗澡的热水。

奥威尔在1948年写政治预言小说《一九八四》,其中一句“老大哥在看着你”道明铁幕政府监视着你的一举一动。现在,个人科技昌明,为了配合智能化的种种好处,个人将自己的一举一动自动送上门去了。如果把谷歌督促自己的格言“Don’t be evil”,加上《一九八四》的“The Big Brother is watching you”,就变成了督促你“别使坏,老大哥在看着你”的警句,这又何其讽刺。但是,掌握全球大数据,又有能力分析大数据的大企业,不管如何强调不使坏,都会让消费者提心吊胆。

(此为我刊登在”当今大马“的专栏文章。链接http://www.malaysiakini.com/columns/258878