【掘金大数据时代】 大数据时代掘金之道

  当前,呈爆炸式增长的数据——大数据已成为一种越来越重要的资源,各方关注的热度也逐渐升温。《纽约时报》曾撰文称:“大数据正在对每个领域都造成影响,在商业、经济和其他领域中,决策行为将日益基于数据分析做出,而不是像过去更多凭借经验和直觉。”可见,对大数据的分析、预测等应用俨然已成为了人们眼中的金矿。全球知名的企业如IBM、谷歌等已经抢占先机提前布局了大数据战略。而在这样一个数字泛在、信息飞速流动的时代,各个领域也有许多机会来拓展大数据的新应用和新商业模式。不仅如此,政府同样也充分认识到了大数据应用的价值。
  领先企业引领大数据潮流
  IBM在引领大数据潮流中走在了前头。早在1958年,作为信息产业的蓝色巨人IBM就提出了“商业智能”的概念。从2009年开始,IBM大举收购在智能分析方面具有“一技之长”的多家企业,建立了专门的数据分析中心,将战略布局从传统商业智能转移到了更高级的大数据应用上。其中,最为典型的例子要数IBM在人工智能方面开发的“沃森”机器人。“沃森”在2011年美国智力竞猜节目《危险边缘》中击败了人类,这要归功于沃森对海量信息进行分析处理并作出预测的能力。如今,沃森的这种能力无疑具有更大的商业价值。目前,美国第三大银行花旗集团已成为沃森的首位金融领域客户。沃森可以处理各种金融、经济和用户数据,分析用户需求,实现个性化服务;沃森也可以快速阅读和理解企业年报,帮助金融机构开展投资风险管理。
  除了IBM,像惠普、甲骨文等IT界巨头也纷纷斥巨资并购了多家大数据相关企业。在2010~2011年间,惠普总共以超过143.5亿美元的价格先后收购了3PAR公司、Vertica公司和Autonomy公司。其中,3PAR公司以虚拟化存储见长,惠普的3PAR方案将在公共存储领域具有创新优势;Vertica公司专注于实时分析和数据管理,该技术将帮助惠普提高对大量复杂数据进行实时商业分析的能力;Autonomy则是一家英国软件公司,其开发的软件可以增强惠普在非结构化数据搜索方面的实力。甲骨文则在2011年10月收购了Endeca公司,之后,甲骨文有了一个更加先进的企业数据管理平台,使得企业用户能够访问、储存、管理、搜索和分析结构化和非结构化的大数据。
  谷歌公司可以说是拥有大数据的超级大户,它与IBM等不同之处在于能够充分结合自己掌握着最大网络搜索用户群这一优势,将大数据分析用于解决社会问题,以及运用“集体智慧”方式涉足环境保护等科学技术领域。例如,“谷歌趋势”就是将全球用户搜索行为的数据用来观察社会趋势的一个开放应用,而其中更加专业的“流感趋势”则使用复杂的算法,跟踪有关流感的网络搜索行为,其展示的曲线与美国疾病控制中心耗用大量资源得出的疑似流感就诊曲线非常拟合,而且时差大大缩小。
  各主要领域受益大数据智慧
  商业智能领域是大数据应用最成熟,也是最大的市场。其中,世界零售业大亨沃尔玛就受益其中,沃尔玛通过对日常交易数据、消费者购物行为、甚至灾害气候等结构化和非结构化数据的关联,从而创造了“啤酒与尿布”等经典商业案例。另一家美国电子商务公司亚马逊与沃尔玛在实体零售数据方面的分析应用不同,其主要根据浏览过的网页和曾经购买的商品来挖掘用户的兴趣爱好和消费习惯。除了大企业在这一领域的开拓性实践外,也有如Netflix等中小企业对大数据的创新应用。Netflix是一家在线网络视频点播互联网公司。人们可以在Netflix的网站上观看各种影视剧,进行搜索和打分。Netflix网站不仅记录下了用户点播的剧集、每次快退快进及暂停的操作,还尝试收集用户的地理位置和使用设备的数据,并且还从Facebook等网站获得相关社交媒体的数据。Netflix通过采集和分析这些海量数据来推算出下一步用户想要看什么电影。目前其网站用户所选择的电影已经有75%来自Netflix的推荐。根据美国市场研究公司IHS测算,2011年Netflix在美国的在线电影收入已经超过苹果公司,市场份额达到了45%。在中国,自有服装品牌凡客开始根据不同的主题寻找各种数据之间的关联,建立起有效的数据分析辅助商业管理的机制。另外,阿里巴巴也利用淘宝网上的中小企业交易数据来筛选诚信企业,为其提供无担保贷款,事实证明,这些企业的坏账率仅为0.9%。
  金融是另一个利用大数据产生价值的重要领域。金融服务类企业不仅可以通过对大数据的挖掘和分析提高自身的竞争实力、改善用户体验、监督金融欺诈行为、验证合规性,还可以通过大数据对金融市场进行预测,抓住投资先机。例如,华尔街有家名叫“德温特资本市场”的公司,利用软件程序公司分析了全球3.4亿微博账户的留言,用以判断民众的情绪,据此来处理手中的股票。基于大数据分析他们得出结论:人们高兴时会买股票,而焦虑时就会抛售。据此进行经营,该公司在今年第一季度获得了7%的收益率。
  医疗健康也是大数据应用的热点。基于电子病历的普及、基因研究以及制药工程中对于大型数据库的应用,拥有大规模复杂性数据集在医疗机构中变得很普遍。通过使用大数据分析工具对大量病人的数据进行分析,医学研究者能够更有效地找出疾病成因,进而提供有针对性的预防、诊断和治疗措施。加拿大多伦多市儿童医院的新生儿重症监护病房目前正在使用大数据分析平台实时处理数据,用来更精准地预测早产儿出现疾病和感染的风险。医院通过电子设备监测、收集和分析早产儿的体温、心率、血氧饱和浓度和血压水平等数据,在早产儿病情出现明显的临床症状之前提前预测病症的发生。
  政府开放姿态支持大数据应用
  这两年,以美英为代表的西方各国政府都建立起了自己的数据门户网站,将采集的各类民生数据放在网上与全民共享。这一“数据开放”运动催生了一系列对公开数据的应用热潮。例如,微软公司就利用奥巴马政府推出的退伍军人医疗健康数据公开项目开发了一款新的在线平台,来帮助用户管理自己和家人的数据。最近,另有一则新闻报道了一位13岁的以色列少年利用政府公开的导弹防御预警信息,开发了一款免费手机应用,当加沙地带向以色列南部发射导弹的时候,应用系统就会给手机发送警报。更进一步,除了政府公开数据的应用外,英国政府也鼓励商业数据的公开,提出了名为“我的数据”的计划。在英国商业部的主导下,巴克莱信用卡、汇丰银行等十多家不同行业的巨头已经加入了“我的数据”行动,对客户开放与其相关的数据。第三方可以就这些数据设计出专业的算法,为客户提供更多更好的服务。由此可见,政府和企业的数据开放行动开创了一种全新的大数据应用商业模式,为经济发展带来了新的增长点,并提供了新的就业机会。在保障数据安全和个人隐私的前提下,对这些公开数据的应用不仅使沉睡多年的大量数据被利用起来创造价值,而且还能发挥众人的智慧将这些取之于民的数据重新用之于民,以实现更大的社会效益。
  从上文可以看到,行业交叉和数据公开正是大数据这座宝矿能够散发出无穷魅力的所在。而对我国未来的大数据应用发展来说,在掘金大数据之前,还需要破除几道障碍,比如打破行业垄断、开放政府数据、加强信息共享,这远比开发几个软件、做几个试点来得重要。
  (作者为上海科学技术情报研究所信息分析师)

推荐访问:掘金 时代 数据