位置: 首页 - 新闻 - 菁菁校园 - 正文

菁菁校园

陈刚教授城院谈大数据之禅
发布时间:2015-12-31 信息来源:宣传办公室



  12月30日下午,浙江大学计算机学院副院长、浙大城市学院大数据与电子服务研究院院长陈刚教授作客“城院大讲堂”,为师生做题为“大数据之禅”的学术报告,从内涵、技术、思维、应用案例等方面讲述了大数据的奥秘。

  何为“大数据之禅”?对于计算机这样理性精确的专业,“大数据之禅”这个标题似乎充满了诗意,陈刚解释道,“今天我所讲述的是在大数据领域的一些思考和实践。当今社会,大数据作为年度热词之一,其出现的频率不断增多,它在各行各业都体现得极为重要,这种重要性不仅仅体现在学术上,还体现在产业和经济上,大数据能够变革老产业,创新新产业。由于生产的发展,新的摩尔定律使全球数据量每18月翻一番,这一切都标志着大数据时代的到来。可以说,大数据已经成为国际信息科学的前沿研究方向。”

  陈刚提出认识事物要从三个角度:深度、宽度和时间维度,对大数据的认识也是如此。在此,陈教授特别强调了时间维度,为此讲解了四个范式分别是实验科学、理论科学、计算科学、数据密集型科学并举出形象的案例。除了科学发现的四个范式,陈刚还提到信息力量壮大的历程,即信息来自于人类社会、信息互联、信息来自于物理世界、走进大数据时代和走向大知识时代。

  大数据是极为重要的,它增长速度快、影响范围广、经济价值大,其技术也十分新颖。陈刚提到面向大数据的新型处理技术的时候还介绍了计算机体系架构,对于这个架构他是这么理解的:“像军队一样,计算机体系架构并不要求每一个人都是武林高手,只要整合在一起能够产生比原本更加强大的力量就已足够,把处理能力不那么高的电脑组织在一起,让它们产生原本没有的作用。”

  陈刚表示,大数据这种新型技术是典型的通用技术——“花粉技术”,遵循“蜜蜂模型”,由于它“传粉”,所以能对其它产业产生巨大影响,它对经济的贡献并不完全反映在大数据公司的直接收入上,而应考虑对其他行业效率和质量提升的贡献。

  在创新的大数据思维这个角度中,陈刚教授讲述了Recaptcha即利用验证码技术、Google的流感趋势预测、Decide.com即试图为顾客预测电子商品价格三方面。 三者综合,1+1+1≥3,会激发出一些非常创新的应用,对行业带来深刻改革。

  在大数据领域中有很多实践,陈刚教授列举了其中几个,海关情报和大数据驱动的在线教育等,特别是在线教育,陈教授特别看好其个性化推荐与教学内容改进方面。“在线教育真正能做到因材施教,因为每个人的观点不一样,就像刷题,每个人刷其中典型的十道题,有的时候相当于自己独自刷上千题。”

  “对于某项新技术的希望、期待或者恐惧往往使我们高估了其短期的影响,而现实经常无法满足这种膨胀的预期,因此,我们随之而来的失望让我们调转矛头,开始低估其长期意义,我可以打赌这一次的结果和上一次的结果没有什么两样。”讲座最后,陈刚教授引用了Paul Saffo评价1995年互联网的话来反思今天大数据的热潮。

  讲座最后,陈刚教授与同学之间进行了互动,有同学提问:“类似于淘宝天猫这种购物系统,每次搜索一个产品,之后打开网页时就会出现很多自己曾搜过的相关的产品,这是否是一种大数据隐私泄露的体现?”对此陈教授表示:“这种问题确实存在,关于大数据隐私保护,产业界并不真心关注,这个矛盾永远存在。现在就会出现一种‘我不知道你是谁,但是我知道你属于哪个群体’的问题,但是商家一般情况下不会泄露隐私,因为这是诚信和道德的基本要求,他们也没有主观地去针对某个人,所以不用太过担心泄露隐私的问题。但对于大数据隐私这个问题,未来还需要更多的关注。”


 

扫一扫分享本页