讲座编号:jz-yjsb-2016-y038
讲座问题:面向开源生态的大规模数据治理手艺研究
主 讲 人:查礼 副研究员 中国科学院盘算手艺研究所
讲座时间:2016年5月21日(周六)下昼14:00
讲座所在:紫玉饭店紫金楼一层聚会室
加入工具:盘算机学院西席与研究生
主理单位:研究生院
承办单位:食物清静大数据手艺北京市重点实验室
主讲人简介:
查礼,男,中国科学院盘算手艺研究所,副研究员。2003年博士结业进入中科院盘算以是来一直从事漫衍式系统的研发事情。作为课题认真人肩负过多项国家863重大专项、863国际相助、发改委专项和欧盟第六框架(FP6)国际相助课题。自2008年最先,向导研究小组与Apache Hadoop 开源社区相助,向Apache Hive开源项目孝顺了“行列混淆式存储结构”—RCFile手艺和实现代码,该手艺已被Facebook、Yahoo!、阿里巴巴等公司接纳。作为“互补式聚簇索引手艺”--CCIndex的发明人之一,将该手艺应用到淘宝网的“数据魔方”产品中,用以支持实时多维区间盘问。提倡并组织“Hadoop in China”(现已更名为中国大数据手艺大会)大会,使之成为海内专注于大数据手艺最具影响力的聚会之一。自己的研究兴趣包括漫衍式系统以及大规模数据盘算手艺等。相关效果已揭晓高质量论文数十篇,曾两次获国家科技前进二等奖(2007、2012)。主讲内容:
数据规模的爆炸性增添为数据治理与处置惩罚带来了很大的问题。数据的价值密度变低了,导致在同样时间内获取与以前相同价值的数据变得不可为了。因此催生了许多新型数据处置惩罚手艺和工具,如Google的GFS和MapReduce,Apache Hadoop生态系统,美国伯克利大学AMPLab的Spark等。本讲座将从大规模数据处置惩罚需求的角度剖析古板数据库治理系统面临的手艺挑战;剖析目今主流大数据生态、系统组成和手艺原理;先容相关的大数据治理要害手艺研究,并通过一些现实案例说明这些要害手艺的适用场景和应用效果。