当前位置:

MapReduce: 一个巨大的倒退

397 views2009-12-20无人留言

databasecolumn 的数据库大牛们(其中包括PostgreSQL的最初伯克利领导:Michael Stonebraker)最近写了一篇评论当前如日中天的MapReduce 技术的文章,引发剧烈的讨论。

1 月8日,一位Database Column的读者询问我们对各种新的分布式数据库研究工作有何看法,我们就从MapReduce谈起吧。现在讨论MapReduce恰逢其时,因为最近商业媒体充斥着所谓”云计算(cloud computing)”革命的新闻。这种计算方式通过大量(低端的)并行工作的处理器来解决计算问题。实际上,就是用大量便宜货(原文是jelly beans)代替数量小得多的高端服务器来构造数据中心。

例如,IBM和Google已经宣布,计划构建一个1000处理器的集群,开放给几个大学,教授学生使用一种名为MapReduce [1]的软件工具对这种集群编程。加州大学伯克利分校甚至计划教一年级新生如何使用MapReduce框架编程。

我们都既是教育者也是研究人员,MapReduce支持者们大肆宣传它代表了可伸缩、数据密集计算发展中的一次范型转移,对此我们非常惊讶。MapReduce就编写某些类型的通用计算程序而言,可能是个不错的想法,但是从数据库界看来,并非如此:

1. 在大规模的数据密集应用的编程领域,它是一个巨大的倒退
2. 它是一个非最优的实现,使用了蛮力而非索引
3. 它一点也不新颖–代表了一种25年前已经开发得非常完善的技术
4. 它缺乏当前DBMS基本都拥有的大多数特性
5. 它和DBMS用户已经依赖的所有工具都不兼容

 
类别:
除非特殊说明,本站文章均为鹏讯科技版权所有,转载请注明出处。
如本站引用的文字、图片、其它媒体等侵犯了您的权益,请及时告知,我们将会在第一时间删除。

发表评论:

姓名:

邮件:

网址:


当前用户: validated XHTML 1.0 - CSS 3 - Section 508 - PR
Copyright © 2005-2010 陕西鹏讯科技 版权所有