施普林格大数据开放期刊最近发表了一篇关于数据立方体技术和功能的全面、系统的概述。前所未有的19种不同工具的阵容根据30+标准进行审查。
性能数据已经在一个系统的、github发布的比较rasdaman、Open Data Cube、SciDB和PostGIS光栅的基准测试中获得。结果表明,rasdaman可以比其他工具快304倍。Eurac Research已经独立证实了这一点,与开放数据立方体相比,平均速度甚至提高了400倍。
阅读更多:
https://journalofbigdata。
https://gitlab.inf.unibz.it/
过去的论文已经比较了数据立方体模型和形式,并且已经进行了基准测试。然而,通常情况下,它们是相当受限的——只有两个系统被比较,并且测试主要是由精心挑选的示例驱动的,而不是系统的、合理的方法。这些都代表着有价值的研究;然而,就我们所知,目前还没有结合模型、访问接口、体系结构、实际可用性和性能评估的全面调查。这种比较的规模也区分了19个系统的比较,其中四个基准的程度和深度明显超过了该领域以前的论文;例如,子集测试的设计方式使系统不能专门针对这些查询进行调优。希望本文为所有想要深入该领域的人提供了一个有代表性的概述,并为那些需要为其应用选择最适合的数据立方体工具的人提供了明确的指导。本文介绍了研究数据联盟(RDA)阵列数据库评估工作组(ADA:WG)的结果,这是RDA大数据兴趣小组的一个子小组。它引出了由IEEE GRSS和CODATA德国支持的阵列数据库和相关技术的最新技术,以回答这个问题:数据科学家和工程师如何从阵列数据库技术(通常称为“数据立方体”引擎)中受益?