谷歌在Hadoop和Spark的托管服务上打开beta版

Google在Beta中推出了一种新的云服务,旨在简化Hadoop和Spark的数据分析。

CloudDataproc是通过GoogleCloud平台提供的托管服务,面向希望自动化管理数据集群的开源用户。

谷歌云平台产品经理詹姆斯·马龙(James Malone)在一篇关于这项新服务的博客文章中写道:“Coud Dataproc自动化帮助您快速创建集群,轻松管理它们,并通过在不需要集群时关闭集群来节省成本。”“用更少的时间和金钱在管理上,你可以专注于你的工作和数据。”

该服务与其他云平台(如AmazonWebServices和MicrosoftAzure)上已经提供的服务相似,因此Google的平台基本上只是在追赶。但该公司正努力保持价格上的竞争力。

CloudDataproc在集群中每小时每虚拟CPU花费1美分。集群还可以包括具有更低计算价格的可抢占的实例,从而进一步降低成本。当许多提供商将使用量汇总到最近的一个小时时,CloudDataproc使用逐分钟计费和10分钟最低计费时间。

谷歌表示,在没有管理员或特殊软件的帮助下,公司可以使用火花和Hadoop集群。相反,它们可以通过Google开发人员控制台、GoogleCloudSDK或CloudDataprocRESTAPI与群集和火花或Hadoop作业进行交互。当集群不再使用时,它可以被关闭以避免不必要地花费金钱。

云Dataproc与Google的其他云服务集成在一起,包括BigQuery、CloudStorage、CloudBigTable、CloudLogging和CloudMonitor。CloudDataproc的当前实现具有基于Spark1.5和Hadoop2.7.1的集群功能。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。