CTA

开始

云

是否已准备就绪?

下载 sandbox

我们能为您做什么?

关闭关闭按钮
CTA

企业 Spark 大数据大规模解决方案

Hortonworks 提供用于企业部署的 Spark

云 是否已准备就绪?

下载 SANDBOX

概述



Hortonworks 正在面向企业规模发挥 Apache Spark 的能力,统一了开放企业 Apache Hadoop® 的能力和 Apache Spark 的内存中分析能力以最大程度提高组织价值。

Spark 作为平台的一部分会更好
Spark 经过了 YARN-ready 认证,属于 Hortonworks Data Platform。内存和 CPU 密集型的基于 Spark 的应用程序可以与支持 YARN 的集群中部署的其他工作负载共存。Spark 具备对外部数据源的一流支持,可以直接在 YARN 中的集群上运行,并且企业也希望在 YARN 中执行数据分析。这种方法无需创建和管理专用的 Spark 集群,并且可以在单个集群中更高效率地使用资源。

Spark 需要企业级安全性和管制
作为 HDP 平台的一部分,Spark 可以和 HDP 堆栈的其他组件一样访问相同的管制、安全性和管理策略。Spark 是大数据生态系统中一个快速发展的项目,其库的成熟度各有不同。 Hortonworks 调查、验证、认证,然后支持 Spark 项目的中的每个组件。此方法是我们为客户带来价值的关键。

记事本使 Spark 和数据科学更加易于使用和分享
基于 Web 的记事本为 Hadoop 和 Spark 带来了数据提取、探索、可视化、共享和协作能力。Hortonworks 正在对 Apache Zeppelin 进行大规模投资,我们计划通过增加安全性、稳定性、R 支持和易用性来使 Zeppelin 可用于生产环境。


通过交付统一的 Apache Spark 和 Hadoop,我们将 Spark 驱动的敏捷分析工作流程与 Hadoop 的海量数据集和经济性相结合。借助 Hortonworks,企业可以使用行业最佳安全性、管制和运营能力来部署 Apache Spark。

Hortonworks 对 Spark 的投入如何?

随着 Spark 1.6 的发布,Hortonworks 承诺帮助客户加速数据科学,维护无缝数据访问以及驱动核心创新。

Spark 作为开放企业 Hadoop 的一部分,使组织可以针对企业价值扩展 Spark。

管理员

数据科学加速

通过增强Apache Zeppelin 以及贡献其他 Spark 算法和软件包来简化关键解决方案的部署,从而提高数据科学生产力。

例如:麦哲伦项目 - Apache Spark 中的地理分析学,一个面向地理分析的开源库,可便于地理空间查询,其基于 Spark,可解决处理大规模地理空间数据的棘手难题。

管理员

无缝数据访问

Spark SQL 提供 SQL 和数据帧 API 以访问结构化数据,而 Spark Streaming 则使开发者可以轻松构建五个实时数据流的可扩展、高吞吐量、容错性流处理。

Hortonworks 一直在改善 Spark 与 YARN、HDFS、Hive、HBase 和 ORC 集成。特别是,我们认为我们可以通过新的数据源 API 进一步优化数据访问。

管理员

核心创新

使用 HDFS 内存层实现 RDD 共享

贡献其他机器学习算法

增强 Spark 的企业安全性、管制、操作和就绪性

CTA

要详细了解全部激动人心的 Spark 创新,

查看我们的 Apache Spark 页面。

查看页面

如何开始使用 Apache Spark at Scale?

收听我们最新的网络研讨会 - 包含 Hadoop 的 Spark at Scale