CTA

开始

云

是否已准备就绪?

下载 sandbox

我们能为您做什么?

关闭关闭按钮
CTA

立即开始使用 Hortonworks Sandbox

云 是否已准备就绪?

下载 SANDBOX

Hortonworks Sandbox 是一种便携式的个人 Apache Hadoop®,其生态系统环境配有几十个互动式教程,亦是 Apache 社区取得的最令人兴奋的进展。15 分钟之内将开始运行!

下载 Sandbox

概述

如果您是初次使用 Hortonworks Sandbox,且使用 Apache 开源工具用于构建现代数据应用,我们建议您使用以下教程。

Sandbox 基本资料

开始使用 HDP®

这份教程专门针对经验有限的 Sandbox 新用户,快使用它开始您的Apache Hadoop 之旅吧。
在虚拟机器和云环境中探索 Sandbox,学习使用 Apache Ambari 用户界面。

本教程提供一章内容专门介绍关键理念,还有一系列教程指导您如何将数据移至 HDFS;如何在 Apache Hive 中使用 SQL 探索数据;使用 Apache Pig 或 Apache Spark 进行转换并在最后使用 Apache Zeppelin 生成报告。

开始使用 HDP

Apache Spark 五分钟热身之旅

它会在 Apache Zeppelin 笔记本之内创建维基百科版的 RDD,从而提供 Spark 快速简介。

阅读过本教程后,您可在此处找到其他的 Spark 教程:

Apache Spark 五分钟热身

IoT 实时事件处理

Apache Hadoop 常用于处理非结构化数据、新型数据或大规模静态数据。但是,您也可处理动态数据,本教程将为您介绍 Apache Nifi、Apache Kafka、Apache Storm 和 Apache HBase 等工具。

IoT 实时事件处理

Apache NiFi 入门

NiFi 提供了数据采集、简单事件处理、传输和交付机制,旨在适应由无数互连的人、系统和事物所生成的多种数据流。在本教程中,将向您介绍 Apache NiFi 如何连接和执行流传输数据。

Apache NiFi

尝试更多教程

您可在此处找到其他教程:

Hortonworks Data Platform 2.5 新功能

parallax slide

面向数据工作者

  • 探索最新的 APIHortonworks 的新分发策略为您提供来自 Apache™ Hadoop® 社区的快速创新。现在,HDP 在同一集群中支持多种版本的 Apache Hive(1.2 和2.1)和 Apache Spark(1.6 和2.0)。

  • 交互式 SQL 速度通过Apache Hive LLAP实现交互式查询。LLAP 利用即时处理 SQL 查询的持久服务器,以智能方式将数据缓存在内中,从而在 Hadoop 上实现次秒级 SQL 分析。

  • 远程访问 Apache PhoenixApache Phoenix 现在附带了一个新的查询服务器,可让您更好地访问 Apache HBase 中存储数据以及更好地选择用于访问这些数据的开发语言。

parallax slide

对于 Hadoop 操作者

  • Advanced Visualization DashboardingAmbari 2.4 provides integrated log search and access capabilities. This enables operators to search, browse and filter their cluster operational logs for easier management. Also the integration of Grafana with Ambari brings the most important metrics front-and-center.

  • Integration of Comprehensive Security and Trusted GovernanceThe Apache Ranger and Apache Atlas integration allows enterprises to implement dynamic classification-based security policies. Using Ranger, administrators can define security policies based on Atlas metadata tags or attributes and apply this policy in real-time.

  • Streamlined Operations for Apache HBaseStreamlined backup and restore capabilities have been added to Apache HBase allowing operators to perform incremental backups. HBase operations have been simplified with improved HBase metrics in Ambari and set of pre-built dashboards.

parallax slide

For Data Scientists

  • Simplifies DevelopmentApache Zeppelin provides a secure and collaborative web-based notebook for interactive data ingestion, exploration, and visualization for Apache Spark, Apache Hive and Apache Phoenix.

  • Seamless Data AccessImproved Apache Spark access to Apache Hive and Apache HBase. The Spark-HBase connector leverages Data Source API (SPARK-3247) introduced in Spark-1.2.0.

  • Apache Spark 2.0The most notable improvements in Apache Spark 2.0 are in the areas of API, Performance, Structured Streaming and SparkR. Achieve higher performance through a new Dataset API which is an extension of DataFrame API and also supports compile-time type checking.

Hortonworks Sandbox(在云中)

Hortonworks Sandbox(在云中)

探索可帮助您在最低系统需求的情况下开始使用 Hadoop 的云提供商。
了解更多
Hortonworks Sandbox(在 VM Download 上)

不需要数据中心,不需要云服务,也不需要网络连接!完全控制环境。使用额外组件实现轻松扩展,或尝试不同的 Hortonworks 技术预览。始终更新至最新版本。

尝试在 Azure 上使用 Hortonworks Sandbox。

Azure 提供在最低系统需求的情况下使用 Hadoop 的简单方法。如果您的个人机器无法满足本地运行的最低系统要求,它就是一个绝佳的解决方案。