Hadoop

hive架构、优势、使用场景、在hadoop生态系统的位置

hive在hadoop生态系统的位置在讲解hive的架构前,我们先看一下hadoop的生态系统图,看一下hive到底在hadoop生态系统中占据着什么位置。这张图上所有的框架我们在…

腾讯 CSIG 应用研究员万字解读 Spark 部署与工作原理

一、Spark 概述Spark 是 UC Berkeley AMP Lab 开源的通用分布式并行计算框架,目前已成为 Apache 软件基金会的顶级开源项目。Spark 支持多种编…

Hadoop时代或将落幕,Cloudera将被私有化

北京时间 6 月 1 日晚,据 TechCrunch 报道,KKR和CD&R将以53亿美元收购Cloudera,Cloudera将被私有化。截止到本文发稿,11 点 49 …

Hive0.13.1介绍及安装部署

一、简介 hive由Facebook开源用于解决海量结构化日志的数据统计。hive是基于Hadoop的一个数据仓库工具,是基于Hadoop之上的,文件是存储在HDFS上的,底层运行…

在Hadoop集群环境中为MySQL安装配置Sqoop的教程

Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoo…

在 Ubuntu 的 Hadoop 多节点集群中设置 HBase

  在本文中,我们将在 Hadoop 的多节点集群中设置 HBase。 先决条件: ubuntu 中的 Hadoop 多节点集群设置,具有1 个主节点和 2 个从节点。 …