hive

在 Apache Hive 中轻松生存的12个技巧

Hive 可以让你在 Hadoop 上使用 SQL,但是在分布式系统上优化 SQL 则有所不同。这里是让你可以轻松驾驭 Hive 的12个技巧。Hive 并不是关系型数据库(RDB…

60 TB 数据:Facebook 是如何大规模使用 Apache Spark 的

Facebook 经常使用数据驱动的分析方法来做决策。在过去的几年,用户和产品的增长已经需要我们的分析工程师一次查询就要操作数十 TB 大小的数据集。我们的一些批量分析执行在古老的…

Hive SQL底层执行过程详细剖析

HiveHive是什么?Hive 是数据仓库工具,再具体点就是一个 SQL 解析引擎,因为它即不负责存储数据,也不负责计算数据,只负责解析 SQL,记录元数据。Hive直接访问存储…

从 Hive 到 OceanBase,构建高效的实时数仓系统

我们的业务场景与出行息息相关,由于业务早期采用的数仓方案存在时延高、效率低等问题,我们开始寻找新的数仓解决方案。本文介绍我们的方案选型与实践经验总结,希望能给你带来参考价值。旧方案…

Centos7安装配置Hive教程。

当在CentOS 7上安装和配置Hive时,可以按照以下步骤进行操作: 确保已安装Java:首先,确保在CentOS 7上已经安装了Java。可以使用以下命令检查Java是否已安装…

怎么查看hive和mysql的连接

Hive和MySQL是两种不同的数据库管理系统,它们之间是可以建立连接的。在实际使用中,需要查看连接的状态,以下是具体的方法。1.查看Hive与MySQL是否连接$ hive hi…

怎么把数据从hive导入mysql

大家好,今天我来给大家介绍一下如何把数据从hive导入mysql。首先,我们需要在hive中查询到要导出的数据,使用以下命令:SELECT * FROM table_name;接着…

MySQL 到 TiDB:vivo 的 Hive Metastore 横向扩展之路

以下文章来源于公众号 vivo 互联网技术 ,作者 Wang Zhiwen 导读 本文介绍了 vivo 在大数据元数据服务横向扩展道路上的探索历程,由实际面临的问题出发,对当前主流…

配置Hive使用Spark执行引擎

Hive引擎 概述 在Hive中,可以通过配置来指定使用不同的执行引擎。Hive执行引擎包括:默认MR、tez、spark MapReduce引擎: 早期版本Hive使用MapRe…

【最佳实践2个步骤教你从Mysql同步到Hive

【实现简单的逻辑】Mysql数据同步到Hive,大致流程如下:分为离线和实时两部分,我们先实现离线,需要以下内容:Flink,SeaTunnel,Mysql,Hive,Hadoop…

ByConity 技术详解之 Hive 外表和数据湖

作者:Liu Cao 随着大数据处理需求的不断增加,更低成本的存储和更统一的分析视角变得愈发重要。数据仓库作为企业核心决策支持系统,如何接入外部数据存储已经是一个技术选型必须考虑的…

MySQL到TiDB:Hive Metastore横向扩展之路

作者:vivo 互联网大数据团队 - Wang Zhiwen 本文介绍了vivo在大数据元数据服务横向扩展道路上的探索历程,由实际面临的问题出发,对当前主流的横向扩展方案进行了调研…

十分钟掌握Doris,超越Hive、Elasticsearch和PostgreSQL

以前,数据仓库通常由Apache Hive、MySQL、Elasticsearch和PostgreSQL组成。它们支持数据仓库的数据计算和数据存储层:数据计算:Apache Hiv…

如何使用Java开发一个基于Hive的数据仓库应用

如何使用Java开发一个基于Hive的数据仓库应用引言:在当今大数据时代,数据仓库是企业存储和处理海量数据的重要工具。Hive作为Hadoop生态系统中的一员,提供了数据仓库解决方…

怎么验证hive和MySQL的连接

在使用Hive时,有时需要直接连接MySQL数据库进行数据操作。但在进行连接之前,需要先验证Hive和MySQL的连接是否成功。以下是验证步骤:1.启动Hive之后,使用“!”进入…

hive表数据更新merge into

​ 背景: 根据甲方要求,需要对大数据平台指定表(hive、impala表)的历史数据[2021-01-01至2023-03-29]指定字段进行批量更新,然后把表同步到Oracle…

从源代码编译构建Hive3.1.3

编译说明 使用Hive官方提供的预编译安装包是最常见和推荐的方式来使用Hive,适用于大多数用户。这些预编译的安装包经过了测试和验证,在许多不同的环境中都能正常运行。 在某些特定情…

基于idea操作hbase数据库并映射到hive表

目录一:先关闭所有服务二:配置文件三:启动服务依赖条件:需要有hadoop,Hive,ZooKeeper,HBase环境 映射:每一个在 Hive 表中的域都存在于 HBase 中…

Hive实现简单快捷的HDFS数据库删除 (hive删除hdfs中的数据库)

在Hadoop生态系统中,Hive是一个基于HDFS(Hadoop分布式文件系统)的数据仓库解决方案,用于数据的存储和分析。然而,当我们需要删除Hive中的一些数据时,可能会对HD…

Hive数据库默认密码及其修改方法 (hive数据库默认密码)

Hive数据库是Apache Hadoop项目的一个分支,提供了一种将结构化数据映射到Hadoop分布式文件系统中的机制。它允许用户通过SQL查询Hadoop数据源,并将结果转换为…

加载更多