前 言 大数据学习路线 大数据技术栈思维导图 大数据常用软件安装指南 一、Hadoop 分布式文件存储系统:HDFS 分布式计算框架:MapReduce 集群资源管理器:YARN 单机伪集群环境搭建 集群环境搭建 常用 Shell 命令 Java API 的使用 基于 Zookeeper 搭建 Hadoop 高可用集群 二、Hive 简介及核心概念 Linux 环境下 Hive 的安装部署 CLI 和 Beeline 命令行的基本使用 常用 DDL 操作 分区表和分桶表 视图和索引 常用 DML 操作 数据查询详解 三、Spark Spark Core Spark SQL Spark Streaming 五、Flink 核心概念综述 开发环境搭建 Data Source Data Transformation Data Sink 窗口模型 状态管理与检查点机制 Standalone 集群部署 六、HBase 简介 系统架构及数据结构 基本环境搭建 集群环境搭建 常用 Shell 命令 Java API 过滤器详解 可显示字数有限,详细内容请看资源。
2023-12-20 09:06:41 20.75MB kafka kafka zookeeper zookeeper
1
Sqoop是一个用于在Hadoop和关系数据库或大型机之间传输数据的工具。您可以使用Sqoop将关系数据库管理系统(RDBMS)(如MySQL或Oracle或大型机)中的数据导入Hadoop分布式文件系统(HDFS),转换Hadoop MapReduce中的数据,然后将数据导出回RDBMS 。
2023-03-30 09:10:53 24KB sqoop 学习笔记
1
Hadoop hbase hive sqoop集群环境安装配置及使用文档
2023-03-01 11:02:31 133KB 大数据集群 hadoop hbase hive
1
正如标题所述,这是一个介绍sqoop原理及工作流程等概念的专业文档
2023-02-13 09:22:29 363KB sqoop大数据
1
出现此问题时使用:java.lang.NullPointerException at org.json.JSONObject.(JSONObject.java:144) at org.apache.sqoop.util.SqoopJsonUtil.getJsonStringforMap(SqoopJsonUtil.java:43) at org.apache.sqoop.SqoopOptions.writeProperties(SqoopOptions.java:784) at org.apache.sqoop.mapreduce.JobBase.putSqoopOptionsToConfiguration(JobBase.java:392) at org.apache.sqoop.mapreduce.JobBase.createJob(JobBase.java:378) at org.apache.sqoop.mapreduce.ImportJobBase.runImport(ImportJobBase.java:256) at org.apache.sqoop.manager.SqlManager.importQuery(SqlManager.java:748) at org.apache.sqoop.tool.ImportTool.importTable(ImportTool.java:515) at org.apache.sqoop.tool.ImportTool.run(ImportTool.java:621) at org.apache.sqoop.Sqoop.run(Sqoop.java:147) at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70) at org.apache.sqoop.Sqoop.runSqoop(Sqoop.java:183) at org.apache.sqoop.Sqoop.runTool(Sqoop.java:234) at org.apache.sqoop.Sqoop.runTool(Sqoop.java:243) at org.apache.sqoop.Sqoop.main(Sqoop.java:252)
2023-01-05 11:51:26 80KB hbase
1
sqoop1 import 时报错Exception in thread "main" java.lang.NoClassDefFoundError: org/json/JSONObject。下载后,然后放到sqoop/lib目录即可。
2022-12-29 16:59:02 80KB sqoop
1
运行Sqoop报错:Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/avro/Logical 将avro-1.8.1.jar包放到Sqoop的lib目录下,问题解决。
2022-11-29 20:36:44 1.12MB sqoop
1
java连接sqoop源码#PURPOSE Customer Solutions 需要一种工具来将数据库架构从第三方数据库供应商迁移到 Splice Machine。 此工具使用 JDBC 连接连接到第三方数据库(Oracle 和 SQL Server)和(可选)Splice Machine。 另外,这个工具有两个java文件,可用于为运行sqoop/splice export/import过程和splice import过程的结果生成CSV文件。 迁移工具非常灵活,因此提供了许多进行迁移的选项。 迁移可以使用中间文件完成,也可以使用直接数据库连接完成。 建议使用中间脚本,以便它们可以根据需要重新执行。 #特征 为模式、表、用户、外键、序列和索引创建与 Splice Machine 兼容的 DDL 脚本 **- 导出所有模式的对象或仅导出特定模式 **- 在处理模式时能够包含或排除某些表 **- 导出表列默认值 **- 导出用户 **- 能够导出检查约束 **- 特定列数据类型映射 - 适用于 Oracle DATE 数据类型或 NUMBER 字段 创建与 Splice Machine
2022-11-17 11:49:52 104KB 系统开源
1
Sqoop是专门用来迁移数据的,它可以把数据库中的数据迁移到HDFS文件系统,当然也可以从HDFS文件系统导回到数据库
2022-11-11 20:58:09 17.15MB sqoop hadoop
1
内含:Hadoop、Sqoop、Zookeeper 实验目的: 验证利用sqoop把数据 从 mysql 导入到 hdfs 1.下载实验所需软件包 2.在centos7安装mysql 3.在centos7安装hadoop伪分布式 4.安装sqoop,配置sqoop 5.验证sqoop数据导入
2022-11-03 12:00:32 1.1MB hadoop sqoop zookeeper mysql
1