Hive表操作

news/2024/4/24 18:47:08/

插入数据sql、导出数据sql
    1.insert 语法格式为:
    基本的插入语法:
   

 INSERT OVERWRITE TABLE tablename [PARTITON(partcol1=val1,partclo2=val2)]select_statement FROM from_statementinsert overwrite table test_insert select * from test_table;

    对多个表进行插入操作:
   

 FROM fromstatteINSERT OVERWRITE TABLE tablename1 [PARTITON(partcol1=val1,partclo2=val2)]select_statement1INSERT OVERWRITE TABLE tablename2 [PARTITON(partcol1=val1,partclo2=val2)]select_statement2from test_table                     insert overwrite table test_insert1 select keyinsert overwrite table test_insert2select value;

    insert的时候,from子句即可以放在select 子句后面,也可以放在 insert子句前面。
    hive不支持用insert语句一条一条的进行插入操作,也不支持update操作。数据是以load的方式加载到建立好的表中。数据一旦导入就不可以修改。

    2.通过查询将数据保存到filesystem
 

   INSERT OVERWRITE [LOCAL] DIRECTORY directory SELECT.... FROM .....

    导入数据到本地目录:
   

insert overwrite local directory '/home/tt/hive' select * from test_insert1;


    产生的文件会覆盖指定目录中的其他文件,即将目录中已经存在的文件进行删除。

    导出数据到HDFS中:
   

 insert overwrite directory '/user/tt/export_test' select value from test_table;

    同一个查询结果可以同时插入到多个表或者多个目录中:
   

 from test_insert1insert overwrite local directory '/home/tt/hive' select * insert overwrite directory '/user/tt/export_test' select value;

 创建表sql

create table vt_test (id String,cc decimal(20,0))
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '|';INSERT INTO TABLE vt_test select 2,1234567890123456 from dual;
select * from vt_test;ROW FORMAT DELIMITED
FIELDS TERMINATED BY ‘\t’
LINES TERMINATED BY ‘\n’
STORED AS TEXTFILE;load data local inpath '/tmp/VT_TP_846108_inc.txt' into table vt_test;
select * from vt_test limit 5;

 空值处理

CREATE TABLE hive_tb (id int,name STRING)PARTITIONED BY ( `day` string,`type` tinyint COMMENT '0 as bid, 1 as win, 2 as ck', `hour` tinyint)ROW FORMAT DELIMITED NULL DEFINED AS '' STORED AS TEXTFILE;


http://www.ppmy.cn/news/46602.html

相关文章

4.34、组播(多播)

4.34、多播 1.组播(多播)的介绍①组播地址②如何设置组播(组播的使用) 2.代码编写①服务端②客户端 1.组播(多播)的介绍 单播地址标识单个 IP 接口,广播地址标识某个子网的所有 IP 接口,多播地址标识一组 IP 接口。单播和广播是寻…

Java每日一练(20230416)

目录 1. 三数之和 🌟🌟 2. 基本计算器 🌟🌟🌟 3. 通配符匹配 🌟🌟 🌟 每日一练刷题专栏 🌟 Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏 Java…

ubuntu输入法问题汇总

Xfce4桌面环境输入法 Ubuntu20.04、ubuntu21.04中安装xfce4桌面环境,自带中文输入法; 原生xubuntu20.04中文输入法问题解决办法: 更新语言支持失败的话,终端键入:sudo apt-get install cmake qt5-default qtcreator…

在Github中77k星的王炸AutoGPT,会独立思考,直接释放双手

文章目录 1 前言1.1 什么是AutoGPT1.2 为什么是AutoGPT 2 AutoGPT部分实例2.1 类似一个Workflow2.2 市场调研2.3 自己写播客2.4 接入客服 3 安装和使用AutoGPT3.1 安装3.2 基础用法3.3 配置OpenAI的API3.4 配置谷歌API3.5 配置Pinecone API 4.讨论 1 前言 迄今为止&#xff0c…

Java基本类型和包装类型int和Integer

Java基本类型和包装类型int和Integer 基本类型和包装类型的区别使用中的问题 基本类型和包装类型的区别 Java中的数据类型可以分为两种:基本类型(Primitive Type)和包装类型(Wrapper Class)。这两者之间也有几个区别&…

【UE4】关卡流送的demo

关卡流送功能可以将地图文件加载到内存中,或者从内存中卸载,并在游戏过程中切换地图的可视性。 这样一来,场景便能拆分为较小的地图块,并且只有相关部分才会占用资源并被渲染。 正确设置后,开发者便能创建大型、无缝衔…

面试题:Ajax、Fetch、Axios三者的区别

Ajax 它的全称是:Asynchronous JavaScript And XML,翻译过来就是“异步的 Javascript 和 XML”。 Ajax 是一个技术统称,是一个概念模型,它囊括了很多技术,并不特指某一技术, Ajax 是一种思想,X…

java的泛型

1. 泛型是什么 ​ Java泛型是J2 SE1.5中引入的一个新特性,其本质是参数化类型,也就是说所操作的数据类型被指定为一个参数(type parameter), 这种参数类型可以用在类、接口和方法的创建中,分别称为泛型类、泛型接口、…

Dell Inspiron 5570电脑 Hackintosh 黑苹果efi引导文件

原文来源于黑果魏叔官网,转载需注明出处。(下载请直接百度黑果魏叔) 硬件型号驱动情况 主板Dell Inspiron 5570 处理器Intel(R) Core(TM) i7-8550U CPU 1.80GHz已驱动 内存8 GB 2400 MHz DDR4已驱动 硬盘samsung ssd 850 evo 250 go已驱…

数据结构——排序

排序 一、排序的概念二、直接插入排序希尔排序 三、直接选择排序四、堆排序1、堆的概念2、堆排序 五、冒泡排序六、快速排序七、归并排序八、基数排序排序算法的时间复杂度和空间复杂度 一、排序的概念 课本概念(P165) (1)内部排序。内部排…

实现3D动画

一、transform Transform是形变的意思(通常也叫变换),transformer就是变形金刚 常见的函数transform function有: 平移:translate(x, y) 缩放:scale(x, y) 旋转:rotate(deg) 倾斜:sk…

TensorFlow 和 Keras 应用开发入门:1~4 全

原文:Beginning Application Development with TensorFlow and Keras 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自【ApacheCN 深度学习 译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。 不要担心自己的形…

移动端树形结构

该组件依据需求来做,当前包含三种选择状态,选中,未选中,半选。由于不需要做树形的收缩展开故没有写相关内容。树形展开与收缩与选中类似,只需要在节点上挂载相关字段即可实现。由于需求需要增加不限的功能,…

Java基础 泛型

问题1. B继承A 为什么 List<B> 不能赋值给List<A> 假设有如下代码 class A{} class B extends A{}List<B> b new ArrayList<>(); List<A> a b; // 编译报错List<A> List<B> 在运行时泛型被抹除&#xff0c; 都是List类型&#…

Git使用

1、git bash here 2、git init 初始化; 2.1、配置信息 git config --global user.email "421018843qq.com" git config --global user.name "pql" 3、git status 检测当前目录下文件的状态 三种颜色状态&#xff1a; 红色&#xff1a;…

【通过Cpython3.9源码看看python中的大小整数】

小整数 /* interpreter state */#define _PY_NSMALLPOSINTS 257 #define _PY_NSMALLNEGINTS 5这是CPython中定义的两个常量&#xff0c;它们用于控制解释器状态中的小整数对象池。在CPython中&#xff0c;小整数对象池是一种优化机制&#xff0c;用于减少…

13、fishhook原理Dobby

一、fishhook原理 1.1 fishhook代码分析 int rebind_symbols(struct rebinding rebindings[], size_t rebindings_nel) {//prepend_rebindings的函数会将整个 rebindings 数组添加到 _rebindings_head 这个链表的头部//Fishhook采用链表的方式来存储每一次调用rebind_symbols…

国内的网络攻击溯源专利调查

○ The invention relates to an attack tracing method and device 攻击源追踪方法首先获得目标终端的流程数据、网络数据和文件数据&#xff0c;然后将网络相互关联&#xff0c;共获得3次相关数据&#xff0c;制作相关保时捷链数据。 该技术是将相关过程链数据储存在数据库中…

文本翻译免费软件-word免费翻译软件

好用的翻译文件软件应该具备以下几个方面的特点&#xff1a;支持多种文件格式&#xff0c;翻译结果准确可靠&#xff0c;界面操作简便易用&#xff0c;价格实惠&#xff0c;用户体验舒适。以下是几个好用的翻译文件软件&#xff1a; 1.147cgpt翻译软件 翻译软件特点&#xff1…

NDK RTMP直播客户端三

在之前完成的实战项目【FFmpeg音视频播放器】属于拉流范畴&#xff0c;接下来将完成推流工作&#xff0c;通过RTMP实现推流&#xff0c;即直播客户端。简单的说&#xff0c;就是将手机采集的音频数据和视频数据&#xff0c;推到服务器端。 接下来的RTMP直播客户端系列&#xff…