【Hive】云任务大量卡住故障分析

项目场景:

上一章节我们简单介绍到了JVM调优相关的知识,本章节结合日常故障处理进一步说明相关的使用


问题描述

在云上,hive任务出现大面积卡住的现象,但并无任何报错信息,具体如下:
在这里插入图片描述


原因分析:

- 考虑hivemetastore故障:

经过很多元数据操作测试,并未发现异常,予以排除。

- 考虑hiveserver2连接数超限问题:

经排查hiveserver2虽然有189个连接数,但并未超过设置的hive.server2.thrift.max.worker.threads上限,予以排除。

- 考虑hiveserver2的JVM问题:

经观察资源使用正常,并没有触发该问题的可能,予以排除,当时的jvm使用情况如下:

在这里插入图片描述

  • 考虑锁机制相关问题:

经过抓取多时段堆栈信息,发现任务运行过程中,产生了许多BLOCKED以及WAITING,予以高度关注。
首先无论一个APP产生多少个JOB执行,这些JOB都会被分配到同一个线程中串行执行,直至任务结束。

在这里插入图片描述
堆栈信息中显示,该线程由于一直在等待<0x0000000788597b0>锁,处于边界,导致死锁
在这里插入图片描述
再继续查找持有<0x0000000788597b0>锁的线程,经过多次采集信息发现,该持有锁的线程,一直持有,不释放
在这里插入图片描述
根据该线程相关信息,DEBUG追踪相关代码,发现该while循环一直不结束,永远跳不出来,处于死循环状态。
在这里插入图片描述
根据该线索,进一步排查到底哪里使用了该方法,启动了线程呢?根据测试的SQL特点和不同任务对比,定位到MapredLocalTask这个class类。
在这里插入图片描述
在这里插入图片描述
根据MapredLocalTask的具体执行逻辑,主要涉及到mapjoin的问题,尝试关闭mapjoin功能(set hive.auto.convert.join=false;),再次运行任务,奇迹发生了,任务可以执行成功。
在这里插入图片描述

总结:

结合原理可知,Map Join的适用大表Join小表及不等值的链接操作。
关于小表的大小,由参数 hive.mapjoin.smalltable.filesize来决定,该参数表示小表的总大小,默认值为25000000字节,即25M。实际中此参数允许的最大值可以修改,但是一般最大不能超过1GB
Hive0.7之前,需要使用hint提示/+mapjoin(table)/才会执行MapJoin,否则执行Common Join,但在0.7版本之后,默认自动会转换Map Join,由参数 hive.auto.convert.join来控制,默认为true。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/39675.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux服务器出现异常和卡顿排查思路和步骤

目录 前言一、查看内存使用情况二、查看磁盘使用情况三、top命令3.1 jmap分析堆内存配置信息和使用情况3.2 jstack分析线程的执行情况3.3 jstat查看各个区域占堆百分比 四、其他指令总结 前言 Linux 服务器出现异常和卡顿的原因有很多&#xff0c;以下是一些常见的原因&#x…

熵、交叉熵和散度

熵 自信息 I(x) - log p(x) 对于分布为P(x)的随机变量X&#xff0c;自信息的数学期望 即熵H(X)定义为&#xff1a; 熵越高&#xff0c;随机变量信息越高&#xff0c;反之越少。不同概率分布对应熵如下&#xff1a;P p()熵10001/21/41/41/31/31/3 概率分布越均匀&#xff0…

【腾讯轻量应用服务器上部署kafka并通过flink读取kafka数据】

环境准备 经过1个月的摸索&#xff0c;最终选择在腾讯云上搭建一个学习环境。当时选择原因还是新用户有优惠(150左右3年)&#xff0c;但现在看1核2g的配置勉强够用&#xff0c;建议后续小伙伴选择时最好是2核4g配置。 由于是单节点安装&#xff0c;需要准备如下资源&#xff1…

【Twitter Storm系列】flume-ng+Kafka+Storm+HDFS 实时系统搭建

技术交流群&#xff1a;59701880 深圳广州hadoop好友会 微信公众号&#xff1a;后续博客的文档都会转到微信公众号中。 一直以来都想接触Storm实时计算这块的东西&#xff0c;最近在群里看到上海一哥们罗宝写的FlumeKafkaStorm的实时日志流系统的搭建文档&#xff0c;自己也跟…

学习笔记之信息量、熵、KL散度、交叉熵的一些介绍

文章目录 信息量熵KL散度&#xff08;相对熵&#xff09;交叉熵参考 信息量 以前我也一直只是知道信息量的计算公式&#xff0c;也有想过为什么会是这样&#xff0c;但是因为要学的东西太多了&#xff0c;就没怎么深究&#xff0c;直到看了“交叉熵”如何做损失函数&#xff1…

AI产品经理是如何理解机器学习的(附注释)

本期目的&#xff1a;回顾之前敲代码的日常&#xff0c;利用生活场景帮助AI产品经理认识机器学习及学习过程中常用算法和评价指标。 适用读者&#xff1a;AI/数据产品经理。 阅读重点&#xff1a;品&#xff0c;细品&#xff0c;结合班级故事再品。 最近看了很多关于机器学习…

卢伟冰称小米今年库存会回到更健康水位 将加大门店整合调整

雷递网 乐天 3月25日 小米集团&#xff08;股票代码为&#xff1a;1810&#xff09;今日发布财报&#xff0c;财报显示&#xff0c;小米集团2022年营收为2800亿元&#xff0c;较上年同期的3283亿元下降14.7%。小米2022年经调净利为85亿元。 小米2022年第四季度营收为660.47亿元…

小米年营收2800亿:经调整利润85亿 电动汽车业务投入31亿

雷递网 雷建平 3月24日 小米集团&#xff08;股票代码为&#xff1a;1810&#xff09;今日发布财报&#xff0c;财报显示&#xff0c;小米集团2022年营收为2800亿元&#xff0c;较上年同期的3283亿元下降14.7%。 2022年&#xff0c;小米集团的境外市场收入为1378亿元&#xff0…

什么是低代码开发平台(apaas)?低代码开发平台的价值有哪些

手码6500字&#xff0c;带你快速看懂&#xff1a;什么是低代码开发平台&#xff08;apaas&#xff09;&#xff0c;低代码有哪些价值&#xff0c;以及低代码平台的使用逻辑和心得。 一、什么是低代码开发平台&#xff08;apaas&#xff09;&#xff1f; 低代码开发平台是一种a…

详解如何在ChatGPT内构建一个Python解释器

这篇文章主要为大家详细介绍了如何在ChatGPT内构建一个Python解释器&#xff0c;文中的示例代码讲解详细&#xff0c;具有一定的学习价值&#xff0c;需要的可以参考一下 目录 引用&#xff1a;Art Kulakov 《How to Build a Python Interpreter Inside ChatGPT》 这个灵感来自…

如何画各种“图”?

我们在写文档过程中&#xff0c;多多少少都会画一些图来说明程序的功能&#xff0c;这篇文章就来说明一些常用的"图"怎么画。 1&#xff0c;画图工具 常用的有这么几种 Visio&#xff1a;这是很常用的&#xff0c;基本上的图都可以用这个来画。StarUML&#xff1a…

patreon cg人物插画作品合集分享

1、wlop大神作品4K-8K精选无水印图片http://theme.chengxuz.com/265.html 2、加拿大女画师sakimi chan作品1-98期插画http://theme.chengxuz.com/250.html 3、画师Mirco Cabbia插画作品合集欣赏http://theme.chengxuz.com/306.html 4、画师Sciamano240插画作品分享http://th…

如何画场景插画?场景插画的起稿、构图技巧!

如何画场景插画&#xff1f;绘画初学者如何构图&#xff1f;绘画初学者如何起稿&#xff1f;学习绘画难吗&#xff1f;怎样才能学好绘画&#xff1f;想必这些都是绘画初学者们经常在想的问题吧&#xff0c;就是不知道如何才能绘画好一个场景&#xff0c;不知道如何起稿也不知道…

手把手教你实现手绘风格图形

大家好&#xff0c;我是 漫步&#xff0c;今天分享一篇高难度的图形绘制文章。 Rough.js[1]是一个手绘风格的图形库&#xff0c;提供了一些基本图形的绘制能力&#xff0c;比如&#xff1a;虽然笔者是个糙汉子&#xff0c;但是对这种可爱的东西都没啥抵抗力&#xff0c;这个库的…

Python自动绘制UML类图、函数调用图(Call Graph)

文章目录 1. 引言2. 绘制UML类图2.1 安装graphviz2.2 安装pyreverse2.3 绘制UML类图 3. 绘制函数调用图3.1 安装graphviz3.2 安装pycallgraph3.3 使用示例第一种&#xff1a;从命令行调用第二种&#xff1a;从API调用 小结 1. 引言 在设计软件、分析代码时&#xff0c;我们常常…

房价预测2

学习&#xff1a; https://blog.csdn.net/u012063773/article/details/79349256 https://www.cnblogs.com/massquantity/p/8640991.html https://zhuanlan.zhihu.com/p/39429689 详解stacking过程 之前在房价预测1中对一些异常值进行了drop处理 后来在分割train和test的时候…

深圳二手房房价分析及预测

分析目标&#xff1a; 通过处理后的房价数据&#xff0c;筛选对房价有显著影响的特征变量。确定特征变量&#xff0c;建立深圳房价预测模型并对假设情景进行模拟 数据预处理 import pandas as pd import os file_path"D:\Python数据分析与挖掘实战\深圳二手房价分析\…

波士顿房价预测

目录 前言一、波士顿房价预测实战1-1、数据集介绍&数据集导入&分割数据集1-2、数据标准化1-3、构建网络1-4、K折交叉验证&取出所有的训练损失、训练平均绝对误差、验证损失、验证平均绝对误差1-5、计算平均mae&绘制验证mae分数&绘制验证loss分数1-6、找到最…

房价多特征预测

2019.11.18 首先非常感谢这位作者&#xff0c;写的很棒&#xff01;你们就不要看我的啦&#xff0c;看他的⬇️⬇️ 学习来自 https://blog.csdn.net/sinat_29957455/article/details/79255675 下面的内容为自己学习笔记: 学习Kaggle&#xff5e;ing 这次给出的特征有点儿多啊…

北京房价预测图说

前言 曾听人说过&#xff0c;中国经济是房地产市场&#xff0c;美国经济是股票市场。中国房地产市场超过400万亿&#xff0c;房地产总值是美国、欧盟、日本总和&#xff0c;但是股市才50万亿&#xff0c;不到美欧日的十分之一。可见房地产对于中国来说地位尤其明显&#xff01…