【TDH社区版大事件】图分析、全文检索、小文件治理、数据开发工具通通都有!

星环科技大数据基础平台TDH社区版,在保留了商业版核心技术优势的基础上最大程度地降低了用户使用大数据技术的门槛与成本,具有更轻量、更简单、更易用等特性。

此次TDH社区开发版、社区版、社区订阅版均发布了新版本,带来新的产品组件和新的功能,为用户提供更为便利、简单、易用的大数据平台产品。

图片

TDH社区开发版-新产品:单机版搜索引擎和图数据库

TDH社区开发版,仅需单台服务器即可一键安装部署,让众多开发爱好者可以0成本、低门槛快速的构建数据开发环境。此前,社区开发版包含Inceptor关系型分析引擎以及Hyperbase宽表数据库、向量数据库Hippo等组件,满足关系型数据分析、数据仓库、历史数据查询、在线检索等场景。

此次,TDH社区开发版正式推出Scope搜索引擎以及StellarDB图数据库,满足用户在多样化数据检索以及使用图模型探索数据关联关系等方面的需求。

在延续了社区开发版单机部署、简单易用等特性的基础上,新发布的两款产品还具有以下特性:

  • 搜索引擎Scope:支持结构化、半结构化,及图片、音影、互联网数据等非结构化数据存储,提供海量数据的交互式多维检索分析服务,帮助用户快速实现日志收集分析、表单数据处理等场景以及搜索引擎、分析检索等应用开发;

  • 图数据库StellarDB:提供高性能的图存储、计算、分析、查询和展示服务。支持原生图存储,具备 深度链路分析能力,提供丰富的图分析算法和深度图算法,帮助用户快速开发欺诈检测、推荐引擎、社交网络分析、知识图谱等应用。

TDH社区版-新功能:解决小文件、数据倾斜等问题

新功能1:海量小文件问题救星

随着每日增量数据的插入以及可能的数据重复插入,小文件数量与日俱增,导致长GC、OOM、集群不稳定,增加计算资源开支等一系列问题,因此小文件治理是必要的也是迫切的。

星环科技产品针对不同表格式均有对应的Compact机制,例如针对Holodesk表,用户可以使用Compact Service(小文件合并专用服务)进行小文件合并任务,该服务在组件级别做了隔离,开启后不会影响Quark的查询计算性能,合并效果更好。

开源产品普遍使用非事务存储格式,如RCFile、ORC等非事务表,合并小文件需要根据每一张表的数据量和分布手动编写任务进行重写来实现小文件合并,而在这个阶段,表无法对外提供服务,只能读不能写,相关业务受到影响。

星环科技采用了全新的技术,针对这个场景设计了新的算法,在任务运行过程中动态的执行小文件合并操作,能够确保在合并过程中Quark端的业务,包括表的读,写,删除等操作不被长时间阻塞,并成功执行不报错。

TDH社区版引入了企业版针对非事务表小文件治理的能力,社区版用户也可以高效治理集群内的小文件,无需担心因为处理不及时影响业务系统。

此外,社区版还引入了归档分区功能,针对一些较少访问及更改的历史数据及分区信息,用户可以选择跨分区进行合并,进一步减少存储开销、元数据管理开销以及任务调度开销。

新功能2:数据倾斜治理好帮手

数据倾斜是指在并行处理海量数据时,单个task上需要处理大量的数据,某些节点会比其他节点需要更长的时间运行才能完成数据计算,导致并行处理效率受到限制,也造成了空闲节点的资源浪费。通常可以采用针对倾斜的key单独处理或MapJoin等方式进行处理,但像MapJoin主要适用于大小表关联的情况。

社区版此次针对大表与大表之间进行关联场景新增了新的SkewJoin功能,能够智能地处理大表之间的连接操作,有效减少查询响应时间,可在一定程度缓解大表关联场景下的数据倾斜问题。

新功能3:全新Manager

Manager为所有核心组件提供统一的管理和运维能力,保障集群稳定运行。此次,Manager UI全新升级,结合新增的监控工具,提升了系统、节点、服务等的关键指标的易读性和易操作性,使数据洞察一目了然,助力用户快速把握全局态势。同时,针对超大集群下管理节点上下线、服务配置等操作实现了升级,性能提升了近10倍,大幅降低用户配置操作时间。

TDH社区订阅版—新产品:大数据开发工具TDS

在构建大数据平台的过程中,除了大数据基础平台本身,利用大数据开发套件高效实现数据集成和开发也是建设过程的关键。

星环科技大数据开发工具 Transwarp Data Studio (TDS)为企业提供了一站式统一的数据开发平台,各个套件可以支持多个场景的使用需求,如数据开发、数据治理或者综合性的数据中台等场景。针对更加细分的场景如任务流调度、血缘分析或数据资产门户等,TDS可以支持组件的灵活组合,提供更综合的能力服务。

此次TDH社区订阅版上架了TDS系列数据开发套件,提供了数据集成、SQL开发和任务调度等能力,帮助用户将数据归集到数据仓库和数据湖,可以更高效地完成数据统一化。

  • 数据库开发工具Waterdrop:数据库管理工具,可以进行跨平台管理,可作为Inceptor SQL 客户端,还支持并兼容其余多种数据库,帮助用户实现数据库管理、SQL 编辑、SQL 执行和数据操作。

  • 任务调度软件Workflow:帮助用户通过图形化的界面设计完整的业务流程、设置执行时间、定义任务之间的依赖关系,并自动调度所设流程,允许取消超时任务、重试错误任务等来提供任务可靠性,能够支持日均百万级任务的分布式调度系统。

  • 大数据整合工具Transporter:将分散于各个地方、各种平台上的各种格式的数据同步或集成到大数据平台上,通过简洁、统一的可视化 界面快速配置数据流转流程,实现异构平台和数据源之间的数据流转。

  • 数据库在线开发与协同工具SQLBooK:提供了 SQL 的编辑、智能 提示、编译、调试和可视化结果展现等的开发功能,还提供 SQL 审核、版本管理、数据源管理等管理能力,可以帮助开发者即插即用地做数据探索与开发。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/392031.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

前端学鸿蒙有必要么?

在当今科技飞速发展的时代,前端开发领域也在不断演进和变革。那么,对于前端开发者来说,学习鸿蒙是否有必要呢? 一、前端学鸿蒙的必要性分析 1、鸿蒙开发简介 鸿蒙操作系统(HarmonyOS)是一个面向全场景的分布式操作系统,它不仅支持…

SX_c语言字符带空格字符串读写_9

改项目的时候又发现c语言读字符串的一些细节这里做补充其中%[^\n]可以读取带空格的字符串 #include <stdio.h>int main(){char cmd;scanf("%c", &cmd);char time[32] {0};scanf("%s", time);printf("%c\n", cmd);printf("%s&quo…

在IoT中的TCP增强

本文内容节选自一篇系统性文献综述&#xff08;Systematic Literature Review, SLR&#xff09;&#xff0c;标题为“TCP Performance Enhancement in IoT and MANET”&#xff0c;由 Sultana Parween 和 Syed Zeeshan Hussain 撰写&#xff0c;发表在《International Journal …

MySQL --- 内置函数介绍

目录 一、日期函数 二、字符串函数 三、数学函数 四、 其他函数 一、日期函数 current_date()当前日期current_time()当前时间current_timestamp()当前时间戳date(datetime)返回datetime的日期部分date_add(date&#xff0c;interval d_value_type) 在date中添加时间/日期…

微信支付海外走红,中国企业跨境支付‘轻装上阵’

当我们谈论中国企业走向世界&#xff0c;拓展海外市场的征程时&#xff0c;一个不可忽视的助力者就是微信支付。它不仅是一个支付工具&#xff0c;更是连接中国企业和全球消费者的桥梁&#xff0c;让中国企业在海外也能享受到与国内同等的支付便利与信任。 早在2016年1 月 15 …

【Vue3】组件通信之$attrs

【Vue3】组件通信之$attrs 背景简介开发环境开发步骤及源码总结 背景 随着年龄的增长&#xff0c;很多曾经烂熟于心的技术原理已被岁月摩擦得愈发模糊起来&#xff0c;技术出身的人总是很难放下一些执念&#xff0c;遂将这些知识整理成文&#xff0c;以纪念曾经努力学习奋斗的…

便携气象设备:随身携带的天气侦探

在快节奏的现代生活中&#xff0c;准确掌握天气变化成为了我们日常出行、户外探险和农业生产的重要参考。 便携气象设备以其轻便、易携、功能全面的特点&#xff0c;满足了我们对即时气象信息的需求。无论是突如其来的暴雨&#xff0c;还是持续多日的晴朗&#xff0c;只需轻轻一…

mac下载exe后不自动打开虚拟机

看到网上没有相关教程&#xff0c;正好解决了&#xff0c;发一下 场景&#xff1a;Mac环境下下载EXE文件&#xff0c;会导致VM虚拟机自动打开来执行文件&#xff0c;所以很烦。 解决方法&#xff1a; Mac系统-系统设置-隐私与安全-vmfusion-取消掉下载文件夹即可。 还有其他…

ME31L-创建计划协议

ME31L创建计划协议 一般常用的就是LA和LPA LP不需要审批&#xff0c;LPA需要审批。 计划协议和采购申请实现的功能相同。 计划协议创建界面和创建合同的界面相同。 ME38可以分配交货计划行。 输入计划协议号。回车。 双击行项目后&#xff0c;维护行项目字段。 然后可以在货…

【海贼王航海日志:前端技术探索】CSS你了解多少?(一)

目录 1 -> CSS是什么 2 -> 基本语法规范 3 -> 引入方式 3.1 -> 内部样式表 3.2 -> 行内样式表 3.3 -> 外部样式 4 -> 代码风格 4.1 -> 样式格式 5 -> 选择器 5.1 -> 选择器的功能 5.2 -> 选择器的种类 5.3 -> 基础选择器 5.3…

三十种未授权访问漏洞复现 合集( 三)

未授权访问漏洞介绍 未授权访问可以理解为需要安全配置或权限认证的地址、授权页面存在缺陷&#xff0c;导致其他用户可以直接访问&#xff0c;从而引发重要权限可被操作、数据库、网站目录等敏感信息泄露。---->目录遍历 目前主要存在未授权访问漏洞的有:NFS服务&a…

python入门基础篇(一)

基础篇 Python基础安装与配置Python环境理解Python解释器第一个Python程序&#xff1a;"Hello, World!" 基础语法注释与文档字符串变量与数据类型数字类型&#xff1a;整数、浮点数、复数字符串布尔值None值 运算符算术运算符比较运算符逻辑运算符赋值运算符位运算符…

Python 爬虫项目实战(一):爬取某云热歌榜歌曲

前言 网络爬虫&#xff08;Web Crawler&#xff09;&#xff0c;也称为网页蜘蛛&#xff08;Web Spider&#xff09;或网页机器人&#xff08;Web Bot&#xff09;&#xff0c;是一种按照既定规则自动浏览网络并提取信息的程序。爬虫的主要用途包括数据采集、网络索引、内容抓…

《机器人SLAM导航核心技术与实战》第1季:第8章_激光SLAM系统

视频讲解 【第1季】8.第8章_激光SLAM系统-视频讲解【第1季】8.1.第8章_激光SLAM系统_Gmapping算法-视频讲解【第1季】8.2.第8章_激光SLAM系统_Cartographer算法-视频讲解【第1季】8.3.第8章_激光SLAM系统_LOAM算法-视频讲解 第1季&#xff1a;第8章_激光SLAM系统 先 导 课第…

如何使用 PHP Simple HTML DOM Parser 轻松获取网页中的特定数据

背景介绍 网页数据的抓取已经成为数据分析、市场调研等领域的重要工具。无论是获取产品价格、用户评论还是其他公开数据&#xff0c;网页抓取技术都能提供极大的帮助。今天&#xff0c;我们将探讨如何使用 PHP Simple HTML DOM Parser 轻松获取网页中的特定数据。PHP Simple H…

佳能R8和索尼6700,个人犹豫买什么。绝大多建议R8!

针对佳能R8和索尼a6700的选择&#xff0c;结合你的需求&#xff0c;我会更倾向于推荐佳能R8。 首先&#xff0c;R8作为一款全画幅相机&#xff0c;在画质上相对APS-C画幅的a6700有一定的优势&#xff0c;特别是在拍摄孩子的日常和特写时&#xff0c;更能够捕捉到细腻的画面和丰…

Unity 预制动态绑定光照贴图遇到变白问题

预制绑定光照贴图&#xff0c;网上解决方案很多&#xff0c;已下是要点&#xff1a; //烘培完场景之后&#xff0c;保存光照贴图信息 void StoreLightmapData() {lightMap.Clear();LightmapData[] lds LightmapSettings.lightmaps;foreach (LightmapData data in lds){Custom…

第1天:Python基础语法(五)

正文&#xff1a; 在之前的文章中&#xff0c;我们已经学习了Python的基本语法集合和集合的一些常用操作。 在本篇文章中&#xff0c;我们将继续学习其他类型 字符串格式化 使用操作符%s来实现 ➢ 几个%s就几个变量 ➢ 超过一个变量时&#xff0c;需要用元组%&#xff08;…

计算机网络(TCP报文段首部格式中序号和确认号)

TCP首部格式中的序号和确认号并不总是同时出现。 TCP首部的序号和确认号是根据TCP通信的不同阶段和目的来决定的。在建立连接的过程中&#xff0c;序号用于标识发送数据的起始位置&#xff0c;而确认号用于表示接收方期望接收的下一个数据的起始位置。这两个字段在TCP通信的不同…

Nat Cell Biol文献分享|scRNA-seq+ChIP-seq揭示表观因子KMT2C/D突变三阴性乳腺癌脑转移的新机制

乳腺癌是全球最常见的癌症&#xff0c;也是全球女性癌症相关死亡的主要原因。根据雌激素和孕激素受体以及人类表皮生长因子受体 2 (HER2) 的表达&#xff0c;乳腺癌可分为激素受体阳性、HER2 阳性或三阴性乳腺癌 (TNBC)。在主要亚型中&#xff0c;TNBC 的远处转移风险最高&…