读取mysql数据写入parquet文件

读取mysql数据写入parquet文件

创建表

create table tbs1(
id int,
name varchar(50),
address varchar(50),
countryid int);

写入数据

package mainimport ("database/sql""fmt"_ "github.com/go-sql-driver/mysql""log""strconv"
)func main() {dsn := "root:123456@tcp(192.168.230.71:3306)/fxdb"db, err := sql.Open("mysql", dsn)if err != nil {log.Fatal(err)}defer db.Close()// 准备INSERT语句stmt, err := db.Prepare("INSERT INTO tbs1 (id,name,address,countryid) VALUES (?,?,?,?)")if err != nil {log.Fatal(err)}defer stmt.Close()// 执行INSERT语句for i := 1; i <= 1000; i++ {stmt.Exec(i, "tom"+strconv.Itoa(i), "wuhan"+strconv.Itoa(i), 1000+i)}fmt.Println("Data inserted successfully")
}

读取数据写入parquet文件

go.mod文件内容如下:

module parquetdemogo 1.20require (github.com/go-sql-driver/mysql v1.5.0github.com/xitongsys/parquet-go v1.6.2github.com/xitongsys/parquet-go-source v0.0.0-20200817004010-026bad9b25d0
)require (github.com/apache/arrow/go/arrow v0.0.0-20200730104253-651201b0f516 // indirectgithub.com/apache/thrift v0.16.0 // indirectgithub.com/golang/snappy v0.0.4 // indirectgithub.com/google/flatbuffers v2.0.8+incompatible // indirectgithub.com/klauspost/compress v1.15.9 // indirectgithub.com/pierrec/lz4/v4 v4.1.15 // indirectgithub.com/stretchr/testify v1.8.0 // indirectgolang.org/x/xerrors v0.0.0-20220609144429-65e65417b02f // indirect
)

main.go内容:

package mainimport ("database/sql""fmt"_ "github.com/go-sql-driver/mysql""github.com/xitongsys/parquet-go-source/local""github.com/xitongsys/parquet-go/writer""log"
)func main() {// DSN(数据源名称)dsn := "root:123456@tcp(192.168.230.71:3306)/fxdb"// 打开数据库连接db, err := sql.Open("mysql", dsn)if err != nil {log.Fatal(err)}defer db.Close()// 验证连接err = db.Ping()if err != nil {log.Fatal(err)}sSql := "SELECT * FROM tbs1"stmt, err := db.Prepare(sSql)if err != nil {log.Fatal(err)}defer stmt.Close()// 查询rows, err := stmt.Query()if err != nil {log.Fatal(err)}defer rows.Close()// 数据列columns, err := rows.Columns()if err != nil {log.Fatal(err)}// 列的个数count := len(columns)types, _ := rows.ColumnTypes()/* 构建如下字符串数组,写入需要按照这个数组顺序md := []string{"name=id, type=INT64","name=Name, type=BYTE_ARRAY, convertedtype=UTF8, encoding=PLAIN",}*/// 构建mdvar md []string// 需要按顺序for i := 0; i < len(types); i++ {sqltype := *types[i]// 列名vname := sqltype.Name()// 列的数据类型vtype := sqltype.DatabaseTypeName()item := fmt.Sprintf("name=%s,type=%s", vname, getType(vtype))md = append(md, item)}//write,创建一个ParquetFilefw, err := local.NewLocalFileWriter("csv.parquet")if err != nil {log.Println("Can't open file", err)return}// 创建一个CSV writer,np为parallel numberpw, err := writer.NewCSVWriter(md, fw, 4)if err != nil {log.Println("Can't create csv writer", err)return}// 用于存储表数据mData := make([]map[string]interface{}, 0)// 一条数据的各列的值(需要指定长度为列的个数,以便获取地址)values := make([]interface{}, count)// 存储values的地址valPointers := make([]interface{}, count)// 取values地址放入valPointersfor i := 0; i < count; i++ {valPointers[i] = &values[i]}// 遍历数据for rows.Next() {// 获取各列的值,放到对应的地址中rows.Scan(valPointers...)// 一条数据的Map (列名和值的键值对)entry := make(map[string]interface{})// Map 赋值for i, col := range columns {var v interface{}val := values[i]b, ok := val.([]byte)if ok {v = string(b)} else {v = val}entry[col] = v}mData = append(mData, entry)}for i, _ := range mData {data := make([]interface{}, 0)// 按列顺序for j := 0; j < len(types); j++ {sqltype := *types[j]data = append(data, mData[i][sqltype.Name()])}if err = pw.Write(data); err != nil {log.Println("WriteString error:", err)}}if err = pw.WriteStop(); err != nil {log.Println("WriteStop error", err)}log.Println("Write Finished")fw.Close()
}func getType(colType string) string {if colType == "INT" {return "INT64"}if colType == "VARCHAR" {return "BYTE_ARRAY, convertedtype=UTF8, encoding=PLAIN"}return ""
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/374392.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue3中antd上传图片组件及回显

实现效果&#xff1a; 调用后端接口后&#xff0c;后端返回的数据&#xff1a; 1.在项目components/base下新建UploadNew.vue文件&#xff08;上传图片公共组件&#xff09; <template><div class"clearfix"><a-uploadv-model:file-list"fileL…

视频汇聚平台EasyCVR设备录像回看请求播放时间和实际时间对不上,是何原因?

安防监控EasyCVR视频汇聚平台可提供多协议&#xff08;RTSP/RTMP/国标GB28181/GAT1400/海康Ehome/大华/海康/宇视等SDK&#xff09;的设备接入、音视频采集、视频转码、处理、分发等服务&#xff0c;系统具备实时监控、云端录像、回看、告警、平台级联以及多视频流格式分发等视…

【自监督学习】DINO in ICCV 2021

一、引言 论文&#xff1a; DINO: Emerging Properties in Self-Supervised Vision Transformers 作者&#xff1a; Facebook AI Research 代码&#xff1a; DINO 特点&#xff1a; 对于一张图片&#xff0c;该方法首先进行全局和局部的裁剪与增强并分别送入教师和学生网络&am…

关于.NETCORE站点程序部署到nginx上无法访问静态文件和无法正确生成文件的问题解决过程。

我的netcore6项目&#xff0c;部署到IIS的时候&#xff0c;生成报告时&#xff0c;需要获取公司LOGO图片放到PDF报告文件中&#xff0c;这时候访问静态图片没有问题。 然后还有生成邀请二维码图片&#xff0c;这时候动态创建图片路径和图片也没有问题&#xff0c;可以在站点的…

本地部署:Real-ESRGAN: 高效的图像超分辨率解决方案

目录 引言 什么是 Real-ESRGAN Real-ESRGAN 的特点 工作原理 应用场景 本地部署 本地运行 实验与结果 未来发展方向 结语 Tip&#xff1a; 引言 图像超分辨率&#xff08;Super-Resolution, SR&#xff09;技术旨在从低分辨率图像生成高分辨率图像&#xff0c;应用…

初学SpringMVC之 RestFul 风格、重定向和转发

RestFul 风格改变 URL 形式 比如之前是&#xff1a;http://localhost:8080/add?a1&b2 现在是&#xff1a;http://localhost:8080/add/a/b&#xff08;全是斜杠&#xff09; package com.demo.controller;import org.springframework.stereotype.Controller; import org…

this.$confirm不要取消按钮以及右上角的差号

this.$confirm(保存成功! 订单号为&#xff1a;${res.data}, , {confirmButtonText: 确定,showCancelButton: false, // 不显示取消按钮showClose: false, // 不显示右上角的叉号type: success}).then(() > {}) 效果图下&#xff1a;

基于4G、5G和卫星宽带的应急通信车载聚合路由器组网方案

应急指挥车、现场应急指挥系统作为整个应急指挥平台的主要组成部分&#xff0c;被广泛用于救灾抢险,安全保障等特殊场景&#xff0c;可通过应急指挥车或现场应急指挥系统与后方指挥中心间传输音视频信息&#xff0c;实现现场与指挥中心的实时通信&#xff0c;进行视频会议和远程…

realsense D435l+mid360标定

目录 一、安装realsense环境 二、获取realsense D450L相机内参 三、标定雷达和相机 1.下载livox_camera_calib 2.修改配置参数 3.使用fastlio生成点云 4.标定 一、安装realsense环境 git clone https://github.com/IntelRealSense/librealsense.git cd librealsense //更…

Python基础教学之一:入门篇——迈入编程世界的第一步

Python基础教学之一&#xff1a;入门篇——迈入编程世界的第一步 一、Python简介&#xff1a;历史与现状 Python&#xff0c;一种解释型、高级和通用的编程语言&#xff0c;由Guido van Rossum在1989年圣诞节期间创造&#xff0c;并于1991年首次发布。设计哲学强调代码的可读性…

vb.netcad二开自学笔记9:界面之ribbon

一个成熟的软件怎么能没有ribbon呢&#xff0c;在前面的框架基础上再加个命令AddRibbon <CommandMethod("AddRibbon")> Public Sub AddRibbon() Dim ribbonControl As RibbonControl ComponentManager.Ribbon Dim tab As RibbonTab New RibbonTab() tab.Tit…

解决keil调试遇到的hardlfault问题

在程序开发过程中遇到的程序死机问题 导致死机的原因&#xff1a;内存溢出&#xff0c;堆栈溢出&#xff0c;数组越界&#xff0c;中断错误。。。。。。 出现这个问题&#xff0c;首先查看线程的调度关系 看最后是在哪个位置死机&#xff0c;如果rt_current_thread在main_thre…

【数据结构与算法 经典例题】判断两棵二叉树是否相同

&#x1f493; 博客主页&#xff1a;倔强的石头的CSDN主页 &#x1f4dd;Gitee主页&#xff1a;倔强的石头的gitee主页 ⏩ 文章专栏&#xff1a;《数据结构与算法 经典例题》C语言 期待您的关注 目录 一、问题描述 二、解题思路 三、C语言实现代码 一、问题描述 给你两棵二…

公共安全和应急管理系统:提升社区韧性与危机应对能力

引言 公共安全和应急管理是现代社会不可或缺的组成部分&#xff0c;其核心目标是确保社会的稳定和居民的福祉。随着全球化、城市化和技术进步&#xff0c;社会面临的风险和威胁日益复杂多样&#xff0c;从自然灾害到人为事故&#xff0c;从公共卫生危机到恐怖袭击&#xff0c;公…

高可用hadoop分布式节点的扩容

解决方案 修改hdfs-site.xml 文件 原xml文件 <?xml version"1.0" encoding"UTF-8"?> <?xml-stylesheet type"text/xsl" href"configuration.xsl"?> <!--Licensed under the Apache License, Version 2.0 (th…

运维Tips | Ubuntu 24.04 安装配置 xrdp 远程桌面服务

[ 知识是人生的灯塔,只有不断学习,才能照亮前行的道路 ] Ubuntu 24.04 Desktop 安装配置 xrdp 远程桌面服务 描述:Xrdp是一个微软远程桌面协议(RDP)的开源实现,它允许我们通过图形界面控制远程系统。这里使用RDP而不是VNC作为远程桌面,是因为Windows自带的远程桌面连接软…

回答 | 开源项目有哪些机遇与挑战?

随着全球经济和科技环境的快速变化&#xff0c;开源软件项目的蓬勃发展成为了开发者社区的热门话题。越来越多的开发者和企业选择参与开源项目&#xff0c;以推动技术创新和实现协作共赢。你如何看待当前开源项目的发展趋势&#xff1f;你在参与开源项目时有哪些经验和收获&…

单身杯_RE

唉&#xff0c;遇到几个比较繁琐的题目&#xff0c;搞的心态都有点炸了&#xff0c;0.0 magic 这题也就那样&#xff0c;初时想要用用 angr 跑了一下&#xff0c;没搞出来&#xff0c;之后再去好好搞清楚吧&#xff0c;也不是特别清楚运用。 然后就自己去看了&#xff0c;就是…

从实时监控到风险智能预警:EasyCVR视频AI智能监控技术在工业制造中的应用

随着科技的不断进步和工业制造领域的持续发展&#xff0c;传统的生产管理方式正逐渐转型&#xff0c;迈向更加智能、高效和安全的新阶段。在这个变革过程中&#xff0c;视频智能监控技术凭借其独特的优势&#xff0c;成为工业制造领域的管理新引擎&#xff0c;推动着从“制造”…

“删错文件后如何高效挽救?两大恢复策略全解析“

在数字化日益深入生活的今天&#xff0c;数据已成为我们工作、学习和娱乐不可或缺的一部分。然而&#xff0c;删错文件的经历却如同数字世界中的一场“小插曲”&#xff0c;不经意间就可能让我们陷入数据丢失的困境。无论是误触删除键、清空回收站&#xff0c;还是软件故障导致…