Go语言实现多协程文件下载器

文章目录

  • 前言
  • 流程图
  • 主函数
  • 下载文件
  • 初始化分片下载worker
  • 分发下载任务
  • 获取下载文件的大小
  • 下载文件分片
  • 错误重试
  • 项目演示
  • 最后

前言

你好,我是醉墨居士,最近在开发文件传输相关的项目,然后顺手写了一个多协程文件下载器,代码非常精简,核心代码只有100行左右,适合分享给大家学习使用

流程图

在这里插入图片描述

主函数

func main() {fileURL := flag.String("u", "", "downloade url of the file")flag.Parse()if *fileURL == "" {log.Println("Please input a download url")flag.Usage()return}fileDir, err := os.Getwd()if err != nil {log.Println(err)return}// 下载文件保存路径filePath := filepath.Join(fileDir, filepath.Base(*fileURL))err = downloadFile(*fileURL, filePath)if err != nil {log.Println(err)return}log.Println("download file success:", filePath)
}

下载文件

// 下载文件
func downloadFile(fileURL string, filePath string) error {log.Println("downloading file:", fileURL, "to", filePath)taskCh := make(chan [2]int64, runtime.NumCPU())wg := new(sync.WaitGroup)// 创建执行下载任务的 workererr := initWorker(fileURL, filePath, taskCh, wg)if err != nil {return fmt.Errorf("init worker failed: %v", err)}// 分发下载任务err = dispatchTask(fileURL, taskCh)if err != nil {return fmt.Errorf("dispacth task failed: %v", err)}// 等待所有下载任务完成wg.Wait()return nil
}

初始化分片下载worker

// 初始化 下载 worker
func initWorker(url string, filePath string, taskCh chan [2]int64, wg *sync.WaitGroup) error {for i := 0; i < runtime.NumCPU(); i++ {// 打开文件句柄file, err := os.OpenFile(filePath, os.O_CREATE|os.O_RDWR, 0644)if err != nil {return err}wg.Add(1)go func(file *os.File, taskCh chan [2]int64) {defer wg.Done()defer file.Close()// 循环从 taskCh 中获取下载任务并下载for part := range taskCh {log.Printf("downloading part, start offset: %d, end offset: %d", part[0], part[1])// 重试下载,最大重试次数为 10 次,每次下载失败后等待 1 秒err := retryWithWaitTime(10, func() error {return downloadPart(url, file, part[0], part[1])}, time.Second)if err != nil {log.Printf("download part %d failed: %v", part, err)}}}(file, taskCh)}return nil
}

分发下载任务

// 分发下载任务
func dispatchTask(url string, taskCh chan [2]int64) error {defer close(taskCh)fileSize, err := getFileSize(url)if err != nil {return err}// 分片大小 1MBconst chunkSize = 1024 * 1024parts := fileSize / chunkSizelog.Println("file size:", fileSize, "parts:", parts, "chunk size:", chunkSize)for i := int64(0); i < parts; i++ {// 计算分片的起始和结束位置startOffset := i * chunkSizeendOffset := startOffset + chunkSize - 1// 发送下载任务taskCh <- [2]int64{startOffset, endOffset}}// 发送最后一个分片的下载任务if fileSize % chunkSize != 0 {taskCh <- [2]int64{parts * chunkSize, fileSize - 1}}return nil
}

获取下载文件的大小

// 获取文件大小
func getFileSize(url string) (int64, error) {resp, err := http.Head(url)if err != nil {return 0, err}defer resp.Body.Close()return resp.ContentLength, nil
}

下载文件分片

// 下载文件分片
func downloadPart(url string, file *os.File, startPos, endPos int64) error {req, err := http.NewRequest("GET", url, nil)if err != nil {return err}// 设置文件分片区间的请求头req.Header.Set("Range", fmt.Sprintf("bytes=%d-%d", startPos, endPos))resp, err := http.DefaultTransport.RoundTrip(req)if err != nil {return err}defer resp.Body.Close()// 如果服务器返回的状态码不是 206 Partial Content,则说明下载失败if resp.StatusCode != http.StatusPartialContent {data, err := io.ReadAll(resp.Body)if err != nil {return err}log.Println("unexpected data:", string(data))return fmt.Errorf("unexpected status code: %d", resp.StatusCode)}// 文件指针移动到分片的起始位置_, err = file.Seek(startPos, 0)if err != nil {return err}// 写入分片数据到文件_, err = io.Copy(file, resp.Body)if err != nil {return err}return nil
}

错误重试

// 重试函数
func retryWithWaitTime(retryCount int, fn func() error, waitTime time.Duration) error {var err errorfor i := 0; i < retryCount; i++ {e := fn()if e != nil {errors.Join(err, e)time.Sleep(waitTime)continue}return nil}return err
}

项目演示

在这里插入图片描述
在这里插入图片描述

最后

我是醉墨居士,如果这个项目对你有所帮助,希望你能多多支持,我们下期再见

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/391199.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用于遥感数据处理的python脚本

编辑&#xff1a;我不爱机器学习 今天给大家分享一组用于遥感处理的 python 脚本。 作者使用基于无人机的智利中南部泥炭地的高光谱图像。该图像有 41 个波段&#xff08;10 nm 宽&#xff09;&#xff0c;范围为 480-880 nm&#xff0c;像素大小为 10 cm。绿点对应于测量生物…

【Python系列】Python 协程:并发编程的新篇章

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

万物分割(Segment Anything Model)C++模型推理部署

概述 SAM 是一种先进的人工智能模型&#xff0c;已经证明了在分割复杂和多样化图像方面具有优异的表现。该模型是计算机视觉和图像分割领域的一个重大突破。 SAM 的架构旨在处理各种图像分割任务&#xff0c;包括对象检测、实例分割和全景分割。这意味着该模型可以应用于各种用…

CTF-web 基础 网络协议

网络协议 OSI七层参考模型&#xff1a;一个标准的参考模型 物理层 网线&#xff0c;网线接口等。 数据链路层 可以处理物理层传入的信息。 网络层 比如IP地址 传输层 控制传输的内容的传输&#xff0c;在传输的过程中将要传输的信息分块传输完成之后再进行合并。 应用…

使用VM安装K8S

VM 部署K8S 前言 本次使用VM搭建k8s&#xff0c;由于搭建流程复杂&#xff0c;在此记录。 需提前安装好VM&#xff08;可参考&#xff1a;VM安装&#xff09;&#xff0c;起两台虚拟机(模拟master和worker)&#xff0c;且VM里已安装好Docker&#xff08;可参考&#xff1a;D…

操作系统——进程同步

文章目录 进同步和互斥1.什么是进程同步和进程互斥&#xff1f;进程同步进程互斥 2.进程互斥的软件实现方式单标志法双标志检查法双标志后检查法Peterson算法 3. 进程互斥硬件实现方法中断屏蔽方法TestAndSet指令Swap指令 4. 互斥锁5. 信号量机制整形信号量记录型信号量用信号量…

Scrapy 爬取旅游景点相关数据(五)

本期内容&#xff1a;&#xff08;1&#xff09;爬取日本其他城市数据存入数据库&#xff08;2&#xff09;爬取景点评论数据 1 爬取其他城市景点数据 只爬取一个城市的数据对于做数据可视化系统可能是不够的&#xff0c;因为数据样本量少嘛&#xff0c;本期来爬取其他城市的景…

等保测评练习卷25

等级保护初级测评师试题25 姓名&#xff1a; 成绩&#xff1a; 一、判断题&#xff08;10110分&#xff09; 1.安全区域边界对象主要根据系统中网络访问控制设备的部署情况来确定&#xff08;&#xff09;不是网络访问控制设备而…

笔试练习day2

目录 BC64 牛牛的快递题目解析解法模拟代码方法1方法2 DP4 最小花费爬楼梯题目解析解法动态规划状态表示状态转移方程代码 数组中两个字符串的最小距离题目解析解法方法1暴力解法(会超时)方法2贪心(动态规划)代码 感谢各位大佬对我的支持,如果我的文章对你有用,欢迎点击以下链接…

Yolov8在RK3588上进行自定义目标检测(一)

1.数据集和训练模型 项目地址&#xff1a;https://github.com/airockchip/ultralytics_yolov8.git 从github(htps:l/github.com/airockchip/ultralytics_yolov8)上获取yolov8模型。 下载项目&#xff1a; git clone https://github.com/airockchip/ultralytics_yolov8.git …

Python | Leetcode Python题解之第316题去除重复字母

题目&#xff1a; 题解&#xff1a; class Solution:def removeDuplicateLetters(self, s: str) -> str:vis defaultdict(int)cnt defaultdict(int)for ch in s: cnt[ch] 1queue []for ch in s:if vis[ch] 0:while queue and queue[-1] > ch and cnt[queue[-1]]:vi…

《Advanced RAG》-03-使用 RAGAs + LlamaIndex 进行 RAG 评估

摘要 文章首先介绍了 RAG 评估的三个主要部分&#xff1a;输入查询、检索上下文和 LLM 生成的响应。 提到了 RAGAs 提出的 RAG 评估指标&#xff0c;包括 Faithfulness、Answer Relevance 和 Context Relevance&#xff0c;以及 RAGAs 网站提供的两个额外指标&#xff1a;Conte…

【面试题】分发糖果

这里写自定义目录标题 题目解题问题描述解题思路详细步骤初始化左到右扫描右到左扫描计算总糖果Python 代码示例 示例示例 1示例 2 复杂度分析 题目 仅供学习 解题 使用一种贪心算法的策略解决糖果分配问题。 问题描述 给定一个整数数组 ratings&#xff0c;表示每个孩子…

联邦学习研究综述【联邦学习】

文章目录 0 前言机器学习两大挑战&#xff1a; 1 什么是联邦学习&#xff1f;联邦学习的一次迭代过程如下&#xff1a;联邦学习技术具有以下几个特点&#xff1a; 2 联邦学习的算法原理目标函数本地目标函数联邦学习的迭代过程 3 联邦学习分类横向联邦学习纵向联邦学习联邦迁移…

功能实现——使用 RestTemplate 进行跨项目接口调用

目录 1.需求说明2.项目环境搭建3.代码实现3.1.使用 RestTemplate 进行调用3.1.1.项目 A3.1.2.项目 B 3.2.测试3.3.使用 JsonObject 来传递和接收 json 数据3.3.1.说明3.3.2.代码实现 3.4.其它说明3.4.1.restTemplate.exchange()3.4.2.restTemplate.postForObject()3.4.3.区别总…

8.4 字符串中等 443 String Compression 467 Unique Substrings in Wraparound String

443 String Compression 注意&#xff1a;这里是按照顺序压缩&#xff0c;不忽略顺序就不能用字母表计数再还原了。 如果char num 1 只需要压入char本身 num > 1 时还需要压入char的个数 按字符压入 class Solution { public:vector<char> Push(vector<char>&a…

Debug-019-git reflog的两种使用场景

前情&#xff1a;最近在开发项目中对版本管理有了新的理解&#xff0c;感觉在这方面有了新的收获。同时学习了一个新的git指令&#xff1a;git reflog 实际了解之后&#xff0c;发现这个指令不是很常用&#xff0c;但是对于特定的场景的话它还是非常比较方便 这里我列举两种我…

Nextjs——国际化那些事儿

背景&#xff1a; 某一天&#xff0c;产品经理跟我说&#xff0c;我们的产品需要搞国际化 国际化的需求说白了就是把项目中的文案翻译成不同的语言&#xff0c;用户想用啥语言来浏览网页就用啥语言&#xff0c;虽然说英语是通用语言&#xff0c;但国际化了嘛&#xff0c;产品才…

算法--初阶

1、tips 1.1、set求交集 {1,2,3} & {2,3} & {1,2} {2} 其实就是位运算&#xff0c; 只有set可以这样使用&#xff0c; list没有这种用法 {1,2,3} | {2,3, 4} | {1,2} {1, 2, 3, 4} 并集 1.2、*与** * 序列(列表、元组)解包&#xff0c;如果是字典&#xff0c;那…

第一个 Flask 项目

第一个 Flask 项目 安装环境创建项目启动程序访问项目参数说明Flask对象的初始化参数app.run()参数 应用程序配置参数使用 Flask 的 config.from_object() 方法使用 Flask 的 config.from_pyfile() 方法使用 Flask 的 config.from_envvar() 方法步骤 1: 设置环境变量步骤 2: 编…