Go基于协程池的延迟任务调度器

原理

通过用一个goroutine以及堆来存储要待调度的延迟任务，当达到调度时间后，将其添加到协程池中去执行。
主要是使用了chan、Mutex、atomic及ants协程池来实现。

用途

主要是用于高并发及大量定时任务要处理的情况，如果使用Go协程来实现每次延迟任务的调度，那么数量极大的goroutine将会占用内存，导致性能下降，使用协程池实现延迟任务的调度，会改善该情况。
如在物联网设备中，当连接数量达到几十万时，如果使用goroutine来处理心跳或者活跃检测，频繁的创建销毁goroutine会影响性能。

特色

在常见的cron等开源框架中使用的是数组存储待调度的任务，每次循环时都要排序，并且要删除某个任务则时间复杂度是O(n)。

本文通过使用堆及双重Map优化存储待调度的任务，使得添加任务时间复杂度为O(log n)，获取任务时间复杂度为O(1)，删除时间复杂度为O(1)。

API

创建

NewSchedule(workerNum int, options ...ants.Option) (*Schedule, error) //创建协程数是1的延迟任务调度器
s, _ := NewSchedule(1)

创建一个延迟调度任务器，workerNum是协程数量，options是ants协程池的配置，除了WithMaxBlockingTasks不能配置，别的都可以，具体参考：https://github.com/panjf2000/ants

调度一次

func (s *Schedule) ScheduleOne(job func(), duration time.Duration) (TaskId, error) //1秒后打印一次时间
taskId, _ := s.ScheduleOne(func() {fmt.Println(time.Now())
}, time.Second)

重复调度

func (s *Schedule) Schedule(job func(), duration time.Duration) (TaskId, error) //每隔一秒打印一次时间
taskId, _ := s.Schedule(func() {fmt.Println(time.Now())
}, time.Second)

取消调度

func (s *Schedule) Schedule(job func(), duration time.Duration) (TaskId, error) //每隔一秒打印一次时间
taskId, _ := s.Schedule(func() {fmt.Println(time.Now())
}, time.Second)
//休眠3秒后，取消调度
time.Sleep(3 * time.Second)
s.CancelTask(taskId)

停止调度

func (s *Schedule) Schedule(job func(), duration time.Duration) (TaskId, error) //每隔一秒打印一次时间
taskId, _ := s.Schedule(func() {fmt.Println(time.Now())
}, time.Second)
//休眠3秒后，停用延迟任务调度器
time.Sleep(3 * time.Second)
s.Shutdown()

代码

package scheduleimport ("container/heap""errors""github.com/panjf2000/ants/v2""math""sync""sync/atomic""time"
)var (// ErrScheduleShutdown 延迟任务调度器已关闭错误ErrScheduleShutdown = errors.New("schedule: schedule is already in shutdown")
)const InvalidTaskId = 0// Schedule 延迟调度的结构体，提供延迟调度任务的全部方法
// 通过NewSchedule方法创建Schedule，通过Schedule、ScheduleOne方法添加延迟调度任务，通过CancelTask方法取消任务，通过Shutdown停止延迟任务
type Schedule struct {//任务堆，按时间排序taskHeap taskHeap//可执行的任务Map，key是当前的任务id，value是任务的第一次原始id，用于优化取消任务时需要遍历堆去删除executeTaskMap map[TaskId]TaskId//任务id的Map，key是任务的第一次原始id，value是当前的任务id，用于优化取消任务时需要遍历堆去删除taskIdMap map[TaskId]TaskId//锁 保证并发安全mux sync.Mutex//调度器是否运行中running bool//任务运行池pool *ants.Pool//下一个任务idnextTaskId TaskId//添加任务ChanaddTaskChan chan *Task//删除任务ChanstopTaskChan chan struct{}//取消任务ChancancelTaskChan chan TaskId
}// NewSchedule 构建一个Schedule
// workerNum 工作的协程数量，options ants协程池的配置，除了WithMaxBlockingTasks不能配置，别的都可以，具体参考：https://github.com/panjf2000/ants
func NewSchedule(workerNum int, options ...ants.Option) (*Schedule, error) {//延迟任务的最大任务数量必须不限制options = append(options, ants.WithMaxBlockingTasks(0))//创建一个协程池pool, err := ants.NewPool(workerNum)if err != nil {return nil, err}//创建一个延迟调度结构体s := &Schedule{taskHeap:       make(taskHeap, 0),executeTaskMap: make(map[TaskId]TaskId),taskIdMap:      make(map[TaskId]TaskId),running:        true,nextTaskId:     0,mux:            sync.Mutex{},pool:           pool,addTaskChan:    make(chan *Task),stopTaskChan:   make(chan struct{}),cancelTaskChan: make(chan TaskId),}//启动调度 会开启一个协程去将即将要调度的任务添加到协程池中运行s.start()return s, nil
}// ScheduleOne 添加延迟调度任务，只调度一次
// job 执行的方法 duration 周期间隔，如果是负数立马执行，如果是负数立马且只执行一次
func (s *Schedule) ScheduleOne(job func(), duration time.Duration) (TaskId, error) {return s.doSchedule(job, duration, true)
}// Schedule 添加延迟调度任务，重复调度
// job 执行的方法 duration 周期间隔，如果是负数立马且只执行一次
func (s *Schedule) Schedule(job func(), duration time.Duration) (TaskId, error) {return s.doSchedule(job, duration, false)
}// doSchedule 添加延迟调度任务的具体实现
func (s *Schedule) doSchedule(job func(), duration time.Duration, onlyOne bool) (TaskId, error) {s.mux.Lock()defer s.mux.Unlock()//如果是负数 只执行一次if duration <= 0 {onlyOne = true}if s.running {task := &Task{job:         job,executeTime: time.Now().Add(duration),onlyOne:     onlyOne,duration:    duration,}//设置任务id并添加到任务堆中s.setTaskId(task, true)s.addTaskChan <- taskreturn task.originalId, nil} else {return InvalidTaskId, ErrScheduleShutdown}
}// CancelTask 取消延迟调度任务
// taskId 任务id
func (s *Schedule) CancelTask(taskId TaskId) {s.mux.Lock()defer s.mux.Unlock()if s.running {s.cancelTaskChan <- taskId}
}// Shutdown 结束延迟任务调度
func (s *Schedule) Shutdown() {s.mux.Lock()defer s.mux.Unlock()if s.running {s.running = falses.stopTaskChan <- struct{}{}}
}// IsShutdown 延迟任务调度是否关闭
func (s *Schedule) IsShutdown() bool {s.mux.Lock()defer s.mux.Unlock()return !s.running
}// start 启动延迟任务调度
func (s *Schedule) start() {go func() {for {now := time.Now()var timer *time.Timer//如果没有任务提交，睡眠等待任务if s.taskHeap.Len() == 0 {timer = time.NewTimer(math.MaxUint16 * time.Hour)} else {//查看第一个要执行的任务是否是被取消的task := s.taskHeap.Peek().(*Task)_, ok := s.executeTaskMap[task.id]if !ok {//是被取消的任务，移除后continues.taskHeap.Pop()continue} else {//设置执行间隔timer = time.NewTimer(task.executeTime.Sub(now))}}select {case <-timer.C://到达第一个任务执行时间task := s.taskHeap.Pop().(*Task)//提交到线程池执行，返回的error不需要处理，因为任务池是无限大_ = s.pool.Submit(task.job)//单次执行则删除，多次执行，则更新if task.onlyOne {s.removeTask(&task.originalId, task.id)} else {s.updateTask(task)}case originalTaskId := <-s.cancelTaskChan:timer.Stop()//如果取消的任务id在待执行任务列表中，则删除任务if taskId, ok := s.taskIdMap[originalTaskId]; ok {s.removeTask(&originalTaskId, taskId)}case task := <-s.addTaskChan:timer.Stop()//添加任务s.addTask(task)case <-s.stopTaskChan:timer.Stop()//关闭资源s.close()return}}}()
}// updateTask 更新延迟调度任务
func (s *Schedule) updateTask(executedTask *Task) {//拷贝 并设置新的执行时间和IDtask := *executedTasktask.executeTime = time.Now().Add(task.duration)//设置任务IDs.setTaskId(&task, false)//把已执行的任务删除s.removeTask(nil, executedTask.id)//添加新的任务s.addTask(&task)
}// removeTask 移除任务
func (s *Schedule) removeTask(originalId *TaskId, taskId TaskId) {//如果原始的任务ID不为空，则为使用者取消的，从任务Map中也删除if originalId != nil {delete(s.taskIdMap, *originalId)}delete(s.executeTaskMap, taskId)
}// addTask 添加任务
func (s *Schedule) addTask(task *Task) {s.taskIdMap[task.originalId] = task.ids.executeTaskMap[task.id] = task.originalIdheap.Push(&s.taskHeap, task)
}// setTaskId 设置任务id
func (s *Schedule) setTaskId(task *Task, addOriginalId bool) {//为了兼容低版本，使用旧版本的CAS去设值，保证可见性atomic.AddInt32((*int32)(&s.nextTaskId), 1)if atomic.LoadInt32((*int32)(&s.nextTaskId)) == InvalidTaskId {atomic.AddInt32((*int32)(&s.nextTaskId), 1)}task.id = TaskId(atomic.LoadInt32((*int32)(&s.nextTaskId)))if addOriginalId {task.originalId = task.id}
}// close 关闭Schedule资源和协程池的资源
func (s *Schedule) close() {s.taskHeap = nils.taskIdMap = nils.executeTaskMap = nils.pool.Release()close(s.addTaskChan)close(s.cancelTaskChan)close(s.stopTaskChan)s.pool = nils.addTaskChan = nils.cancelTaskChan = nils.stopTaskChan = nil
}// TaskId 任务ID
type TaskId int32// Task 调度任务结构体，是一个调度任务的实体信息
type Task struct {// 原始id，用于Schedule本身的删除使用，用两层Map的方式优化数组删除的O(n)时间复杂度originalId TaskId// 任务idid TaskId// 执行的时间，每次执行完，如果重复调度就重新计算executeTime time.Time// 周期间隔duration time.Duration// 执行的任务job func()// 是否只执行一次onlyOne bool
}// 任务的堆，使用队只需要在添加的时候进行排序，堆顶是最先要执行的任务
type taskHeap []*Task// 下面都是堆接口的实现func (t *taskHeap) Len() int {return len(*t)
}
func (t *taskHeap) Less(i, j int) bool {return (*t)[i].executeTime.After((*t)[j].executeTime)
}func (t *taskHeap) Swap(i, j int) {(*t)[i], (*t)[j] = (*t)[j], (*t)[i]
}func (t *taskHeap) Push(x interface{}) {*t = append(*t, x.(*Task))
}func (t *taskHeap) Pop() interface{} {old := *tn := len(old)x := old[n-1]*t = old[:n-1]return x
}// Peek 查看堆顶元素，非堆接口的实现
func (t *taskHeap) Peek() interface{} {return (*t)[len(*t)-1]
}