百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

还在用crontab? 分布式定时任务了解一下

ccwgpt 2024-11-09 11:23 20 浏览 0 评论

前言

日常任务开放中,我们会有很多异步、批量、定时、延迟任务要处理,go-zero中有 go-queue,推荐使用 go-queue 去处理,go-queue 本身也是基于 go-zero 开发的,其本身是有两种模式:

  • dq:依赖于beanstalkd ,适合延时、定时任务执行;
  • kq:依赖于 kafka ,适用于异步、批量任务执行;

本篇就先从 dq 开始,慢慢探究 go-queue 背后执行的逻辑。

dq 简介

dq 封装底层 beanstalkd 操作,分布式存储,延迟、定时设置。重启服务可以重新执行,但是消息不会丢失,因为消息的处理都交由 beanstalkd 完成。

可以看出使用非常简单,同时 dq 中使用了 redis setnx 保证了每个消息只被消费一次。但是在生产者端没有使用 redis 做消息存储,这个和前面描述的一致。

dq 的整体架构做了简单介绍,下面就开始正式的探索 :hammer:

生产者 example

func main() {
    producer := dq.NewProducer([]dq.Beanstalk{
        {
            Endpoint: "localhost:11300",
            Tube:     "tube",
        },
        {
            Endpoint: "localhost:11301",
            Tube:     "tube",
        },
    })
    for i := 1000; i < 1005; i++ {
    // Delay:延迟执行
        _, err := producer.Delay([]byte(strconv.Itoa(i)), time.Second*5)
    // At:在某一个时刻执行
        //_, err := producer.At([]byte(strconv.Itoa(i)), time.Now().Add(time.Second*5))
        if err != nil {
            fmt.Println(err)
        }
    }
}

从使用上,简单分为两步:

  1. NewProducer(opts):将本地队列的端口配置和主题配置传入生产者;
  2. producer.Delay():使用刚创建好的 生产者,调用它的 Delay() 。将需要异步发送的消息传入,Delay 还需要传入延迟执行的时间。

需要说明的是:创建的 producer 是一个接口,Delay() 只是接口其中的一个方法。后续会其他的方法和内部设计。那我们就继续往下探索吧~~~

深入生产者执行流程

下面从 example 的代码进去,看整个函数的调用链。

初始化

dq.NewProducer([]dq.Beanstalk{{opt1}, {opt2}, ...})    // 初始化生产者
    |- NewProducerNode(endpoint, tube)                                // endpoint,tube 来自传入的配置数组

紧接着就到 producerNode.go ,这个部分就会牵涉到 beanstalk 的初始化:

NewProducerNode(endpoint, tube)
    |- conn: newConnection(endpoint, tube)
        |- return &connection{}    

这就涉及到 beanstalkconnection.conn -> *beanstalk.Conn

但是在 newConnection() 中并没有对 beanstalk.Conn 进行初始化,这属于 延迟初始化

Delay

首先是生产者端调用 producer.Delay(data, timesecond) ,就把消息插入到内部队列,timesecond 就是延迟执行的时间。我们来看看 Delay() 到底做了什么?

p.Delay(data, timesecond)
    |- p.wrap(data, time)            // 将 data 和 time 包装到一块
        |- p.insert(nodeFn)
            |- node.Delay()             // for rangre p.node 每一个node都执行一遍 `Delay()`

p.insert 就是将上一步封装好的 data 传递给 p{cluster} 的每一个node去执行 node.Delay

在前面的 初始化 说过,最开始是没有对 conn 进行初始化,那现在要插入数据,总不能不初始化这个 conn

node.Delay()                                    // 配置中的每个node都执行 `Delay()`
    |- node.conn.get()                    // 获取node中的conn【conn==nil,就初始化一个conn】
    |- _, err := conn.Put(data, deplay, opts...)
        |- node.conn.reset()             // 出现err情况下,如OOM/Timeout等情况 -> 关闭conn,防止泄漏

所以最后 Delay 实际上是执行 tube.Put(data, delay)

tube.Put(data, delay)
    |- tube.Conn.cmd("put", ...)        // 生产者发布job

这里就涉及到 beanstalkPut 操作:首先看看生产者 Put 指令参数说明:

put <pri> <delay> <ttr> <bytes> <data>
  • <pri> :优先级,值越小优先级越高,默认为1024;
  • <delay> :延迟 ready 秒数,在这段时间 job 为 delayed 状态;
  • <ttr>time to run ,允许 worker 执行的最大秒数,如果 worker 在这段时间不能 delete,release,bury job,那么当 job 超时,服务器将自动 release 此job;
  • <bytes>job body的长度,不包含\r\n
  • <data>: job body data;

OK。那插入 job 成功,响应什么呢?

INSERTED <id>\r\n

返回的 id 是插入 job 的任务标识。到此 Put 分析完毕,跟着代码走一遍:

tube.Put(data, priority, daley, ttr)
    |- tube.Conn.cmd("put", ...)
    |- tube.Conn.readResp("INSERTED id")
|- return id, err            // 将id返回

这样我们在 example 中直接可以看到的 生产者 执行的操作就介绍完了。上图,图更好说话:

producer interface

那么除了 example 中使用的 Delay() ,还有其余几个方法:

Producer interface {
  At(body []byte, at time.Time) (string, error)
  Close() error
  Delay(body []byte, delay time.Duration) (string, error)
  Revoke(ids string) error
}
  • At:指定某个时间执行【实质也是执行 Delay()
  • Close:关闭全部node的连接
  • Delay:延迟执行。传入延迟的时间。
  • Revoke:实质上是当出现最小写入节点<2时,触发添加失败,将添加成功的job删除掉。

当然,事实上 dq 使用上,开发者只需要使用 At/Delay 就行了。也就是你只要知道你的任务是定时触发还是延迟触发即可。剩下的,dq 内部的封装都已经帮你做好了。

框架地址

https://github.com/tal-tech/go-queue

同时在 go-queue 也大量使用 go-zero 的流式处理库 fx

https://github.com/tal-tech/go-zero

欢迎使用 go-queuestar 支持我们!一起构建 go-zero 生态!

go-zero 系列文章见『微服务实践』公众号

相关推荐

定时任务工具,《此刻我要...》软件体验

之前果核给大家介绍过一款小众但实用的软件——小说规则下载器,可以把网页里的小说章节按照规则下载到本地,非常适合喜欢阅读小说的朋友。有意思的是,软件作者当时看到果核写的体验内容后,给反推荐到他的帖子里去...

前端定时任务的神库:Node-cron,让你的项目更高效!

在前端开发中,定时任务是一个常见的需求。无论是定时刷新数据、轮询接口,还是发送提醒,都需要一个可靠且灵活的定时任务解决方案。今天,我要向大家介绍一个强大的工具——Node-cron,它不仅能解决定时任...

Shutter Pro!一款多功能定时执行任务工具

这是一款可以在电脑上定时执行多种任务的小工具,使用它可以根据时间,电量等来设定一些定时任务,像定时打开程序、打开文件,定时关机重启,以及定时弹窗提醒等都可以轻松做到。这是个即开即用的小工具,无需安装,...

深度解析 Redis 缓存击穿及解决方案

在当今互联网大厂的后端开发体系中,Redis缓存占据着极为关键的地位。其凭借高性能、丰富的数据类型以及原子性操作等显著优势,助力众多高并发系统从容应对海量用户的访问冲击,已然成为后端开发从业者不可或...

从零搭建体育比分网站完整步骤(比较好的体育比分软件)

搭建一个体育比分网站是一个涉及前端、后端、数据源、部署和维护的完整项目。以下是从零开始搭建的详细流程:一、明确项目需求1.功能需求:实时比分展示(如足球、篮球、网球等)支持多个联赛和赛事历史数据查询比...

告别复杂命令行:GoCron 图形界面让定时任务触手可及

如果你是运维人员或者经常接触一些定时任务的配置,那么你一定希望有一款图形界面来帮助你方便的轻松配置定时任务,而GoCron就是这样一款软件,让你的配置可视化。什么是GoCron从名字你就可以大概猜到,...

Java任务管理框架核心技术解析与分布式高并发实战指南

在当今数字化时代,Java任务管理框架在众多应用场景中发挥着关键作用。随着业务规模的不断扩大,面对分布式高并发的复杂环境,掌握其核心技术并进行实战显得尤为重要。Java任务管理框架的核心技术涵盖多个方...

链表和结构体实现:MCU软件定时器(链表在单片机中的应用)

在一般的嵌入式产品设计中,介于成本、功耗等,所选型的MCU基本都是资源受限的,而里面的定时器的数量更是有限。在我们软件设计中往往有多种定时需求,例如脉冲输出、按键检测、LCD切屏延时等等,我们不可能...

SpringBoot定时任务(springboot定时任务每小时执行一次)

前言在我们开发中,经常碰到在某个时间点去执行某些操作,而我们不能人为的干预执行,这个时候就需要我们使用定时任务去完成该任务,下面我们来介绍下载springBoot中定时任务实现的方式。定时任务实现方式...

定时任务新玩法!systemd timer 完整实战详解

原文链接:「链接」Hello,大家好啊!今天给大家带来一篇使用systemdtimer实现定时任务调度的详细实战文章。相比传统的crontab,systemdtimer更加现代化、结构清晰...

Celery与Django:打造高效DevOps的定时任务与异步处理神器

本文详细介绍了Celery这一强大的异步任务队列系统,以及如何在Django框架中应用它来实现定时任务和异步处理,从而提高运维开发(DevOps)的效率和应用性能。下面我们先认识一下Cele...

订单超时自动取消的7种方案,我用这种!

前言在电商、外卖、票务等系统中,订单超时未支付自动取消是一个常见的需求。这个功能乍一看很简单,甚至很多初学者会觉得:"不就是加个定时器么?"但真到了实际工作中,细节的复杂程度往往会超...

裸机下多任务框架设计与实现(gd32裸机配置lwip 网络ping不通)

在嵌入式系统中,特别是在没有操作系统支持的裸机环境下,实现多任务执行是一个常见的挑战。本文将详细介绍一种基于定时器的多任务框架设计,通过全局时钟和状态机机制,实现任务的非阻塞调度,确保任务执行中不会出...

亿级高性能通知系统构建,小白也能拿来即用

作者介绍赵培龙,采货侠JAVA开发工程师分享概要一、服务划分二、系统设计1、首次消息发送2、重试消息发送三、稳定性的保障1、流量突增2、问题服务的资源隔离3、第三方服务的保护4、中间件的容错5、完善...

运维实战:深度拆解Systemd定时任务原理,90%的人不知道的玩法

运维实战:深度拆解Systemd定时任务原理,90%的人不知道的高效玩法一、Systemd定时任务的核心原理Systemd定时任务是Linux系统中替代传统cron的现代化解决方案,通过...

取消回复欢迎 发表评论: