Celery框架

2023-06-03 00:03:53 来源:博客园

打印 放大 缩小

Celery框架

1. 什么是celery

celery是一个简答, 灵活且可靠的, 处理大量消息的分布式系统, 专注于实时处理的异步任务队列, 同时也支持任务调度.

这里面提到了一个概念: 分布式系统

一个系统应用(网站), 会有相关组件(web服务器, web应用, 数据库, 消息中间件), 将它们架构在不同的服务器上, 不同的服务器的不同组件之间通过消息通信的方式来实现协调工作, 这种模式叫分布式系统优点: 实现负载均衡, 避免单点故障

Celery的架构存在三部分组成, 消息中间件(message broker), 任务执行单元(worker)和任务结果储存(task result store)组成.


(资料图片)

  • 消息中间件

Celery本身不提供消息服务, 但是可以方便的和第三方提供的消息中间件集成, 包括RabbitMQ, Redis

  • 任务执行单元

Worker是Celery提供的任务执行的单元, worker并发的运行在分布式的系统节点中.

  • 任务结果储存

Task result store用来储存Worker执行的任务的结果, Celery支持以不同的方式储存任务的结果, 包括AMQP, Redis

celery具有以下优点

Simple(简单)Celery 使用和维护都非常简单,并且不需要配置文件。Highly Available(高可用)woker和client会在网络连接丢失或者失败时,自动进行重试。并且有的brokers 也支持“双主”或者“主/从”的方式实现高可用。Fast(快速)单个的Celery进程每分钟可以处理百万级的任务,并且只需要毫秒级的往返延迟(使用 RabbitMQ, librabbitmq, 和优化设置时)Flexible(灵活)Celery几乎每个部分都可以扩展使用,自定义池实现、序列化、压缩方案、日志记录、调度器、消费者、生产者、broker传输等等。

另外, Celery还支持不同的并发和序列化的手段

  • 并发:Prefork, Eventlet, gevent, threads/single threaded
  • 序列化:pickle, json, yaml, msgpack. zlib, bzip2 compression, Cryptographic message signing 等等

2. celery使用场景

celery是一个强大的 分布式任务队列的异步处理框架,它可以让任务的执行完全脱离主程序,甚至可以被分配到其他主机上运行。我们通常使用它来实现异步任务(async task)和定时任务(crontab)。

异步任务:将耗时操作任务提交给Celery去异步执行,比如发送短信/邮件、消息推送、音视频处理等等

定时任务:定时执行某件事情,比如每天数据统计

3. Celery执行异步任务

执行流程:

  1. 任务定义:首先,需要定义 Celery 任务。任务可以是 Python 函数或类的方法,用 @task装饰器进行修饰。任务定义了要执行的具体操作。
  2. 任务发布:任务的发布者(生产者)使用 Celery 提供的客户端接口,将任务发送到任务队列中(例如 RabbitMQ 或 Redis)
  3. 任务调度:任务队列中的任务被 Celery 的worker(消费者)获取并执行。worker可以在同一台或多台机器上运行,构成一个分布式任务执行的集群。
  4. 任务执行:一旦worker获取到任务,它会根据任务的定义,调用相应的函数或方法执行具体的操作。任务可以是同步的或异步的,取决于任务定义中是否使用了异步执行的修饰器。
  5. 任务结果:任务执行完成后,worker将执行结果返回给消息代理,并将结果存储在结果后端(例如数据库、缓存或消息队列)中,以供后续查询。

3.1 基本使用

celery_task.py

# -*- encoding:utf-8 -*-# @time: 2023/5/25 17:06# @author: ifengimport celeryimport timebackend = "redis://:123456@127.0.0.1:6379/1"  # 配置任务结果储存位置broker = "redis://:123456@127.0.0.1:6379/2"  # 配置消息中间件cel = celery.Celery("test", backend=backend, broker=broker)@cel.taskdef send_email(name):    print("向%s发送邮件" % name)    time.sleep(5)    print("向%s发送邮件完成" % name)    return "%s, 发送完毕" % name@cel.taskdef send_msg(name):    print("向%s发送信息" % name)    time.sleep(5)    print("向%s发送信息完毕" % name)    return "%s, 发送完毕" % name

produce_task.py

# -*- encoding:utf-8 -*-# @time: 2023/5/25 17:21# @author: ifengfrom celery_task import send_email, send_msgresult = send_email.delay("ifeng")  # send_taskprint(result.id)# print(result.get())  # 获取返回值result = send_msg.delay("ifeng")print(result.id)

result.py

# -*- encoding:utf-8 -*-# @time: 2023/5/25 20:04# @author: ifengfrom celery.result import AsyncResultfrom celery_task import celasync_result = AsyncResult(id="75ff05e6-912a-44f4-a481-eb5bff411488", app=cel)if async_result.successful():    result = async_result.get()    print(result)    # result.forget() # 将结果删除elif async_result.failed():    print("执行失败")elif async_result.status == "PENDING":    print("任务等待中被执行")elif async_result.status == "RETRY":    print("任务异常后正在重试")elif async_result.status == "STARTED":    print("任务已经开始被执行")

开启work: celery worker -A celery_task -l info -P eventlet

3.2 多任务结构

注意创建文件夹的时候要创建python package, 否则会出现导报不成功

celery.py

# -*- encoding:utf-8 -*-# @time: 2023/5/25 20:24# @author: ifengfrom celery import Celerycel = Celery("celery_demo",             broker="redis://:123456@127.0.0.1:6379/1",             backend="redis://:123456@127.0.0.1:6379/2",             # 包含以下两个任务文件,去相应的py文件中找任务,对多个任务做分类             include=["celery_task.task01",                      "celery_task.task02"                      ])# 时区cel.conf.timezone = "Asia/Shanghai"# 是否使用UTCcel.conf.enable_utc = False

task01.py

# -*- encoding:utf-8 -*-# @time: 2023/5/25 20:25# @author: ifengimport timefrom .celery import cel@cel.taskdef send_email(res):    time.sleep(5)    return "完成向%s发送邮件任务" % res

task02.py

# -*- encoding:utf-8 -*-# @time: 2023/5/25 20:25# @author: ifengimport timefrom .celery import cel@cel.taskdef send_msg(name):    time.sleep(5)    return "完成向%s发送短信任务" % name

produce_task.py

# -*- encoding:utf-8 -*-# @time: 2023/5/25 20:28# @author: ifengfrom celery_task.task01 import send_emailfrom celery_task.task02 import send_msgresult = send_email.delay("ifeng")print(result.id)result = send_msg.delay("ifeng")print(result.id)

result.py

# -*- encoding:utf-8 -*-# @time: 2023/5/25 20:30# @author: ifengfrom celery.result import AsyncResultfrom celery_task.celery import celasync_result = AsyncResult(id="90e941e4-97e0-4c53-8609-91fb8a91768e", app=cel)if async_result.successful():    result = async_result.get()    print(result)    # result.forget() # 将结果删除,执行完成,结果不会自动删除    # async.revoke(terminate=True)  # 无论现在是什么时候,都要终止    # async.revoke(terminate=False) # 如果任务还没有开始执行呢,那么就可以终止。elif async_result.failed():    print("执行失败")elif async_result.status == "PENDING":    print("任务等待中被执行")elif async_result.status == "RETRY":    print("任务异常后正在重试")elif async_result.status == "STARTED":    print("任务已经开始被执行")

开启work:celery worker -A celery_task -l info -P eventlet,添加任务(执行produce_task.py),检查任务执行结果(执行check_result.py)

4.celery执行定时任务

4.1 简单结构实现定时任务

produce_task.py

from celery_task import send_emailfrom datetime import datetime# 方式一# v1 = datetime(2020, 3, 11, 16, 19, 00)# print(v1)# v2 = datetime.utcfromtimestamp(v1.timestamp())# print(v2)# result = send_email.apply_async(args=["egon",], eta=v2)# print(result.id)# 方式二ctime = datetime.now()# 默认用utc时间utc_ctime = datetime.utcfromtimestamp(ctime.timestamp())from datetime import timedeltatime_delay = timedelta(seconds=10)task_time = utc_ctime + time_delay# 使用apply_async并设定时间result = send_email.apply_async(args=["egon"], eta=task_time)print(result.id)

4.2 多目录结构实现定时任务

celery.py

from datetime import timedeltafrom celery import Celeryfrom celery.schedules import crontabcel = Celery("tasks", broker="redis://127.0.0.1:6379/1", backend="redis://127.0.0.1:6379/2", include=[    "celery_tasks.task01",    "celery_tasks.task02",])cel.conf.timezone = "Asia/Shanghai"cel.conf.enable_utc = Falsecel.conf.beat_schedule = {    # 名字随意命名    "add-every-10-seconds": {        # 执行tasks1下的test_celery函数        "task": "celery_tasks.task01.send_email",        # 每隔2秒执行一次        # "schedule": 1.0,        # "schedule": crontab(minute="*/1"),        "schedule": timedelta(seconds=6),  # 间隔时间        # 传递参数        "args": ("张三",)  # 相关参数    },    # "add-every-12-seconds": {    #     "task": "celery_tasks.task01.send_email",    #     每年4月11号,8点42分执行    #     "schedule": crontab(minute=42, hour=8, day_of_month=11, month_of_year=4),    #     "args": ("张三",)    # },}
# 启动 Beat 程序$ celery beat -A proj
# Celery Beat进程会读取配置文件的内容,周期性的将配置中到期需要执行的任务发送给任务队列# 如果这个没有关会导致历史遗留问题, 导致储存多个任务在redis的List中, 这个需要关注
# 之后启动 worker 进程.$ celery -A proj worker -l info 或者$ celery -B -A proj worker -l info

5.django中使用celery

项目根目录创建celery包,目录结构如下:

mycelery/├── config.py├── __init__.py├── main.py└── sms/    ├── __init__.py    ├── tasks.py

配置文件config.py:

broker_url = "redis://127.0.0.1:6379/15"result_backend = "redis://127.0.0.1:6379/14"

任务文件tasks.py

# celery的任务必须写在tasks.py的文件中,别的文件名称不识别!!!from mycelerys.main import appimport timeimport logginglog = logging.getLogger("django")@app.task  # name表示设置任务的名称,如果不填写,则默认使用函数名做为任务名def send_sms(mobile):    """发送短信"""    print("向手机号%s发送短信成功!"%mobile)    time.sleep(5)    return "send_sms OK"@app.task  # name表示设置任务的名称,如果不填写,则默认使用函数名做为任务名def send_sms2(mobile):    print("向手机号%s发送短信成功!" % mobile)    time.sleep(5)    return "send_sms2 OK"

最后在main.py主程序中对django的配置文件进行加载

# 主程序import osfrom celery import Celery# 创建celery实例对象app = Celery("sms")# 把celery和django进行组合,识别和加载django的配置文件os.environ.setdefault("DJANGO_SETTINGS_MODULE", "celeryPros.settings.dev")# 通过app对象加载配置app.config_from_object("mycelerys.config")# 加载任务# 参数必须必须是一个列表,里面的每一个任务都是任务的路径名称# app.autodiscover_tasks(["任务1","任务2"])app.autodiscover_tasks(["mycelerys.sms",])# 启动Celery的命令# 强烈建议切换目录到mycelery根目录下启动# celery -A mycelery.main worker --loglevel=info

Django视图调用:

from django.shortcuts import render# Create your views here.from django.shortcuts import render,HttpResponsefrom mycelerys.sms.tasks import send_sms,send_sms2from datetime import timedeltafrom datetime import datetimedef test(request):    ################################# 异步任务    # 1. 声明一个和celery一模一样的任务函数,但是我们可以导包来解决    # send_sms.delay("110")    # send_sms2.delay("119")    # send_sms.delay() 如果调用的任务函数没有参数,则不需要填写任何内容    ################################# 定时任务    # ctime = datetime.now()    # # 默认用utc时间    # utc_ctime = datetime.utcfromtimestamp(ctime.timestamp())    # time_delay = timedelta(seconds=10)    # task_time = utc_ctime + time_delay    # result = send_sms.apply_async(["911", ], eta=task_time)    # print(result.id)    return HttpResponse("ok")

6.Celery作为第三方模块集成到项目中

首先看一下目录结构

luffycityapi/           # 服务端项目根目录└── luffycityapi/       # 主应用目录    ├── apps/           # 子应用存储目录      ├   └── users/            # django的子应用    ├       └── tasks.py      # [新增]分散在各个子应用下的异步任务模块    ├── settings/     # [修改]django的配置文件存储目录[celery的配置信息填写在django配置中即可]    ├── __init__.py   # [修改]设置当前包目录下允许外界调用celery应用实例对象    └── celery.py     # [新增]celery入口程序,相当于上一种用法的main.py

6.1 具体执行流程

  1. 创建celery.py文件, 定义celery框架, 会帮集成监听消息功能
  2. 在dev.py配置文件中新增相关配置信息
  3. 在app中创建任务tasks
  4. 在app的视图函数的api向队列(redis,rabbitmq)中推送信息
  5. 消费者从队列中获取消息并扔给worker, worker可以在不同服务器上, 构成一个分布式集群

6.2 代码部分

luffycityapi/celery.py, 主应用目录下创建celery入口程序, 创建celery对象并加载配置和异步任务

import osfrom celery import Celery# 必须在实例化celery应用对象之前执行os.environ.setdefault("DJANGO_SETTINGS_MODULE", "luffycityapi.settings.dev")# 实例化celery对象app = Celery("luffycityapi")# 指定任务的队列名称app.conf.task_default_queue = "Celery"# 也可以把配置写在django的项目配置中app.config_from_object("django.conf:settings", namespace="CELERY")  # 设置django中配置信息以 "CELERY_"开头为celery的配置信息# 自动根据配置查找django的所有子应用下的tasks任务文件app.autodiscover_tasks()

settings/dev.py, 新增celery配置信息, 代码

# Celery异步任务队列框架的配置项[注意:django的配置项必须大写,所以这里的所有配置项必须全部大写]# 任务队列CELERY_BROKER_URL = "redis://@127.0.0.1:6379/14"# 结果队列CELERY_RESULT_BACKEND = "redis://@127.0.0.1:6379/15"# 时区,与django的时区同步CELERY_TIMEZONE = TIME_ZONE# 防止死锁CELERY_FORCE_EXECV = True# 设置并发的worker数量CELERYD_CONCURRENCY = 200# 设置失败允许重试[这个慎用,如果失败任务无法再次执行成功,会产生指数级别的失败记录]CELERY_ACKS_LATE = True# 每个worker工作进程最多执行500个任务被销毁,可以防止内存泄漏,500是举例,根据自己的服务器的性能可以调整数值CELERYD_MAX_TASKS_PER_CHILD = 500# 单个任务的最大运行时间,超时会被杀死[慎用,有大文件操作、长时间上传、下载任务时,需要关闭这个选项,或者设置更长时间]CELERYD_TIME_LIMIT = 10 * 60# 任务发出后,经过一段时间还未收到acknowledge, 就将任务重新交给其他worker执行CELERY_DISABLE_RATE_LIMITS = True# celery的任务结果内容格式CELERY_ACCEPT_CONTENT = ["json", "pickle"]# 之前定时任务(定时一次调用),使用了apply_async({}, countdown=30);# 设置定时任务(定时多次调用)的调用列表,需要单独运行SCHEDULE命令才能让celery执行定时任务:celery -A mycelery.main beat,当然worker还是要启动的# https://docs.celeryproject.org/en/stable/userguide/periodic-tasks.htmlfrom celery.schedules import crontabCELERY_BEAT_SCHEDULE = {    "user-add": {  # 定时任务的注册标记符[必须唯一的]        "task": "delayed_task",   # 定时任务的任务名称        "schedule": 10,  # 定时任务的调用时间,10表示每隔10秒调用一次add任务        # "schedule": crontab(hour=7, minute=30, day_of_week=1),,  # 定时任务的调用时间,每周一早上7点30分调用一次add任务    }}

luffycityapi/__init__.py, 主应用下初始化,

import pymysqlfrom .celery import app as celery_apppymysql.install_as_MySQLdb()__all__ = ["celery_app"]

users/tasks.py, 创建任务列表

from celery import shared_taskfrom luffycityapi.utils.ronglianyunapi import sms_send# 记录日志import logginglogging.getLogger("django")@shared_task(name="send_sms")def send_sms(tid, mobile, datas):    try:        return sms_send(tid, mobile, datas)    except Exception as e:        logging.error(f"手机号:{mobile},发送短信失败错误: {e}")@shared_task(name="delayed_task")def delayed_task():    logging.info(f"延时消息发送成功啦!!!")    return "delayed_task 执行完毕"

此时在django中用户发送短信, 就可以改成异步发送短信了

user/views.py, 视图中调用异步发送短信的任务

from .tasks import send_smssend_sms.delay(settings.RONGLIANYUN.get("reg_tid"),mobile, datas=(code, time // 60))

6.3 启动celery

cd ~/Desktop/luffycity/luffycityapi# 1. 普通运行模式,关闭终端以后,celery就会停止运行celery -A luffycityapi worker  -l INFO# 2. 启动多worker进程模式,以守护进程的方式运行,不需要在意终端。但是这种运行模型,一旦停止,需要手动启动。celery multi start worker -A luffycityapi -E --pidfile="/home/ifeng/Desktop/luffycity/luffycityapi/logs/worker1.pid" --logfile="/home/ifeng/Desktop/luffycity/luffycityapi/logs/celery.log" -l info -n worker1# 3. 启动多worker进程模式celery multi stop worker -A luffycityapi --pidfile="/home/ifeng/Desktop/luffycity/luffycityapi/logs/worker1.pid"

6.4 补充

也可以在django终端下调用celery

$ python manage.py shell>>> from users.tasks import delayed_task>>> res = delayed_task.delay()>>> res = delayed_task.apply_async(countdown=15)>>> res.id"893c31ab-e32f-44ee-a321-8b07e9483063">>> res.state"SUCCESS">>> res.result

定时任务的调用器启动, 可以在运行了worker以后, 使用一下命令:

cd ~/Desktop/luffycity/luffycityapicelery -A luffycityapi beat

定时任务执行结果展示(十秒执行一次):

[2023-06-02 21:17:18,144: INFO/ForkPoolWorker-3] 延时消息发送成功啦!!![2023-06-02 21:17:18,147: INFO/ForkPoolWorker-3] Task delayed_task[3a1033fe-b1a2-4f7f-9fe6-61d1ef9816ab] succeeded in 0.0034034299997074413s: "delayed_task 执行完毕"[2023-06-02 21:17:28,140: INFO/MainProcess] Task delayed_task[905f3644-297a-430a-ae23-75be7e3a2ad3] received[2023-06-02 21:17:28,142: INFO/ForkPoolWorker-3] 延时消息发送成功啦!!![2023-06-02 21:17:28,143: INFO/ForkPoolWorker-3] Task delayed_task[905f3644-297a-430a-ae23-75be7e3a2ad3] succeeded in 0.0014366229997904156s: "delayed_task 执行完毕"[2023-06-02 21:17:38,140: INFO/MainProcess] Task delayed_task[c1962489-e615-4e6d-a5b0-171826d1b56e] received[2023-06-02 21:17:38,141: INFO/ForkPoolWorker-3] 延时消息发送成功啦!!![2023-06-02 21:17:38,143: INFO/ForkPoolWorker-3] Task delayed_task[c1962489-e615-4e6d-a5b0-171826d1b56e] succeeded in 0.0013498770003934624s: "delayed_task 执行完毕"
关键词:

责任编辑:ERM523

相关阅读