阿里云国际人工智能平台 PAI – AI调度引擎v2.0,实现多级任务抢占

人工智能平台 PAI – AI调度引擎v2.0,实现多级任务抢占
适用客户

互联网公司、大模型创业公司、AI科研机构

新增功能/规格

PAI 基于Quota的调度引擎,通过任务类型分级(如训练/推理/开发 和 优先级)与动态优先级评估算法,触发抢占机制,确保高优先级任务可以快速执行;同时结合AIMaster抢占式回滚技术,被中断任务自动保存中间状态并进入排队队列,资源释放后优先恢复执行,最终实现资源紧张场景下的高效调度。

抢占策略

PAI提供了多级资源配额(Quota)能力,支持您将PAI算力资源按层级进行划分,以便灵活管理和分配资源。此外,您可以启用本级或子级算力抢占功能,允许在当前资源配额中提交的任务抢占同级或子级资源配额的算力资源,从而充分利用算力资源。

资源配额(Quota)层级说明

PAI支持将算力资源按照企业组织架构的层级划分为父子级资源配额,形成如下图所示的树状结构(简称QuotaTree),以实现更灵活和精细的资源管理和分配。这种层级划分不仅使资源管理更加符合企业的实际需求,还提高了资源使用的效率和灵活性。

image

如上图所示,将算力资源拆分为了三级。其中,第一级Quota是第二级Quota的父级,第二级Quota是第一级Quota的子级,第二级和第三级Quota同理;第一级、第二级和第三级内的Quota视为同级。

  • 第一级:Root Quota

  • 第二级:Quota-1、Quota-2…Quota-n

  • 第三级:Quota-1.1、Quota-1.2、Quota-2.1…Quota-n.1

您可以基于组织或项目来划分和使用资源配额(Quota),从而更好地管理和使用各自的任务及资源。当资源紧张时,您可以构建多级资源配额(Quota),开启产品提供的抢占策略,实现资源的最大利用率:

  • 开启本级算力抢占

    • 适用场景:当使用同级资源配额(例如,第二级的Quota-1、Quota-2或Quota-n)创建的任务需要优先执行且资源紧张时。

    • 处理机制:系统将通过灵活的资源调度机制,从同级资源配额中调度算力资源,确保关键任务能够获得所需的计算资源。

  • 开启子级算力抢占

    • 适用场景:当同级资源配额紧缺,不能满足任务需求时。

    • 处理机制:系统将通过灵活的资源调度机制,从子级资源配额中调度算力资源,确保关键任务能够获得所需的计算资源。

开启本级算力抢占

操作方法

在创建或编辑资源配额时,为资源配额开启本级算力抢占。image

当多个任务同时提交到该资源配额时,系统将依据最优策略来分配抢占当前层级的计算资源,具体策略说明如下:

抢占策略

描述

高优先级

支持抢占本级算力资源的任务执行优先级。取值范围:[1,9],支持单选或按范围选择。其中数字越大表示优先级越高,数字越小表示优先级越低。

抢占低优先级

支持被抢占算力资源的任务执行优先级。取值范围:[1,9],支持单选或按范围选择。其中数字越大表示优先级越高,数字越小表示优先级越低。

说明

设置的抢占低优先级需小于设置的高优先级。

可被抢占模块

当资源配额的算力资源不足时,系统支持抢占同级资源配额下指定模块的算力资源,包括DLC、DSW或EAS模块。

使用示例

  • 抢占配置

    按照下图设置抢占配置:image

    • 高优先级:按范围,设置为6~9。

    • 抢占低优先级:按单选,设置为4。

    • 可被抢占模块:选择DLC和DSW。

  • 效果

    当使用该资源配额创建的任务优先级为6~9且算力资源不足时,系统可以抢占同级资源配额下,优先级为4的DLC或DSW模块的算力资源。

开启子级算力抢占

操作方法

在创建或编辑资源配额时,为资源配额开启子级算力抢占。image当使用父级资源配额提交任务且算力资源不足时,系统会按照最优策略回收子级Quota中正在运行的任务的算力资源,以保障父级资源配额任务的运行。具体策略说明如下:

抢占策略

描述

可被抢占优先级

支持被抢占的使用子级资源配额创建的任务执行优先级。取值范围:[1,9],支持按范围进行选择。其中数字越大表示优先级越高,数字越小表示优先级越低。

可被抢占模块

当父级资源配额的算力资源不足时,系统支持抢占使用子级资源配额创建的指定模块的算力资源,包括DLC、DSW或EAS模块。

使用示例

  • 抢占配置

    按照下图设置抢占配置:image

    • 可被抢占优先级:设置为1~3。

    • 可被抢占模块:选择DLC和DSW。

  • 效果

    当使用父级资源配额创建任务且算力资源不足时,系统可以抢占使用子级资源配额创建的,优先级为1~3的DLC或DSW模块的算力资源。

 

相关新闻

  • 阿里云计算巢-企业级AI工具的安全部署新选择

    阿里云计算巢-企业级AI工具的安全部署新选择

    阿里云计算巢私有化MCP市场依托阿里云弹性计算资源,支持自主可控的私有化部署方案。平台同时支持OpenAPI、SSE、StreamableHttp方式接入,支持Higress云原生网关做网络控制,所有的MCP工具直接部署在用户云账号下,5分钟极速部署,确保数据安全与便捷性并重。 企业级私有化MCP部署场景 适用条件 核心价值 对数据安全和隐私有严格要求。 需要AI工具访问企业内网资源。 要求MCP服务与其他业务隔离。 需要统一管理多种MCP工具。 资源自主可控:MCP工具部署在用户自己的云账户下…

    使用指南 2025年11月22日
  • 阿里云计算巢管理服务-交付管理-如何修改服务部署权限

    阿里云计算巢管理服务-交付管理-如何修改服务部署权限

    阿里云计算巢管理服务-交付管理-如何修改服务部署权限 您可通过配置用户白名单来限制非授权用户访问服务部署链接,同时还可为白名单内的不同用户设置相应的权限。本文将介绍如何调整服务部署权限及设置用户白名单。 操作步骤 登录计算巢控制台。 在左侧导航栏中,选择我的服务,找到您需要修改权限的服务,单击服务名称,进入服务详情页面。 在服务部署区域,单击部署链接权限后的修改,将服务实例的部署链接权限修改为受限的或隐藏的。 说明 部署链接权限默认选择的权限是公开的,如果您的服务在创建时,部署链接权限是默认选项…

    计算巢服务 2025年7月30日
  • 新手怎么使用阿里云控制台常用功能?

    一、引言 阿里云控制台作为全球第三大云服务商的管理界面,集成了200+云服务的复杂功能。对于新用户,功能查找困难和操作路径不清晰是主要使用障碍。据统计,超过65%​ 的新手用户在前两周会遇到界面导航困惑,40%​ 的用户因操作失误导致配置错误。通过系统化的功能导览,新手可在3小时内掌握核心功能的操作流程,将管理效率提升300%。 二、阿里云控制台全景概览 1. 首先大概了解控制台整体布局 2. 新手必知核心概念 资源管理逻辑: 地域选择:不同地域资源完全隔离,创建资源前务必选择正确地域 资源组:…

    使用指南 2025年11月27日
  • 阿里云计算巢部署服务实例-创建试用服务实例

    阿里云计算巢部署服务实例-创建试用服务实例

    阿里云计算巢部署服务实例-创建试用服务实例 重要 本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。 试用服务实例提供了正式服务实例的大部分功能,您可以在试用服务实例上浏览、探索服务商和计算巢提供的各项功能,验证可行性。创建试用服务实例时,不会产生费用。本文为您介绍试用服务实例的详细信息。 使用须知 创建试用服务实例前,您需要了解如下信息。 试用服务实例的创建过程和创建正式服务实例是一致的。 试用服务实例有限定的保留天数,超过天数后会自动删除,请勿用于生产用途…

    计算巢服务 2025年8月14日
  • 阿里云计算巢-怎么一键部署2048小游戏?

    阿里云计算巢-怎么一键部署2048小游戏?

    本文介绍一键部署2048小游戏的详细信息。 服务说明 本示例会自动的构建计算巢服务,创建过程大约持续2分钟,当服务变成待提交后构建成功。具体的服务构建流程为 上传文件并构建计算巢文件部署物 创建计算巢服务并关联文件部署物 服务架构 本部署架构单机版为单机ECS部署,通过公网IP的80端口访问。 服务构建计费说明 测试本服务构建无需任何费用,创建服务实例涉及的费用参考服务实例计费说明。 RAM账号所需权限 本服务需要对ECS、VPC等资源进行访问和创建操作,若您使用RAM用户创建服务实例,需要在创…

    常见问答 2025年12月3日
  • 阿里云计算巢服务升级管理-升级服务实例

    阿里云计算巢服务升级管理-升级服务实例

    阿里云计算巢服务升级管理-升级服务实例   在服务商发布了新的服务版本后,您可以根据实际需求,将服务实例升级到对应的新版本。服务实例升级支持单个服务实例升级和批量升级操作,下面将分别进行介绍。 前提条件 升级的服务有两个以上的版本,创建服务新版本的更多信息,请参见 更新服务,且新版本要支持服务实例升级,服务升级配置请参见 服务升级配置。 基于服务旧版本进行服务实例部署,服务实例部署详细步骤请参见 部署服务实例。 单个服务实例升级 当服务创建了新版本后,用户可以触发服务实例的升级,下文介…

    计算巢服务 2025年8月1日
联系我们

联系我们

电报:@yunshuguoji

邮件:yunshuguoji@outlook.com

工作时间:早上8:00-晚上11:00

认准电报
认准电报
分享本页
返回顶部