阿里云国际人工智能平台 PAI – AI调度引擎v2.0,实现多级任务抢占

人工智能平台 PAI – AI调度引擎v2.0,实现多级任务抢占
适用客户

互联网公司、大模型创业公司、AI科研机构

新增功能/规格

PAI 基于Quota的调度引擎,通过任务类型分级(如训练/推理/开发 和 优先级)与动态优先级评估算法,触发抢占机制,确保高优先级任务可以快速执行;同时结合AIMaster抢占式回滚技术,被中断任务自动保存中间状态并进入排队队列,资源释放后优先恢复执行,最终实现资源紧张场景下的高效调度。

抢占策略

PAI提供了多级资源配额(Quota)能力,支持您将PAI算力资源按层级进行划分,以便灵活管理和分配资源。此外,您可以启用本级或子级算力抢占功能,允许在当前资源配额中提交的任务抢占同级或子级资源配额的算力资源,从而充分利用算力资源。

资源配额(Quota)层级说明

PAI支持将算力资源按照企业组织架构的层级划分为父子级资源配额,形成如下图所示的树状结构(简称QuotaTree),以实现更灵活和精细的资源管理和分配。这种层级划分不仅使资源管理更加符合企业的实际需求,还提高了资源使用的效率和灵活性。

image

如上图所示,将算力资源拆分为了三级。其中,第一级Quota是第二级Quota的父级,第二级Quota是第一级Quota的子级,第二级和第三级Quota同理;第一级、第二级和第三级内的Quota视为同级。

  • 第一级:Root Quota

  • 第二级:Quota-1、Quota-2…Quota-n

  • 第三级:Quota-1.1、Quota-1.2、Quota-2.1…Quota-n.1

您可以基于组织或项目来划分和使用资源配额(Quota),从而更好地管理和使用各自的任务及资源。当资源紧张时,您可以构建多级资源配额(Quota),开启产品提供的抢占策略,实现资源的最大利用率:

  • 开启本级算力抢占

    • 适用场景:当使用同级资源配额(例如,第二级的Quota-1、Quota-2或Quota-n)创建的任务需要优先执行且资源紧张时。

    • 处理机制:系统将通过灵活的资源调度机制,从同级资源配额中调度算力资源,确保关键任务能够获得所需的计算资源。

  • 开启子级算力抢占

    • 适用场景:当同级资源配额紧缺,不能满足任务需求时。

    • 处理机制:系统将通过灵活的资源调度机制,从子级资源配额中调度算力资源,确保关键任务能够获得所需的计算资源。

开启本级算力抢占

操作方法

在创建或编辑资源配额时,为资源配额开启本级算力抢占。image

当多个任务同时提交到该资源配额时,系统将依据最优策略来分配抢占当前层级的计算资源,具体策略说明如下:

抢占策略

描述

高优先级

支持抢占本级算力资源的任务执行优先级。取值范围:[1,9],支持单选或按范围选择。其中数字越大表示优先级越高,数字越小表示优先级越低。

抢占低优先级

支持被抢占算力资源的任务执行优先级。取值范围:[1,9],支持单选或按范围选择。其中数字越大表示优先级越高,数字越小表示优先级越低。

说明

设置的抢占低优先级需小于设置的高优先级。

可被抢占模块

当资源配额的算力资源不足时,系统支持抢占同级资源配额下指定模块的算力资源,包括DLC、DSW或EAS模块。

使用示例

  • 抢占配置

    按照下图设置抢占配置:image

    • 高优先级:按范围,设置为6~9。

    • 抢占低优先级:按单选,设置为4。

    • 可被抢占模块:选择DLC和DSW。

  • 效果

    当使用该资源配额创建的任务优先级为6~9且算力资源不足时,系统可以抢占同级资源配额下,优先级为4的DLC或DSW模块的算力资源。

开启子级算力抢占

操作方法

在创建或编辑资源配额时,为资源配额开启子级算力抢占。image当使用父级资源配额提交任务且算力资源不足时,系统会按照最优策略回收子级Quota中正在运行的任务的算力资源,以保障父级资源配额任务的运行。具体策略说明如下:

抢占策略

描述

可被抢占优先级

支持被抢占的使用子级资源配额创建的任务执行优先级。取值范围:[1,9],支持按范围进行选择。其中数字越大表示优先级越高,数字越小表示优先级越低。

可被抢占模块

当父级资源配额的算力资源不足时,系统支持抢占使用子级资源配额创建的指定模块的算力资源,包括DLC、DSW或EAS模块。

使用示例

  • 抢占配置

    按照下图设置抢占配置:image

    • 可被抢占优先级:设置为1~3。

    • 可被抢占模块:选择DLC和DSW。

  • 效果

    当使用父级资源配额创建任务且算力资源不足时,系统可以抢占使用子级资源配额创建的,优先级为1~3的DLC或DSW模块的算力资源。

 

相关新闻

  • 阿里云计算巢-怎么快速打造企业内部的私有MCP市场?

    阿里云计算巢-怎么快速打造企业内部的私有MCP市场?

    随着企业数字化转型的深入,Model Context Protocol (MCP) 作为连接AI模型与企业数据的重要桥梁,正在成为企业AI应用的核心基础设施。阿里云计算巢为企业提供了完整的MCP市场解决方案,帮助企业快速构建内部私有化的MCP服务平台,实现AI能力的统一管理和分发。本文介绍如何基于计算巢构建企业内部MCP市场,包括系统架构设计、公开和私有MCP服务部署、权限管理以及企业级功能特性。 系统架构设计 核心组件与架构特点 核心组件: MCP集群管理:支持私有和公开MCP包的统一管理。 …

    常见问答 2025年11月22日
  • 怎么通过阿里云CDN提高全球用户的访问体验?

    对于业务遍布全球的企业而言,如何确保不同地区的用户都能获得快速、稳定的访问体验,是一项核心挑战。阿里云内容分发网络(CDN)作为一项关键的基础设施服务,正是解决这一难题的利器。它不仅仅是一个“加速器”,更是一个智能的全球流量调度系统。以下是阿里云CDN提升全球用户访问体验的三大核心技术策略。 一、智能调度:让用户永远连接到“最近”的节点 阿里云在全球拥有超过2800个节点,覆盖全球六大洲。当伦敦用户首次请求您的网站内容时,阿里云的智能调度系统(DNS) 会实时计算: 用户所在位置 当前各节点的负…

    常见问答 2025年10月17日
  • 阿里云代理商:轻量应用服务是什么?怎么用轻量应用服务器搭建个人博客?

    阿里云代理商:轻量应用服务是什么?怎么用轻量应用服务器搭建个人博客?

    轻量应用服务器是面向单机应用场景的新一代计算服务,提供精品应用一键部署,支持一站式的域名、网站、安全、运维、应用管理等服务,极大优化搭建简单应用的体验,降低了入门级用户使用云计算产品的门槛。本文为大家介绍阿里云轻量应用服务器的产品一些介绍以及使用轻量应用服务器搭建WordPress个人博客的图文教程,以供大家了解和使用轻量应用服务器。   一、准备工作: 已创建阿里云账号;没有账号的可找云枢国际@yunshuguoji获取帮助及提供用云方案。 请确保账号余额充足。   二、轻量应用服务器产品介绍…

    阿里云国际 2025年9月1日
  • 阿里云GPU服务器怎么保护数据与模型泄露?

    一、引言 在AI时代,训练数据和模型算法是企业的核心资产,其价值远超硬件本身。据统计,一次核心模型泄露可导致企业直接损失数百万美元,并丧失市场竞争优势。阿里云GPU服务器作为AI研发的基础设施,通过多层次安全防护和加密技术,可构建端到端的数据安全体系,有效防止从外部攻击到内部泄露的各种风险。正确的安全配置能将数据泄露风险降低90%以上,同时满足等保2.0、GDPR等合规要求。 二、系统化数据与模型保护方案 1. 基础架构安全加固 存储加密全面覆盖: 云盘加密:创建GPU实例时,为系统盘和数据盘启…

    使用指南 2025年11月26日
  • 添加域名

    不走HTTP/HTTPS协议,可以全站加速吗?

    不走HTTP/HTTPS协议,可以全站加速吗? 可以的,可以使用IP应用加速,IP应用加速是阿里云自主研发的四层加速功能,基于TCP/UDP的私有协议提供加速服务。IP应用加速功能为您提供网络传输加速,可降低服务的延迟和提升访问的可用性。本文介绍开通IP应用加速服务和添加IP应用加速域名的方法。 前提条件 您已开通DCDN服务。详细信息,请参见开通DCDN服务。 步骤一:申请开通IP应用加速服务 IP应用加速目前不支持自助开通,需要联系云枢国际商务经理 @yunshuguoji 申请开通。 步骤…

    DCDN全站加速 2024年1月8日
  • 阿里云国际代理:云数据库RDS数据库迁移上云

    阿里云国际代理:云数据库RDS数据库迁移上云

    阿里云关系型数据库RDS是一种安全稳定可靠、高性价比、可弹性伸缩的在线数据库服务;它为用户提供了一种简单、可靠、安全的方式来部署、操作和扩展数据库。具有安全可靠、解决运维烦恼、有效降低成本和自研增加特性等四大特性。 准备工作: 已拥有阿里云账号,若在上云或数据库迁移上云过程中有不懂的,可寻云枢国际@yunshuguoji助力免卡上云用云。   数据库迁移上云: 1、实例创建 创建RDS实例是一个简单的过程。登录RDS控制台后,点击创建实例,设置相关配置,选择业务需要的实例规格,然后提交…

    阿里云国际 2025年9月9日
联系我们

联系我们

电报:@yunshuguoji

邮件:yunshuguoji@outlook.com

工作时间:早上8:00-晚上11:00

认准电报
认准电报
分享本页
返回顶部