阿里云国际人工智能平台 PAI – DLC支持存储服务挂载配置读写权限

人工智能平台 PAI – DLC支持存储服务挂载配置读写权限
优化内容

PAI 训练服务DLC, 阿里云存储实例(OSS、NAS、 CPFS等)挂载时支持配置读写权限,支持用户存储实例权限的精细化管理。

在DLC训练任务中使用云存储

在提交DLC训练任务时,您可以通过代码配置或挂载的方式配置OSS、NAS、CPFS或MaxCompute存储,从而方便地在训练过程中直接读写相应存储中的数据。本文为您介绍如何在DLC训练任务中进行OSS、MaxCompute、NAS或CPFS的存储配置。

前提条件

使用OSS存储

通过挂载方式进行OSS存储配置

在创建分布式训练(DLC)任务时,挂载OSS存储。支持以下几种挂载类型,具体配置方法,请参见创建训练任务image

挂载类型

描述

数据集

通过数据集(自定义数据集或公共数据集)进行挂载,其中:

  • 公共数据集只支持只读挂载模式。

  • 自定义数据集(对象存储OSS)可以通过是否只读开关,来设置读写权限。

选择对象存储OSS类型的数据集,并配置挂载路径,当执行DLC任务时,系统会按照该路径来访问OSS中的数据。

直接挂载

直接挂载OSS Bucket存储路径,并通过是否只读开关,来设置读写权限。

当前DLC底层使用JindoFuse来挂载OSS。使用DLC的默认配置有功能限制(详情请参见JindoFuse),并不适合所有的场景。您可以通过调整参数,来适配具体的场景。具体操作,请参见JindoFuse

通过非挂载方式进行OSS存储配置

DLC任务支持使用OSS Pytorch Connector或OSS SDK来读写OSS数据。您可以在创建训练任务时,通过代码配置来配置相关代码文件。具体代码示例,请参见OSS Pytorch ConnectorOSS SDKimage

使用NAS/CPFS存储

您可以在创建分布式训练(DLC)任务时,通过绑定NAS/CPFS类型的自定义数据集或直接挂载的方式,使用NAS/CPFS存储。具体配置方法,请参见NAS使用image

挂载类型

描述

数据集

通过自定义数据集进行挂载,您可以通过是否只读开关,来设置读写权限。

直接挂载

直接挂载NAS/CPFS文件系统,并通过是否只读开关,来设置读写权限。

此外,您还可以在高级配置中,通过设置nconnect参数提升DLC容器访问NAS的吞吐性能。nconnect是NFS客户端Linux挂载选项,通过在客户端和服务器之间建立更多的TCP传输连接来提高吞吐性能。建议将nconnect设置为4,命令示例如下。

 
{"nconnect":"4"}

使用MaxCompute存储

通过非挂载的方式进行MaxCompute存储配置。您可以在创建训练任务时,通过代码配置来配置相关代码文件。具体代码示例,请参见MaxCompute使用image

常见问题

使用paiio读表没有报错但日志里显示killed?

由于资源不足,paiio未做限制,导致MaxCompute数据读取到内存时会出现膨胀现象,同时操作系统和其他系统组件也会占用部分内存。

相关新闻

  • 什么是WAF?

    什么是WAF?

    ‍什么是 WAF? Web 应用防火墙 (WAF) 是保护网站、移动应用和 API 的关键安全防御措施。它可以监控、过滤和阻止出入 Web 应用的数据包,保护 Web 应用免受威胁影响。WAF 旨在(训练用于)检测并防范 Web 流量中最常见的危险安全缺陷。因此,对于需要保护敏感数据免受未经授权访问的在线业务,如零售店、银行、医疗健康和社交媒体,WAF 极为重要。WAF 可部署为基于网络、主机或云的解决方案,在 HTTP 应用层提供应用数据可视性。 通常情况下,从购买WAF到使用WAF进行防护,…

  • 阿里云计算巢管理服务-实例管理-管理服务实例的生命周期事件

    阿里云计算巢管理服务-实例管理-管理服务实例的生命周期事件

    阿里云计算巢管理服务-实例管理-管理服务实例的生命周期事件 您可以通过云监控控制台针对服务实例的创建,续费和删除等系统事件进行订阅。订阅完成后,可以通过云监控控制台管理用户创建的服务实例的生命周期事件。本文介绍了如何管理服务实例的生命周期事件。 查看服务实例的生命周期事件 未订阅系统事件前,您只能在事件监控页查看服务实例的生命周期事件,以下步骤介绍如何查看服务实例的生命周期事件。 登录云监控控制台。 在左侧导航栏中,选择事件中心 > 系统事件。 在监控事件页签中,设置过滤条件,查看服务实例…

    计算巢服务 2025年8月5日
  • 阿里云计算巢管理服务-实例管理-查看账单明细

    阿里云计算巢管理服务-实例管理-查看账单明细

    查看账单明阿里云计算巢管理服务-实例管理-查看账单明细 全托管服务是由服务商提供的软件和阿里云资源,并且软件和阿里云资源均部署在服务商账号下。当全托管服务的部署类型是单租户部署时,服务商需要针对不同用户创建的服务实例收取云资源费用。服务商可以通过开启账单明细功能后查阅账单实现。本文介绍服务商如何开启账单明细功能。 启用标签 重要 启用标签后,需要等待24小时才可以查看账单明细。 在查看账单明细前,您需要先启用计算巢服务和服务实例的标签。 登录费用与成本控制台。 在左侧导航栏中,选择分账管理 &g…

    计算巢服务 2025年8月5日
  • 阿里云计算巢部署服务实例-如何创建私有部署服务实例

    阿里云计算巢部署服务实例-如何创建私有部署服务实例

    阿里云计算巢部署服务实例-如何创建私有部署服务实例 服务实例是用户基于计算巢服务创建的服务实体。本文介绍用户如何创建私有部署服务实例。 背景信息 若通过计算巢部署链接创建,请参见通过计算巢控制台创建服务实例。 若通过云市场商品链接(首页搜索或服务商提供)创建,请参见通过云市场创建服务实例。 本文只介绍了通用的服务实例部署流程,具体的服务实例部署详情,请参见对应的服务实例部署文档完成实例部署。例如,您购买了云XR实时渲染平台服务,则您可以参照云XR实时渲染平台服务实例部署文档完成实例部署。 通过计…

    计算巢服务 2025年8月13日
  • 阿里云计算巢服务升级场景说明-服务商通过代运维功能帮助用户升级服务实例

    阿里云计算巢服务升级场景说明-服务商通过代运维功能帮助用户升级服务实例

    阿里云计算巢服务升级场景说明-服务商通过代运维功能帮助用户升级服务实例   计算巢控制台支持用户授权服务商对包含代运维功能的私有部署服务实例或纯代运维服务实例进行升级操作。本文介绍服务商如何创建包含升级功能的私有部署服务以及如何帮助用户升级服务实例。 操作流程 本示例包含的操作步骤如下: 步骤一:创建包含代运维功能的私有部署服务 步骤二:创建服务实例 步骤三:创建新版本服务 步骤四:升级服务实例 步骤一:创建包含代运维功能的私有部署服务 登录计算巢控制台。 在左侧导航栏中,选择我的服务…

    计算巢服务 2025年8月1日
  • 怎么使用CDN解决图片压缩优化?

    怎么使用CDN解决图片压缩优化?

    当用户因图片加载过慢而关闭网页时,您已损失了潜在转化。据 Akamai 研究,页面加载延迟 1 秒将使转化率下降 7%。本文将揭秘阿里云 CDN 的智能图片处理技术,解决你的图片性能瓶颈。 一、准备工作 一个有效的阿里云账户;如果你还没有阿里云账号或上云实际使用云服务过程中有不懂的,可寻云枢国际@yunshuguoji助力免卡上云用云以及享受专属优惠和技术支持。 拥有CDN服务,某些处理实现得开启阿里云 OSS 存储服务。 二、开启图像处理 1.登录CDN控制台。 2.在左侧导航栏,单击域名管理…

    常见问答 2025年10月13日
联系我们

联系我们

电报:@yunshuguoji

邮件:yunshuguoji@outlook.com

工作时间:早上8:00-晚上11:00

认准电报
认准电报
分享本页
返回顶部