人工智能平台 PAI – DLC支持存储服务挂载配置读写权限
优化内容

PAI 训练服务DLC, 阿里云存储实例(OSS、NAS、 CPFS等)挂载时支持配置读写权限,支持用户存储实例权限的精细化管理。

在DLC训练任务中使用云存储

在提交DLC训练任务时,您可以通过代码配置或挂载的方式配置OSS、NAS、CPFS或MaxCompute存储,从而方便地在训练过程中直接读写相应存储中的数据。本文为您介绍如何在DLC训练任务中进行OSS、MaxCompute、NAS或CPFS的存储配置。

前提条件

使用OSS存储

通过挂载方式进行OSS存储配置

在创建分布式训练(DLC)任务时,挂载OSS存储。支持以下几种挂载类型,具体配置方法,请参见创建训练任务image

挂载类型

描述

数据集

通过数据集(自定义数据集或公共数据集)进行挂载,其中:

  • 公共数据集只支持只读挂载模式。

  • 自定义数据集(对象存储OSS)可以通过是否只读开关,来设置读写权限。

选择对象存储OSS类型的数据集,并配置挂载路径,当执行DLC任务时,系统会按照该路径来访问OSS中的数据。

直接挂载

直接挂载OSS Bucket存储路径,并通过是否只读开关,来设置读写权限。

当前DLC底层使用JindoFuse来挂载OSS。使用DLC的默认配置有功能限制(详情请参见JindoFuse),并不适合所有的场景。您可以通过调整参数,来适配具体的场景。具体操作,请参见JindoFuse

通过非挂载方式进行OSS存储配置

DLC任务支持使用OSS Pytorch Connector或OSS SDK来读写OSS数据。您可以在创建训练任务时,通过代码配置来配置相关代码文件。具体代码示例,请参见OSS Pytorch ConnectorOSS SDKimage

使用NAS/CPFS存储

您可以在创建分布式训练(DLC)任务时,通过绑定NAS/CPFS类型的自定义数据集或直接挂载的方式,使用NAS/CPFS存储。具体配置方法,请参见NAS使用image

挂载类型

描述

数据集

通过自定义数据集进行挂载,您可以通过是否只读开关,来设置读写权限。

直接挂载

直接挂载NAS/CPFS文件系统,并通过是否只读开关,来设置读写权限。

此外,您还可以在高级配置中,通过设置nconnect参数提升DLC容器访问NAS的吞吐性能。nconnect是NFS客户端Linux挂载选项,通过在客户端和服务器之间建立更多的TCP传输连接来提高吞吐性能。建议将nconnect设置为4,命令示例如下。

 
{"nconnect":"4"}

使用MaxCompute存储

通过非挂载的方式进行MaxCompute存储配置。您可以在创建训练任务时,通过代码配置来配置相关代码文件。具体代码示例,请参见MaxCompute使用image

常见问题

使用paiio读表没有报错但日志里显示killed?

由于资源不足,paiio未做限制,导致MaxCompute数据读取到内存时会出现膨胀现象,同时操作系统和其他系统组件也会占用部分内存。

相关新闻

  • 应用场景

    使用阿里云CDN加速ECS云服务器资源

    使用阿里云CDN加速ECS云服务器资源 支持使用阿里云CDN加速ECS上的静态资源。通过本文您可以了解CDN加速ECS资源的原理和实现方法。 客户价值 云服务器ECS可提供的性能卓越、稳定可靠、弹性扩展的IaaS级别云计算服务,CDN可以实现静态资源加速分发。使用ECS作为CDN的源站,价值和优势如下: 用户访问网站资源,全部通过CDN,降低源站压力。 使用CDN流量,单价低于直接访问ECS产生的外网流量。 从距离客户端最近的CDN节点获取资源,减少网络传输距离,保证静态资源传输质量。 技术架构…

    阿里云CDN 2023年8月1日
  • DDoS高防(国际)保险防护和无限防护计费说明-中国站

    阿里云DDoS高防(国际)保险防护和无限防护如何收费的?

    阿里云DDoS高防(国际)保险防护和无限防护如何收费的? 本文介绍了DDoS高防(国际)保险防护和无限防护的计费相关内容。 计费项 说明 : 各计费项的实际价格以DDoS高防(国际)购买页为准。 最小规格实例的单价及规格详情,请参见下表。 实例类型 实例单价 实例规格 保险防护实例 2,630美元/月 业务带宽:100 Mbps 95弹性业务带宽模式:不启用 功能套餐:标准套餐 防护域名数:10个(接入防护的域名所属的一级域名总数不超过1个) 业务QPS:500次/秒 95弹性QPS模式:不启用…

    阿里云DDoS 防护 2023年8月2日
  • 添加域名

    不走HTTP/HTTPS协议,可以全站加速吗?

    不走HTTP/HTTPS协议,可以全站加速吗? 可以的,可以使用IP应用加速,IP应用加速是阿里云自主研发的四层加速功能,基于TCP/UDP的私有协议提供加速服务。IP应用加速功能为您提供网络传输加速,可降低服务的延迟和提升访问的可用性。本文介绍开通IP应用加速服务和添加IP应用加速域名的方法。 前提条件 您已开通DCDN服务。详细信息,请参见开通DCDN服务。 步骤一:申请开通IP应用加速服务 IP应用加速目前不支持自助开通,需要联系云枢国际商务经理 @yunshuguoji 申请开通。 步骤…

    DCDN全站加速 2024年1月8日
  • 细数阿里云国际站无影云桌面那些容易忽视的操作~

    细数阿里云国际站无影云桌面那些容易忽视的操作~

    细数阿里云国际站无影云桌面那些容易忽视的操作~ 不少人在接触阿里云无影云桌面的时候,都是一脸懵,不知道怎么链接,怎么使用,不知道控制台在哪里看,不知道怎么续费,使用起来更是问题层次不穷。本文仅介绍小编遇到过得一些问题,希望帮助大家尽快入门。 什么是阿里云无影云桌面? 答:阿里云对无影云桌面有很好的定义,在这里我就不照搬了,通俗点理解,就是在云上面租了个 办公室,在配置的时候,你就像一个 网管 的角色,给一个新办公室,牵网,装电脑(选云桌面配置),设置每台电脑用户密码,所以,若是只需要购买一台云桌…

    常见问答 2023年12月25日
  • 接入方式选择

    什么是阿里云WAF?如何快速使用WAF 3.0?

    什么是阿里云WAF?如何快速使用WAF 3.0? Web应用防火墙(Web Application Firewall,简称WAF)可有效识别并防护Web业务流量的恶意特征,保障业务核心数据安全,避免您的服务器因恶意攻击导致性能异常等问题。本文介绍如何快速使用WAF 3.0为您的业务提供安全防护。 步骤一:购买WAF 3.0实例 步骤二:接入WAF 3.0 您可以根据下图,选择适当的接入方式,将您的业务接入WAF 3.0防护。 云产品接入 说明  接入WAF的ALB实例、MSE实例、FC自定义域名…

  • 2025最新阿里云国际版注册教程(附:阿里云国际充值方式)

    2025最新阿里云国际版注册教程(附:阿里云国际充值方式)

    2025最新阿里云国际版注册教程(附:阿里云国际充值方式) 在阿里云国际版官网注册是需要绑定paypal或者visa卡才可以完成注册,但是很多网友表示没有这些,那么怎么解决这个问题呢?其实通过分销商来注册的话就完全不用担心这个问题了,因为可以直接省略这一步,还提供多币种来解决阿里云国际充值问题。 下面我们来看下注册步骤: 首先是准备工作:一个海外手机号和一个邮箱。 然后就直接找 阿里云渠道合作伙伴 云枢国际 商务经理(小飞机:@yunshuguoji),发送一封阿里云国际站的注册邀请邮件。 开始…

    常见问答 2023年12月18日
联系我们

联系我们

电报:@yunshuguoji

邮件:yunshuguoji@outlook.com

工作时间:早上8:00-晚上11:00

认准电报
认准电报
分享本页
返回顶部