人工智能平台 PAI – DLC支持存储服务挂载配置读写权限
优化内容

PAI 训练服务DLC, 阿里云存储实例(OSS、NAS、 CPFS等)挂载时支持配置读写权限,支持用户存储实例权限的精细化管理。

在DLC训练任务中使用云存储

在提交DLC训练任务时,您可以通过代码配置或挂载的方式配置OSS、NAS、CPFS或MaxCompute存储,从而方便地在训练过程中直接读写相应存储中的数据。本文为您介绍如何在DLC训练任务中进行OSS、MaxCompute、NAS或CPFS的存储配置。

前提条件

使用OSS存储

通过挂载方式进行OSS存储配置

在创建分布式训练(DLC)任务时,挂载OSS存储。支持以下几种挂载类型,具体配置方法,请参见创建训练任务image

挂载类型

描述

数据集

通过数据集(自定义数据集或公共数据集)进行挂载,其中:

  • 公共数据集只支持只读挂载模式。

  • 自定义数据集(对象存储OSS)可以通过是否只读开关,来设置读写权限。

选择对象存储OSS类型的数据集,并配置挂载路径,当执行DLC任务时,系统会按照该路径来访问OSS中的数据。

直接挂载

直接挂载OSS Bucket存储路径,并通过是否只读开关,来设置读写权限。

当前DLC底层使用JindoFuse来挂载OSS。使用DLC的默认配置有功能限制(详情请参见JindoFuse),并不适合所有的场景。您可以通过调整参数,来适配具体的场景。具体操作,请参见JindoFuse

通过非挂载方式进行OSS存储配置

DLC任务支持使用OSS Pytorch Connector或OSS SDK来读写OSS数据。您可以在创建训练任务时,通过代码配置来配置相关代码文件。具体代码示例,请参见OSS Pytorch ConnectorOSS SDKimage

使用NAS/CPFS存储

您可以在创建分布式训练(DLC)任务时,通过绑定NAS/CPFS类型的自定义数据集或直接挂载的方式,使用NAS/CPFS存储。具体配置方法,请参见NAS使用image

挂载类型

描述

数据集

通过自定义数据集进行挂载,您可以通过是否只读开关,来设置读写权限。

直接挂载

直接挂载NAS/CPFS文件系统,并通过是否只读开关,来设置读写权限。

此外,您还可以在高级配置中,通过设置nconnect参数提升DLC容器访问NAS的吞吐性能。nconnect是NFS客户端Linux挂载选项,通过在客户端和服务器之间建立更多的TCP传输连接来提高吞吐性能。建议将nconnect设置为4,命令示例如下。

 
{"nconnect":"4"}

使用MaxCompute存储

通过非挂载的方式进行MaxCompute存储配置。您可以在创建训练任务时,通过代码配置来配置相关代码文件。具体代码示例,请参见MaxCompute使用image

常见问题

使用paiio读表没有报错但日志里显示killed?

由于资源不足,paiio未做限制,导致MaxCompute数据读取到内存时会出现膨胀现象,同时操作系统和其他系统组件也会占用部分内存。

相关新闻

  • DDoS高防(国际)保险防护和无限防护计费说明-中国站

    阿里云DDoS高防(国际)保险防护和无限防护如何收费的?

    阿里云DDoS高防(国际)保险防护和无限防护如何收费的? 本文介绍了DDoS高防(国际)保险防护和无限防护的计费相关内容。 计费项 说明 : 各计费项的实际价格以DDoS高防(国际)购买页为准。 最小规格实例的单价及规格详情,请参见下表。 实例类型 实例单价 实例规格 保险防护实例 2,630美元/月 业务带宽:100 Mbps 95弹性业务带宽模式:不启用 功能套餐:标准套餐 防护域名数:10个(接入防护的域名所属的一级域名总数不超过1个) 业务QPS:500次/秒 95弹性QPS模式:不启用…

    阿里云DDoS 防护 2023年8月2日
  • 对象存储OSS常见问题汇总

    对象存储OSS常见问题汇总 如何关闭OSS服务或停止计费? 考虑到一键关闭会导致客户的业务受到影响,OSS暂时没有提供此功能。但是,您可以使用以下替代方案达到关闭OSS服务或者停止OSS计费的目的。 如果您不希望继续使用OSS服务,请删除存储空间(Bucket)下的所有对象(Object)、因分片上传或断点续传产生的碎片(Part)、以及LiveChannel,再删除Bucket,即可在下一个账期(OSS按量付费一小时出一次账单)不产生扣费信息。 如果要删除的Object以及Part数量较多,请…

    常见问答 2023年12月21日
  • 流量访问,waf

    WAF常见问题大全

    类型 问题列表 产品FAQ 售前咨询问题 非阿里云服务器能否使用WAF? WAF支持云虚拟主机吗? WAF是否支持防护HTTPS业务? WAF是否支持自定义端口? WAF是否对接入端口有限制? WAF的QPS限制规格是针对整个WAF实例汇总的QPS,还是配置的单个域名的QPS上限? WAF是否支持HTTPS双向认证? WAF是否支持Websocket、HTTP 2.0或SPDY协议? HTTP 2.0业务接入WAF防护是否会对源站有影响? WAF支持哪些TLS协议? WAF是否支持接入采用NTL…

    常见问答 2023年12月20日
  • cdn架构

    什么是阿里云CDN?为什么选择阿里云CDN?

    什么是阿里云CDN?为什么选择阿里云CDN? 阿里云内容分发网络CDN(Content Delivery Network)是建立并覆盖在承载网之上,由遍布全球的边缘节点服务器群组成的分布式网络。阿里云CDN能分担源站压力,避免网络拥塞,确保在不同区域、不同场景下加速网站内容的分发,提高资源访问速度。 阿里云在全球拥有3200+节点。中国内地拥有2300+节点,覆盖31个省级区域;海外、中国香港、中国澳门和中国台湾拥有900+节点,覆盖70多个国家和地区。全网带宽输出能力达180 Tbps。具体节…

    阿里云CDN 2023年7月30日
  • image.png

    阿里云边缘网络加速产品概述简介-什么是二层连接服务?

    阿里云边缘网络加速产品概述简介-什么是二层连接服务? 本文介绍边缘网络加速(Edge Network Acceleration, ENA)-二层连接服务。 二层连接服务服务,为客户提供客户DC/客户企业内网与阿里中心云之间,或客户DC-DC、客户DC-内网、客户内网-内网之间的端到端快速连接。 场景一:客户DC/企业内网与阿里中心云之间的连接二层连接服务协助客户安全、快捷地接入阿里云高速通道接入点。无论客户的企业DC/企业内网是否与阿里云高速通道是否在同一个城市,加速上云服务均可通过本地或长途接…

    边缘网络加速 2025年7月25日
  • 开通

    如何开通阿里云CDN服务

    在初次使用CDN之前,您需要先开通CDN服务。本文介绍快速开通CDN服务的方法。 前提条件 您已经注册了阿里云账号。如果未注册,请先联系电报 @yunshuguoji 客服进行注册。 操作步骤 后续步骤 开通CDN服务后,您需要参考添加加速域名配置加速业务的域名。

    阿里云CDN 2023年6月14日
联系我们

联系我们

电报:@yunshuguoji

邮件:yunshuguoji@outlook.com

工作时间:早上8:00-晚上11:00

认准电报
认准电报
分享本页
返回顶部