阿里云国际人工智能平台 PAI – DLC支持存储服务挂载配置读写权限

人工智能平台 PAI – DLC支持存储服务挂载配置读写权限
优化内容

PAI 训练服务DLC, 阿里云存储实例(OSS、NAS、 CPFS等)挂载时支持配置读写权限,支持用户存储实例权限的精细化管理。

在DLC训练任务中使用云存储

在提交DLC训练任务时,您可以通过代码配置或挂载的方式配置OSS、NAS、CPFS或MaxCompute存储,从而方便地在训练过程中直接读写相应存储中的数据。本文为您介绍如何在DLC训练任务中进行OSS、MaxCompute、NAS或CPFS的存储配置。

前提条件

使用OSS存储

通过挂载方式进行OSS存储配置

在创建分布式训练(DLC)任务时,挂载OSS存储。支持以下几种挂载类型,具体配置方法,请参见创建训练任务image

挂载类型

描述

数据集

通过数据集(自定义数据集或公共数据集)进行挂载,其中:

  • 公共数据集只支持只读挂载模式。

  • 自定义数据集(对象存储OSS)可以通过是否只读开关,来设置读写权限。

选择对象存储OSS类型的数据集,并配置挂载路径,当执行DLC任务时,系统会按照该路径来访问OSS中的数据。

直接挂载

直接挂载OSS Bucket存储路径,并通过是否只读开关,来设置读写权限。

当前DLC底层使用JindoFuse来挂载OSS。使用DLC的默认配置有功能限制(详情请参见JindoFuse),并不适合所有的场景。您可以通过调整参数,来适配具体的场景。具体操作,请参见JindoFuse

通过非挂载方式进行OSS存储配置

DLC任务支持使用OSS Pytorch Connector或OSS SDK来读写OSS数据。您可以在创建训练任务时,通过代码配置来配置相关代码文件。具体代码示例,请参见OSS Pytorch ConnectorOSS SDKimage

使用NAS/CPFS存储

您可以在创建分布式训练(DLC)任务时,通过绑定NAS/CPFS类型的自定义数据集或直接挂载的方式,使用NAS/CPFS存储。具体配置方法,请参见NAS使用image

挂载类型

描述

数据集

通过自定义数据集进行挂载,您可以通过是否只读开关,来设置读写权限。

直接挂载

直接挂载NAS/CPFS文件系统,并通过是否只读开关,来设置读写权限。

此外,您还可以在高级配置中,通过设置nconnect参数提升DLC容器访问NAS的吞吐性能。nconnect是NFS客户端Linux挂载选项,通过在客户端和服务器之间建立更多的TCP传输连接来提高吞吐性能。建议将nconnect设置为4,命令示例如下。

 
{"nconnect":"4"}

使用MaxCompute存储

通过非挂载的方式进行MaxCompute存储配置。您可以在创建训练任务时,通过代码配置来配置相关代码文件。具体代码示例,请参见MaxCompute使用image

常见问题

使用paiio读表没有报错但日志里显示killed?

由于资源不足,paiio未做限制,导致MaxCompute数据读取到内存时会出现膨胀现象,同时操作系统和其他系统组件也会占用部分内存。

相关新闻

  • image.png

    阿里云边缘网络加速产品概述简介-什么是二层连接服务?

    阿里云边缘网络加速产品概述简介-什么是二层连接服务? 本文介绍边缘网络加速(Edge Network Acceleration, ENA)-二层连接服务。 二层连接服务服务,为客户提供客户DC/客户企业内网与阿里中心云之间,或客户DC-DC、客户DC-内网、客户内网-内网之间的端到端快速连接。 场景一:客户DC/企业内网与阿里中心云之间的连接二层连接服务协助客户安全、快捷地接入阿里云高速通道接入点。无论客户的企业DC/企业内网是否与阿里云高速通道是否在同一个城市,加速上云服务均可通过本地或长途接…

    边缘网络加速 2025年7月25日
  • 什么是无影云电脑(专业版)

    什么是无影云电脑(专业版) 阿里云无影云电脑(专业版)的原产品名为弹性云桌面,融合了无影产品技术后更名升级。它可以为您提供易用、安全、高效的云上桌面服务,帮助您快速构建、高效管理桌面办公环境,提供安全、灵活的办公体系。 为什么选择无影云电脑(专业版)? 无影云电脑(专业版)是一款面向数字经济时代的生产力工具,可实现随时随地云上办公、海量算力触手可得、多种应用一网打尽,依托阿里云安全防护体系,全面保障企业业务和数据安全。选择无影云电脑(专业版)为您提供一整套易用、安全、高效的桌面办公体系,还为您带…

    阿里云国际 2023年12月12日
  • image.png

    阿里云计算巢-企业级AI工具的安全部署新选择

    阿里云计算巢私有化MCP市场依托阿里云弹性计算资源,支持自主可控的私有化部署方案。平台同时支持OpenAPI、SSE、StreamableHttp方式接入,支持Higress云原生网关做网络控制,所有的MCP工具直接部署在用户云账号下,5分钟极速部署,确保数据安全与便捷性并重。 企业级私有化MCP部署场景 适用条件 核心价值 对数据安全和隐私有严格要求。 需要AI工具访问企业内网资源。 要求MCP服务与其他业务隔离。 需要统一管理多种MCP工具。 资源自主可控:MCP工具部署在用户自己的云账户下…

    使用指南 2025年11月22日
  • image

    阿里云计算巢管理服务-交付管理-配置免费试用

    阿里云计算巢管理服务-交付管理-配置免费试用 重要 本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。 对于私有部署服务,服务商可提供免费试用功能,用户可借此免费体验该服务,服务商也可以通过创建试用服务实例测试服务。 试用功能介绍 试用服务提供了大部分正式服务的功能,可供用户免费体验该服务。服务商如需开启试用功能,可在创建私有部署服务或更新服务时进行配置。 服务配置完成并上线后,用户可以在控制台的服务目录或我的服务中,找到带有可免费试用标签的服务,并试用该服务…

    计算巢服务 2025年7月30日
  • Navicat一键直连阿里云全指南 告别1130/10060错误

    引言:在数据库管理工作中,Navicat作为一款强大的工具,被广泛用于连接和管理数据库。然而,许多用户在连接阿里云数据库时常常遇到1130(Host is not allowed to connect)或10060(连接超时)等错误。本文将一步步指导您如何正确配置,避开这些“坑”,并针对企业级特殊场景提供解决方案。 一、步骤1:数据库账号授权在阿里云RDS控制台中,创建数据库账号时,请注意:账号类型:建议使用高权限账号。授权数据库:选择该账号可以访问的数据库。主机地址:此处是关键!如果允许任意主…

    使用指南 2026年3月18日
  • GPU 服务器 5 大高频故障排查指南

    一、故障 1:GPU 驱动崩溃 典型报错:NVIDIA-SMI has failed | Xid errors排查步骤:执行诊断命令: dmesg | grep NVRM  # 检查内核日志 nvidia-bug-report.sh  # 生成完整诊断报告 检查驱动兼容性: 确认驱动版本与 CUDA 工具链匹配(NVIDIA 官方兼容表) 避免混合安装不同版本驱动 二、故障 2:显存溢出 典型报错:CUDA out of memory优化策略: 监控工具 关键命令 优化目标 nvidia-smi…

    使用指南 2025年12月29日
联系我们

联系我们

电报:@yunshuguoji

邮件:yunshuguoji@outlook.com

工作时间:早上8:00-晚上11:00

认准电报
认准电报
分享本页
返回顶部