人工智能平台 PAI – DLC支持存储服务挂载配置读写权限
优化内容

PAI 训练服务DLC, 阿里云存储实例(OSS、NAS、 CPFS等)挂载时支持配置读写权限,支持用户存储实例权限的精细化管理。

在DLC训练任务中使用云存储

在提交DLC训练任务时,您可以通过代码配置或挂载的方式配置OSS、NAS、CPFS或MaxCompute存储,从而方便地在训练过程中直接读写相应存储中的数据。本文为您介绍如何在DLC训练任务中进行OSS、MaxCompute、NAS或CPFS的存储配置。

前提条件

使用OSS存储

通过挂载方式进行OSS存储配置

在创建分布式训练(DLC)任务时,挂载OSS存储。支持以下几种挂载类型,具体配置方法,请参见创建训练任务image

挂载类型

描述

数据集

通过数据集(自定义数据集或公共数据集)进行挂载,其中:

  • 公共数据集只支持只读挂载模式。

  • 自定义数据集(对象存储OSS)可以通过是否只读开关,来设置读写权限。

选择对象存储OSS类型的数据集,并配置挂载路径,当执行DLC任务时,系统会按照该路径来访问OSS中的数据。

直接挂载

直接挂载OSS Bucket存储路径,并通过是否只读开关,来设置读写权限。

当前DLC底层使用JindoFuse来挂载OSS。使用DLC的默认配置有功能限制(详情请参见JindoFuse),并不适合所有的场景。您可以通过调整参数,来适配具体的场景。具体操作,请参见JindoFuse

通过非挂载方式进行OSS存储配置

DLC任务支持使用OSS Pytorch Connector或OSS SDK来读写OSS数据。您可以在创建训练任务时,通过代码配置来配置相关代码文件。具体代码示例,请参见OSS Pytorch ConnectorOSS SDKimage

使用NAS/CPFS存储

您可以在创建分布式训练(DLC)任务时,通过绑定NAS/CPFS类型的自定义数据集或直接挂载的方式,使用NAS/CPFS存储。具体配置方法,请参见NAS使用image

挂载类型

描述

数据集

通过自定义数据集进行挂载,您可以通过是否只读开关,来设置读写权限。

直接挂载

直接挂载NAS/CPFS文件系统,并通过是否只读开关,来设置读写权限。

此外,您还可以在高级配置中,通过设置nconnect参数提升DLC容器访问NAS的吞吐性能。nconnect是NFS客户端Linux挂载选项,通过在客户端和服务器之间建立更多的TCP传输连接来提高吞吐性能。建议将nconnect设置为4,命令示例如下。

 
{"nconnect":"4"}

使用MaxCompute存储

通过非挂载的方式进行MaxCompute存储配置。您可以在创建训练任务时,通过代码配置来配置相关代码文件。具体代码示例,请参见MaxCompute使用image

常见问题

使用paiio读表没有报错但日志里显示killed?

由于资源不足,paiio未做限制,导致MaxCompute数据读取到内存时会出现膨胀现象,同时操作系统和其他系统组件也会占用部分内存。

相关新闻

  • 专业购买-intl-zh.png

    怎么开通阿里云无影云桌面?如何开通云桌面?

    怎么开通阿里云无影云桌面?如何开通云桌面? 本文为您介绍无影云电脑的入门操作,帮助您快速访问云电脑。 前提条件 已经开通阿里云账号。未开通的,请联系 云枢国际 官方业务经理@yunshuguoji,进行开通,点此查看开通步骤。 使用流程 步骤一:创建便捷用户 根据激活对象,便捷用户分为用户激活和管理员激活,下文介绍如何在手动录入页签快速创建一个用户激活的便捷用户。更多信息,请参见创建便捷用户。 登录无影云电脑控制台。 在左侧导航栏,单击用户与管理员 > 用户与组织。 在用户管理页面,选择用…

    阿里云国际 2023年12月12日
  • 智能开放搜索 OpenSearch – LLM智能问答版邀测发布

    智能开放搜索 OpenSearch推出LLM智能问答版,面向行业搜索场景,基于内置的LLM模型,提供企业专属问答搜索服务 适用客户 1.企业内部文档搜索、知识库搜索、内容搜索、电商、营销等业务场景的客户 2.有问答搜索需求的客户 3.希望构建企业专属LLM模型,但资源、人力、预算相对较少的客户 版本/规格功能 智能开放搜索 OpenSearch LLM智能问答版面向行业搜索场景,提供企业专属问答搜索服务。基于内置的LLM大模型,一站式快速搭建问答搜索系统。 LLM智能问答版可以基于客户自身的业务…

    行业动态 2023年6月13日
  • 细数阿里云国际站无影云桌面那些容易忽视的操作~

    细数阿里云国际站无影云桌面那些容易忽视的操作~

    细数阿里云国际站无影云桌面那些容易忽视的操作~ 不少人在接触阿里云无影云桌面的时候,都是一脸懵,不知道怎么链接,怎么使用,不知道控制台在哪里看,不知道怎么续费,使用起来更是问题层次不穷。本文仅介绍小编遇到过得一些问题,希望帮助大家尽快入门。 什么是阿里云无影云桌面? 答:阿里云对无影云桌面有很好的定义,在这里我就不照搬了,通俗点理解,就是在云上面租了个 办公室,在配置的时候,你就像一个 网管 的角色,给一个新办公室,牵网,装电脑(选云桌面配置),设置每台电脑用户密码,所以,若是只需要购买一台云桌…

    常见问答 2023年12月25日
  • 对象存储OSS常见问题汇总

    对象存储OSS常见问题汇总 如何关闭OSS服务或停止计费? 考虑到一键关闭会导致客户的业务受到影响,OSS暂时没有提供此功能。但是,您可以使用以下替代方案达到关闭OSS服务或者停止OSS计费的目的。 如果您不希望继续使用OSS服务,请删除存储空间(Bucket)下的所有对象(Object)、因分片上传或断点续传产生的碎片(Part)、以及LiveChannel,再删除Bucket,即可在下一个账期(OSS按量付费一小时出一次账单)不产生扣费信息。 如果要删除的Object以及Part数量较多,请…

    常见问答 2023年12月21日
  • 快速入门

    阿里云全站加速DCDN配置教程

    阿里云全站加速DCDN配置教程 DCDN接入快捷、简单,您只需要在全站加速控制台进行简单操作,即可享受集加速、计算和安全防护于一体的服务。本文为您介绍接入并启用DCDN服务的流程。 前提条件 您已经注册了阿里云账号。如果未注册,请先联系云枢国际商务经理 @yunshuguoji 完成账号注册。 第一步:开通DCDN服务 在使用DCDN之前,您需要先开通DCDN服务。 操作步骤 登录阿里云DCDN平台。 单击立即开通,选择适合您的计费模式。 DCDN产品定价,请参见DCDN详细价格信息。 单击立即…

    DCDN全站加速 2024年1月8日
  • 什么是对象存储OSS

    什么是对象存储OSS 阿里云对象存储OSS(Object Storage Service)是一款海量、安全、低成本、高可靠的云存储服务,可提供99.9999999999%(12个9)的数据持久性,99.995%的数据可用性。多种存储类型供选择,全面优化存储成本。 OSS具有与平台无关的RESTful API接口,您可以在任何应用、任何时间、任何地点存储和访问任意类型的数据。 您可以使用阿里云提供的API、SDK包或者OSS迁移工具轻松地将海量数据移入或移出阿里云OSS。数据存储到阿里云OSS以后…

    阿里云国际 2023年12月21日
联系我们

联系我们

电报:@yunshuguoji

邮件:yunshuguoji@outlook.com

工作时间:早上8:00-晚上11:00

认准电报
认准电报
分享本页
返回顶部