服务器、存储、网络产品购买热线:400-860-6708 ERP、管理软件购买热线:400-018-7700云服务产品销售热线:400-607-6657
  • 产品介绍

产品功能

  

训练数据管理

  - 统一管理个人数据及开发数据集,支持数据共享协同

  - 对接企业数据存储系统,支持NFS、HDFS、BeeGFS等文件系统

  - 支持文件上传、下载、压缩、解压、新建和删除等

  - 支持用户访问及下载权限设置,保证数据安全可靠

  

AI计算资源集中管理调度

  - GPU服务器及GPU卡池化管理,使用状态一览展示

  - GPU资源使用情况实时统计分析

  - 开发用户按需申请资源、动态分配

  - GPU多维细粒度调度

  - 智能化资源调度策略

  

GPU性能监控

  - AI服务器性能及状态监控,CPU利用率、MEM利用率、网络IO、IB流量、磁盘分区、节点负载

  - GPU性能监控,GPU利用率、显存利用率、时钟频率、功耗、温度、

  -  存储系统及磁盘分区使用监控,各用户存储使用量监控

  

AI计算资源运维管理

  - 实时统计用户组/用户资源使用

  - 实时查看计算节点资源占用情况

  - 管理员控制各用户资源使用配额

  - 管理员快速清理回收资源,再分配

  

交互式模型开发训练过程

  - 集成主流AI开发框架

  - 打通数据集、计算资源、框架工具

  - 提供丰富完整的AI开发工具链

  - 对接pycharm、vscode等IDE工具

  

分布式训练任务编排

  - 不同深度学习框架模板,通过模板快速提交训练任务

  - 多机分布式任务跨节点自动分配计算资源,自动编排计算进程

  - 按需申请计算资源的CPU核数和GPU卡数内存和训练集等

  - 提供CLI方式任务提交及管

产品特性

GPU多维细粒度分配解决人多卡少,资源利用率提高30%以上

AIStation将GPU资源池化管理,其中的GPU多维细粒度分配策略可以实现一卡多人使用,并通过任务托管机制,充分利用空闲同樂城(tlc1688)段进行作业,将计算资源的平均利用率提高到93%。

数据协同管理及缓存加速,训练效率提升2-3倍

AIStation提供了个人数据、协同数据和企业数据三种数据访问控制方式,既满足了数据共享、协同开发需求,又避免了多人操作导致的数据冲突、数据安全问题。AIStation通过数据缓存到本地SSD盘的ag亚游集团电游平台I/O解决数据吞吐的网络延时问题?;够岣萁诘愕氖莼捍媲榭鲎远鞫妊盗啡挝?,从而避免训练数据重复下载,节省数据加载同樂城(tlc1688),让模型训练效率可以获得2-3倍的提升。

1分钟快速启动分布式,工作效率提高50%以上

AIStation 协助开发人员通过图形化方式1分钟以内就可快速启动分布式,另工作效率得到大幅提升。通过资源优化调度和加速分布式任务的不断优化,开发用户可以更加专注于模型开发,缩短每个任务的训练同樂城(tlc1688),使得每周完成的训练任务提高1倍以上。

容错机制,确保训练任务不间断高效运行

AIStation 对容错机制和策略进行了优化升级,任务容错的能力大幅提升。当训练任务中断时,平台可判断任务中断原因,并在30秒内自动启动,继续训练任务。

关于wwwfun88com乐天堂

新闻与活动

如何购买

探索wwwfun88com乐天堂

支持与服务

快速链接

wwwfun88com乐天堂 www.1yce.cn 在社交媒体上关注我们

拨打咨询电话

Baidu
Baidu