![]() |
产品功能
训练数据管理
- 统一管理个人数据及开发数据集,支持数据共享协同
- 对接企业数据存储系统,支持NFS、HDFS、BeeGFS等文件系统
- 支持文件上传、下载、压缩、解压、新建和删除等
- 支持用户访问及下载权限设置,保证数据安全可靠
AI计算资源集中管理调度
- GPU服务器及GPU卡池化管理,使用状态一览展示
- GPU资源使用情况实时统计分析
- 开发用户按需申请资源、动态分配
- GPU多维细粒度调度
- 智能化资源调度策略
GPU性能监控
- AI服务器性能及状态监控,CPU利用率、MEM利用率、网络IO、IB流量、磁盘分区、节点负载
- GPU性能监控,GPU利用率、显存利用率、时钟频率、功耗、温度、
- 存储系统及磁盘分区使用监控,各用户存储使用量监控
AI计算资源运维管理
- 实时统计用户组/用户资源使用
- 实时查看计算节点资源占用情况
- 管理员控制各用户资源使用配额
- 管理员快速清理回收资源,再分配
交互式模型开发训练过程
- 集成主流AI开发框架
- 打通数据集、计算资源、框架工具
- 提供丰富完整的AI开发工具链
- 对接pycharm、vscode等IDE工具
分布式训练任务编排
- 不同深度学习框架模板,通过模板快速提交训练任务
- 多机分布式任务跨节点自动分配计算资源,自动编排计算进程
- 按需申请计算资源的CPU核数和GPU卡数内存和训练集等
- 提供CLI方式任务提交及管
产品特性
GPU多维细粒度分配解决人多卡少,资源利用率提高30%以上
AIStation将GPU资源池化管理,其中的GPU多维细粒度分配策略可以实现一卡多人使用,并通过任务托管机制,充分利用空闲同樂城(tlc1688)段进行作业,将计算资源的平均利用率提高到93%。
数据协同管理及缓存加速,训练效率提升2-3倍
AIStation提供了个人数据、协同数据和企业数据三种数据访问控制方式,既满足了数据共享、协同开发需求,又避免了多人操作导致的数据冲突、数据安全问题。AIStation通过数据缓存到本地SSD盘的ag亚游集团电游平台I/O解决数据吞吐的网络延时问题?;够岣萁诘愕氖莼捍媲榭鲎远鞫妊盗啡挝?,从而避免训练数据重复下载,节省数据加载同樂城(tlc1688),让模型训练效率可以获得2-3倍的提升。
1分钟快速启动分布式,工作效率提高50%以上
AIStation 协助开发人员通过图形化方式1分钟以内就可快速启动分布式,另工作效率得到大幅提升。通过资源优化调度和加速分布式任务的不断优化,开发用户可以更加专注于模型开发,缩短每个任务的训练同樂城(tlc1688),使得每周完成的训练任务提高1倍以上。
容错机制,确保训练任务不间断高效运行
AIStation 对容错机制和策略进行了优化升级,任务容错的能力大幅提升。当训练任务中断时,平台可判断任务中断原因,并在30秒内自动启动,继续训练任务。
服务器、存储、网络产品购买热线:
ERP、管理软件购买热线:
云服务产品销售热线:
wwwfun88com乐天堂网络售后热线: