AI资源介绍

服务平台基于先进、智能的超融合计算资源,构建超大规模且持续扩展的算力池,助力用户创新。提供端到端全栈算力生产、交付与应用支持服务,覆盖丰富的计算行业应用场景,推动行业技术创新发展,加速多学科交叉融合。始终致力于打造强劲、丰富、极速、安全、优质的产品及服务,助力产业升级、科研创新、政务服务和信息技术应用创新。

一、异构加速卡算力资源介绍:

计算平台由国产自主可控异构加速卡组成,每个节点配置4块异构加速卡,是基于通用GPGPU架构设计的全精度加速卡,性能可对标NVIDIA产品,应用生态完善,覆盖全精度场景。节点间使用100GBInfiniBand(IB网络)实现高速互连。提供多样丰富的算力资源,实现双精度、单精度、半精度和整型算力的全面覆盖,双精度浮点峰值计算能力达到了10.1TFlops,从而能同时胜任人工智能训练推理和科学计算的全面应用需求。

资源类型

资源说明

异构节点-4D2

4*异构加速卡/ 1*X86 7285 32C 2.0GHz处理器/ 128GB内存/ 200Gb计算网络

加速卡兼容ROCm软件生态,每年4月及10月发布DTK新版本软件栈,并对深度学习框架进行补充更新,提供Docker镜像/whl/源码等多种安装方式。支持pytorch、TensorFlow、百度飞浆等20多款主流深度学习框架和开源软件开发环境,移植适配模型支持数量200+,完成90+个HPC应用移植优化,覆盖18+个科研及产业领域,支持Docker及K8S等常用容器编排工具,满足容器化需求。中心加速卡具有相对完整的软件生态系统。

异构程序离不开软件生态系统的支持,尤其是数学库在各个应用中被广泛使用,目前加速卡已经具有了相对完整的软件生态系统,支持常用数学库,方便开发人员快速完成自己的程序设计,能够满足计算机视觉领域(CV)领域,自然语言处理领域(NLP)的人工智能算法训练需求,无论在可用性还是易用性层面,在生产环境中可高效替换通用GPU环境。

HIP数学库

数学库功能

miopen

深度学习基础数学库

rocblas/hipblas

基础矩阵运算数学库

rccl

通信库

hiprand

随机数数学库

hipsparse

稀疏矩阵数学库

rocfft/hipfft

快速傅立叶变换数学库

hipcub

基础算法库

rocthrust

并行库

rocALUTION

计算密集型求解器

rocrand

随机数生成库

二、异构加速卡算力资源应用场景

异构加速卡主要面向机器视觉Compute Vision、自然语言处理NLP、AI4S科学计算研究方向提供AI算力支持,广泛应用于安防、智慧交通、智慧零售、智慧医疗、智慧工业、智慧国土、文化娱乐、精准营销、金融风险、智能客服、智能开发、自动驾驶等各个领域。

基于DTK新版本软件栈,目前已经适配的算法模型如下,基于已经适配的算法模型能够快速开发,提高科研效率。

领域

网络模型

图像分类

AlexNet

Inception-V3

MobileNet-V2

ResNet152

ResNet18

ResNet34

ResNet50

ResNext50

SeresNet50

ShuffleNet-v1

ShuffleNet-v2

Vgg11

Vgg16

Inception-V3

MobileNet-V2

ResNet50

Vgg16

自然语言理解

Bert

Conformer

GLM

GNMT

GPT2

Transformer

Bert

Transformer

Transformer-XL

语音

FastPitch

Tacotron2

推荐算法

Dlrm

Ncf

Ncf

Vae-Cf

WideAndDeep

目标检测

Cascade-Mask-Rcnn

Dcn

Double-Heads

Faster-Rcnn

Faster-Rcnn(fasterrcnn_resnet50_fpn)

Mask-Rcnn

ResNest

RetinaNet

Ssd(SSD_ResNet34)

Ssd(VGG16)

VfNet

Yolo-V3

Yolo-V5

Faster-Rcnn

Mask-Rcnn(ResNet50)

Ssd300(vgg16)

Yolo-V3

关键点检测

HrNet-Top-Down

ResNet50-Bottom-Up

ResNet50-Top-Down

分割

DeepLab-V3plus-R50

DeepLab-V3-R50

Fcn-R50

PspNet-R50

UperNet-R50

UNet_medical

VNet

NAS

Darts