平台介绍

RT-Brain人工智能大数据平台集群版是容天专为深度学习业务客户研发的平台软件,专为大模型、大显存、大数据客户定制。其中包含深度学习、神经网络、语音识别、GPU应用等。因单一服务器并不能满足大数据业务需求,故RT-Brain集群版专为深度学习集群、数据中心提供全方位、有效的性能保障。

平台架构

RT-Brain集群版采用以Docker容器技术为核心,利用Kubernetes的Replication contorller等Deployment管理引擎有效的控制各个计算节点的资源。同时部署目前流行深度学习分布式框架进行训练,并通过对应WEB接口调用深度学习框架使用命令。监控模块可实时监控每一计算节点的资源,可以更方便、更高效的进行多机训练识别,是针对大规模型计算的高效工具。

应用场景

图片识别  

语音识别  

目标检测  

数据并行、模型并行类应用

大规模、大显存、大尺寸、高精度的AI业务

产品优势

资源: 不同于传统集群,利用Kubernetes有效对Docker容器进行调用管理,可以生成资源池,更有效的对资源进行管理。

部署:采用智能管家运维平台,输入IP地址,一键完成部署。

功能:添加容天自主开发模块,比如TPE、贝叶斯随机网络,使深度学习的入门更简单,使用更方便,采用CaffeOnSpark和TensorflowOnSpark分布式神学习框架,功能更丰富。

管理:实时监控计算节点状态,管理员用户有绝对权限分配数据中心资源池的资源。