2020-4-28
RT-BRAIN 3.0 提供了加速人工智能项目所需的一切。它将所有内容整合到一个简单,易于部署和管理的解决方案中,该解决方案将使您以超出您想象的更少的时间快速可靠地启动和运行。
RT-BRAIN 3.0 可让您将集群作为单个实体进行管理,并通过单个界面配置硬件、系统、大数据和深度学习软件。这使得构建可靠的人工智能集群变得更加容易。一旦系统启动并运行,群集管理后台驻留程序会关注每个节点的各个方面,并报告在软件或硬件中检测到的所有问题,以便您可以采取行动并保持集群的健康。直观的管理界面使您可以轻松查看和解决影响集群性能的任何问题。
用户设备使用场景:
单人单机,用户更多关注系统配置的灵活性和训练的效率;容器技术的采用满足各框架软件不同系统配置的需求,监控功能满足客户实时了解资源使用率,随时进行调优的需求;
多人单机,用户更多关注资源分配的合理性,满足每个人独立的计算要求,资源配额管理功能满足用户按需灵活分配计算资源的需求;
多人多机,用户更多关注资源分配的合理性,计算资源的利用率,以及多机分布式训练的效率;用户管理功能保证了资源在用户间分配的合理性,监控功能可以随时了解计算资源的使用率情况和训练的效率;
多组多机,用户更多关注资源多级分配的合理性,计算资源的利用率,以及多机分布式训练的效率;租户管理功能保证了用户资源多级配额管理的需求,监控功能满足了用户随时掌握计算资源使用率的要求,同时也能了解训练的效率。
用户得到的好处
易于部署
软件自动化部署,为用户节约大量人力成本且大大缩短了平台的部署时间。 能够应付各种复杂的异构环境,消除部署麻烦
易于监控
强大的 GUI 提供全面的指标,实时监控各种资源的使用情况 自动运行状况检查随时从资源池、物理节点和用户三个维度进行监控
易于管理
可以灵活的配置租户与用户资源,让管理一目了然,优化您的 IT 资源的使用,使得资源闲置率降至最低
易于使用
轻松将容器镜像启动成云主机,在云主机中完成计算任务 用户可以通过远端拉取,本地加载,dockerfile 三种方式添加所需的镜像到本地公有仓库,也可将镜像打包到私有仓库。
易于创新
作为 NGC 本地的管理平台,可以轻松访问和使用大量优化的容器、预训练的模型、成熟的模型脚本和行业解决方案,让您的创新起点更接近顶峰。 作为基础架构的管理平台,可以方便的将各种镜像运行在分布式环境中,让您的创新更快地到达顶峰。