平台概述

人工智能是眼下十分火热的话题,除了吸引眼球的“人机大战”外,它还有许多实际用处,很多企业也都已经将人工智能应用到了自身的运营或业务中。就拿机器学习来说,它可以帮助企业进行数据分析,并借此做出对市场、行业等等各方面趋势的预测,降低风险,最终实现盈收。

但其实对于大部分企业而言,机器学习的进展总是“困难重重”的。专业人员、技术或经验的缺乏,让机器学习真正实现其价值的时间一次又一次延长。开发人员要完成一个机器学习模型,往往需要很长时间,而且要完成大量的工作,如搭建计算环境、数据清洗和处理、模型选择和参数调整等等。

来自 MIT 的机器学习研究员 Kalyan Veeramachaneni 曾经做过一次调查,在一个 150 个机器学习爱好者的小组中,他询问说:“你们有多少人建立过机器学习的模型?”大约有 1/3的人举手。而当他进一步问:“有多少人使用这个模型产生价值并衡量它?”结果没有一个人举手。

换句话说,机器学习专家们把 90% 的时间都放在了数据准备、处理、特征工程、建模、调参上,而背后的业务问题和商业问题,很多时候没有纳入严格的考虑。但是要让数据产生真正的价值,就要把数据和商业价值联系起来,这至少要花费 50% 以上的精力。

近些年,一些热点事件,如围棋人机大战、无人驾驶等,深度学习逐渐进入公众的视野,而不仅存在于象牙塔尖的研究室里。深度学习的研究主要分为两个方面,一个是深度学习算法和模型的研究,目前市面上的一些深度学习框架就是这方面研究的成果,比如Caffe、Tensorflow、Torch等,另一方面是深度学习结合实际行业的应用,比如基于深度学习框架完成的人脸识别以及手写数字识别等。

目前对于深度学习的应用还只是存在于小范围,比如一些技术实力强劲的大公司,又比如一些研究机构,之所以出现这种情况,主要是市面上的一些深度学习框架各有优缺点,而且需要具备很强的技术背景才能使用,应用门槛太高,使用起来很不方便,极大的阻碍了深度学习的应用推广。

容天公司致力于深度学习的推广应用,建立一个更方便、更友好、更简洁、更全面的深度学习平台,整合目前市面上流行的深度学习框架,以人性化的UI呈现给用户,让用户专注于业务应用,而不是把时间花在学些深度学习框架如何使用上。

平台目标

容天深度学习平台建设目标:

*融合大数据、高性能计算的核心技术,支持海量数据下的机器学习。

*整合市面上流行的深度学习框架,如Caffe、Tensorflow等,提供更完善的方案

*提供更友好、更简单、更人性化的操作界面 

*提供模型超参调优功能,节约用户模型训练时间

*提供平台监控功能,让用户随时掌控平台运行情况

*提供作业管理模式,为未来模型大范围实际应用提供管控

平台架构

容天深度学习应用平台主要分成五层,具体如下图:

第一层:硬件层,支持X86、Power等异构平台,不仅可以支持在不同平台上安装部署,还可以支持异构平台集群。支持不对称的计算节点,可以根据不同节点的计算能力分配作业,从而有利于支持设备利旧,保护已有投资。平台便于在云平台上部署,提供云服务。

第二层:集群层,提供分布式文件系统及分布式应用框架如HADOOP、SPARK;结合高性能计算,提供并行计算和计算数学库。

第三层:AI层,融合了基于神经网络的深度学习平台和基于智能计算的机器学习平台,整合多种深度学习框架以及机器学习相关支持库,提供统一的对外接口。

第四层:平台层,以统一平台的方式对外提供深度学习相关功能,包括UI界面方式和服务模式两种。既有基于浏览器的人机接口,也可提供基于WebService的云服务接口,可以支持在移动终端下使用。

第五层:应用层,提供支持用户自定义的企业级应用模块,可以方便快捷地开发单独的机器学习应用或者与企业现有系统整合,实现快速应用部署和业务实现。提供结合行业应用的成熟方案和模型,方便用户在短时间内与业务进行结合。

平台应用方向

金融领域。信用卡识别、银行识别、信用卡组织识别等都是自动化服务中不可或缺的业务需求。在以往的环境中,分类与目标检测、标签数据、识别时间以及持续更新等都是巨大的挑战,这样一层一层的挑战叠加起来,无疑会为服务的部署带来更大的困难。RT-BRAIN可为不同需求提供不同的网络模型,对目标分类检测进行优化;支持跨节点跨GPU训练,对训练过程进行提速,节约时间;同时提供inference API测在线服务,保证开发人员能够获得实时的例程访问能力。

而在相关市场预测需求中,以往以往借助机器学习进行相关预测研究时,准确度无法达到预计的效果,不能达到实际应用的程度。RT-BRAIN可利用ETL将数据转换成可训练格式数据,提供针对RNN模型的超参数选择,同时支持训练过程可视化,并提供优化建议。在与某研究院的合作中,经过RT-BRAIN前期PoC测试,可实现上证300预测未来 一小时准确率>70%,预测未来10分钟准确率>80%。

医疗保健领域。如肿瘤扩散评估、医疗影像病症特征的识别等,都是非常重要的项目实例。之前,病理医生需要用肉眼识别微小的癌细胞、判读医疗影像,费时费力且极易出错。而且能够对影像进行判读的医生需要有非常丰富的经验,大部分中小医院和社区医院缺乏这类医生,大医院人满为患。医生疲于应付,更可能造成误诊、漏诊,导致医患关系紧张。RT-BRAIN可支持对象检测和数据准备,同时支持改变数据大小和标签坐标 ,可支持无需改变原始图像情况下展示训练结果。从历史数据中学习和总结、快速判读影像中的病症特征,辅助医生进行病症分析,提高诊治效率和准确性。同时RT-BRAIN可帮助构建智慧医疗服务,为辅助治疗、病患服务等工作带来更高的效益。

工业检测与智能制造领域。零部件及材料中的各种缺陷会直接影响成品质量,造成大量次品、废品,影响企业效益及声誉。而传统的影响分析方法对于各种复杂的缺陷特征都需要人工建模,适应性较差,而且容易造成大量误检、漏检问题。RT-BRAIN可通过提供机器学习的超参数优化,支持训练过程可视化以及提供优化建议,帮助开发者通过深度学习的探索和应用,对检测对象建立精确的视觉模型,结合人工智能芯片的超强计算能力,对于肉眼无法检测到的微小瑕疵实现毫秒级的实时检测。在工件定位、工件测量、工件表面识别和工件装配检测等工作中,带来极佳的识别检测效果,为制造业提供智能化、自动化、低成本的工业检测解决方案。

在影像内容分析领域中。重要人物识别(远、中、近景等)、局部目标识别(如旗帜、图案等)、人类行为分析(色情、人群聚集等)、赛事、精彩镜头、场景分析等都是比较常见的应用。此类应用对准确性、性能和效率等的需求可能并不如以上三种领域那般刚硬,但同样不可忽视,识别与分析的效果将决定应用的用户体验。对于企业来说,用户体验往往意味着竞争力。RT-BRAIN能够提供优异的并行效率和扩展性能、专业的神经网络和超参数优化建议,在处理视频和图像等无序数据的工作中,带来更高的准确性及效率,明显提升响应时间,增强用户体验。