OpenBayes贝式计算是一家相对早期的初创企业,致力于构建中国人工智能领域的基础设施。开展业务大概两年时间,期间获得了联想之星和招商局创新投的注资。我们构建了OpenBayes机器学习系统,其特性是自动化和多模态,可基于用户数据实现人工智能模型系统自动化批量交付。同时在全自动建模系统之外,我们也形成了半自动模型生产线,通过算力容器、环境预置、自动数据增强、超参数调优、自动运维部署等功能模块帮助企业研发团队提升效率,降低成本。
如果以“AI+”和“+AI”来区分人工智能企业,我们属于后者,专注传统领域+AI。早期的人工智能企业趁着传统公司没回过味来,还有颠覆的机会,但现在人工智能大热,传统公司不会等着你来颠覆,他们会自己大力建设AI研发部门。现在再走拿着锤子找钉子的路线,对我们这样一个初创企业来说风险极大,我们要选择比较稳妥的道路。所以我们在这个阶段,会更多与行业头部公司合作落地,更少地谈赋能,更多地谈ROI(投资回报率)。
作为初创公司,贝式计算在持续数据处理能力方面和顶级公司不相上下,这得益于公司和团队成员服务过很多头部企业,覆盖多个大型工业场景,处理过海量数据。但我认为,AI初创企业在商业合作过程中姿态还是要放得更低一点。不要觉得你的技术比客户牛,客户在自己的领域都有很深的knowhow。有的公司和港口谈合作,说未来愿景是码头自动化,那港口客户会觉得,你建自动化码头,客户自己做什么?
贝式计算则更多和客户沟通:哪些AI技术能够在客户的场景中落地,比如目标检测、语义分割、文本摘要等,具体到投入多少经费,需要多长研发周期,最终能产生多少效益。需要落实方方面面的细节,而且实验细节的周期往往比经费更重要,这关系着客户与你合作的信心。得益于我们自研的自动建模和算力容器技术,往往可以快速批量地帮助用户实现技术落地,增强其信心。
自动建模技术的各个模块会在用户需求中起到重要作用,涉及自动数据增强、自动数据调优、模型结构搜索或者超参数搜索。贝式计算基于该计算系统能通过算子复用进而形成原子能力,以及业务模型复用能力。这种能力的构建并不容易,开始的时候需要甚至同时训练近千个模型,团队在创立之前已经持续做了四五年,形成了自己的knowhow。
我们提供的平台服务可以帮助客户:
1、提高人力效率和时间投入回报率
让客户免于环境配置工作、数据集管理、参数调优带来的重复性劳动,推进最佳实践,能将算法工程师的单人人效提升300%以上,且有机会交叉横向实践多个横向题目,大幅增加工作的可复用性。
2、低上手成本,提供自动化运维,硬件资源实时监控,提升集群利用效率
系统对队列执行、并行训练的支持使参数调优、数据优化工作大幅减少,同时可以有效增加非工作时间的集群使用频率,使用得当可将集群利用率提升为正常使用状态下的1-2倍。
3、缩短模型交付时长,提示交付频次
自动化的超参数调优与数据增强工作,在数理逻辑上大幅缩短了模型的交付周期,提升模型泛化能力,单模型任务交付时间平均减少20%-25%,且可以交叉进行多个项目,全年工程团队研发效率可提升40%以上。
接下来,分享一些我们对于AI落地的经验和看法,包括踩过的一些坑。
下图是Gartner 2019年度人工智能技术成熟度曲线图。可以看到一些在全球范围内比较火热的AI相关技术在过去18-24个月已经越过期望度的峰值,比如广义上的自然语言处理、虚拟助手、机器视觉技术。这轮热潮已经持续消退近一年,明年可能会有更严重的下滑。
事实上AI在一个行业提升渗透率需要时间,在2014-2017年这一轮热潮下,AI赋能最为集中的是金融、安防和医疗三个领域,现在的头部公司也都经历了相当长时间的积累。从技术到场景需要时间,不仅受限于技术落地的难度,往往还取决于人们对该领域的认知度以及传统领域改造所需的时间,这都是创业公司要考虑的问题。
贝式计算是一家以自动建模技术发端的企业服务机构,近期关注的部分技术点正在这条曲线上拥有增长的期望值。比如AI开发者工具、连续学习、数据标记和注释服务、AI专有云等。从上图曲线来看,有的技术成熟度较高,应用场景比较明确,但有的技术还处在概念阶段。
这条曲线显示了两个已经发生的趋势。首先,在人工智能定义严重泛化的今天,任何AI公司都不能只靠单点的技术能力存活,需要拥有多个技术发力点及工程落地能力。其次,拥有商业场景的公司自研AI模型系统正在成为新趋势。
在这个新趋势中,贝式计算希望构建的产品能降低商业机构自研及运营AI系统的门槛,提升关键环节的构建和运营效率,进而提升AI技术在整个商业环境中的渗透率。如前所述,在金融、安防和医疗领域,AI技术的渗透率实现了高速增长。但我们判断在整个商业环境中AI的渗透率还不足15%,仍然拥有极大的增长空间。
目前这个推断和我们的产品方向也得到了一定的验证。作为一个成立两年处于A轮阶段的公司,在过去两年里,我们的销售额大概每年增长300%-400%,从第一年的100-200万,到第二年的600-800万,再到今年将近2000万,明年预计能到4000-5000万左右。
算法在落地的过程中,面临很多不确定性。有报道称即使在国内某个顶级云服务公司内部,人工智能项目失败率也将近三分之一。除去面临的不确定性风险,一个项目拖到七八个月,即使做成了,客户也早就不耐烦了。底层交付需要快速准确地做出客户需要的东西,让客户看到明显的效果,而工业界面临的场景非常复杂,这就要求初创公司有厚实的能力,运用不同的算子能力解决具体的业务问题。所以我们希望能提供一套基础设施,帮助各个团队更快落地。
OpenBayes机器学习系统作为一套神经网络模型的全生命周期管理系统,是工业界进入机器智能领域的万能钥匙,是算法工程师团队的最佳助手。
工业界企业往往还有一个核心需求,就是自主可控。越来越多的客户希望拥有自研AI的能力,自己团队去做需要大量成本和很长周期,但又不想这一核心能力依赖外部供应商,所以希望我们帮助生成一套完善的模型系统。前不久某个换脸社交应用使用的API被云服务供应商切断导致用户数骤停,就是一个典型案例。而这正是初创公司的机会所在。贝式计算通过建立一站式的计算系统,让客户能低成本快速批量实现自己的需求,从而实现共生关系。
那我们怎么做到这件事,我认为就是聪明人要下笨功夫。
比如我们为宁波大榭码头解决岸吊的问题。码头的岸吊负责在卡车和船之间搬运集装箱,这个机械需要一个人配合,保证车的集装箱中线停在岸吊的中线上时,正负误差不超五厘米,否则来回错车影响码头局部的运作效率。
振华重工一开始的解决方案是使用64线激光雷达感知拖车和集装箱的空间信息,进而实现定位。码头一开始对于上马这个工程有些犹豫,因为一个设备80万,16台岸吊仅在终端传感器上就要投入近千万,于是决定先装两台激光雷达试验一下。合作的人工智能公司在办公室里调试了将近8个月都没有成果,甚至很难准确估计出卡车体积。于是码头信息部联络了贝式计算。
我们在研究数据时发现成像精度非常低,后来我们公司的同事自己上岸吊查看工业环境,信息部的领导非常感动,说其他合作方来了这么多博士,没有一个自己上过岸吊。
经过实地考察,我们正确评估出几十吨重的岸吊在海风中的颤抖幅度,进而帮助码头信息部使用花费无多的摄像头就完成了该任务。虽然我们的收入看上去比原有竞争对手的方案少了很多,但我们借此打开了局面,运用我们的算法进一步为码头提升了集装箱周转的效率,后来我们又与更高层面的招商局港口集团合作,他们选择自建超级计算机,来运行贝式计算做整套自动化建模流程,将人工智能技术用于多个传统码头的自动化改造。
所以在AI落地的过程中,往往不是只靠算法就能解决问题。你只有真真切切和客户一起去做这件事,比如一起爬到岸吊上去,找到最优解决方法。这是一件非常复杂的事情。只有聪明人下笨功夫,才能在行业+AI落地中,更好地建立起自己的壁垒。