我们该如何找到成功的AI解决方案

2019-11-13 15:19

人工智能大概是目前经济最大的商业机会。

近年来,也许没有什么技术比人工智能更能引起话题的炒作。在某些行业中,AI的确没有辜负人们的期待。例如, AI支持出行应用程序Uber和Waze,针对性强的在线广告,商业航班的自动驾驶仪以及诸如Amazon的Alexa之类的数字助理背后的算法。

越来越多的组织开始感受到应用高级数据解决方案进行业务数字化转型的压力,否则他们将面临落伍的风险。

但是人们该如何找到对的AI项目呢?

我们应该选择诸如聊天机器人、虚拟助手和计算机视觉应用程序这类面向消费者的时髦产品?还是选择那些「嵌入式」,可以潜移默化地改善内部运营,员工效率或决策能力的后台项目?

由于潜在用例选项很多,但资源有限,因此,优先选择具有商业价值和高成功概率的项目才是明智之选。

一个由来已久的分析逻辑——5W&1H在组织开始向AI迈进的过程发挥了用武之地。

一个理想的AI项目将对以下每个问题都给出清晰并令人信服的答案:

01. WHO: 这个项目的受益者是谁?
02. HOW: 它将如何具体改善结果或用户体验,以及如何衡量这个结果?
03. WHY: 为达目标,为什么使用AI比现有流程更好?
04. WHAT: 如果成功,好处是什么? 若失败,后果是什么?
05. WHERE: 数据将从何处来?它们是否已经存在?
06. WHEN: 何时应提供初始工作原型以及随后的最终解决方案?

以下,我们将逐个问题来进行探讨。

WHO: 这个项目的受益者是谁?

确定目标受众是决定AI项目的关键一步。一个关键的考虑因素是认识到“受众”不一定必须是外部受众——项目受益人当然可以是公司内部的员工,尤其是如果项目旨在带来加快内部价值实现速度或提高团队效率。

比如,我们假设某金融科技公司正在考虑是否要构建一个面向外部的应用程序——一个将移动银行应用程序和Amazon Echo相结合的虚拟助手。在深入研究该项目之前,至关重要的是确定是否有特定的客户群将会从这个新的产品(功能)中受益。我们需要问一个关键的问题:这些特定细分的客户群体对整体业务战略有多重要?

因此,「WHO」问题直接关系到AI项目的最终成败。数据科学团队当然可以开发创新的模型和系统,但是如果他们不考虑目标受众对于该新项目的体验来设计项目,他们将面临产品对受众无用或不被受众采用的风险。

HOW: 它将如何具体改善结果或用户体验,以及如何衡量这个结果?

确定目标受众之后,我们需要仔细考虑AI应用程序或系统将如何改善该受众的体验。这个「HOW」应尽可能量化,以展示AI项目完成后的投资回报率(ROI)。
举一个例子,假设一个保险公司构建后台AI应用程序,该应用程序接受自由格式的文本注释(例如在保险和保修索赔,呼叫中心注释或医疗记录中出现的注释)并自动用相关类别标记所有文本, 提取关键信息,例如日期,位置和名称。在这个例子中:
受益对象(WHO)是公司的内部员工,特别是那些负责理赔或分析客户服务的经理。
关于HOW的问题是:该系统将节省以前必须手动执行这些任务的领域专家的时间?
如何衡量我们预期的结果改善非常重要,如果我们不能正确地通过定义「HOW」问题来量化(潜在的)AI用例,这将使高管人员未来的努力面临风险和挑战。在上面提到的这个例子,测量节省的工时是量化ROI的一种方法,但另一种方法也可以是估算增量收入。这个增量收入可以是来自于实现自动化检测之后出现的洞察力,而这个洞察力是以前没有的,可能是由于人工能力的有限,比如员工缺乏对所有数据进行手动审核的能力,或者是因为数据过于复杂。当然这个收入也可以是来自于通过预测欺诈性索赔或未来风险事件而节省的资金。
现实的ROI例子:欧洲的一家大型医院通过使用上述方法自动大规模地扫描患者记录,改善了患者的病情并获得数百万欧元的ROI回报。他们使用文本分析来检测医疗记录中提到的继发性疾病和治疗方法(这些疾病和治疗方法可能之前没有记录下来,因此也就没有保险资格)。此外,这一过程自动化可以节省大量的人工检查时间。

WHY: 为达目标,为什么使用AI比现有流程更好?

人们很容易被「AI是最新的万金油」的想法吸引。但是新的并不总是意味着更有价值,在权衡各种AI项目的利弊时,我们需要考虑预期的收益是否足以覆盖更换现有流程所需的时间和投资。

比如,我们假设:
大型零售商的营销部门每周手动标记新许可的图像,以便可以在数字资产管理系统中对其进行正确索引。
这样,员工可以在演示文稿中找到符合公司要求的图像,其中包含他们想要的特定元素(例如,商人,平板电脑,飞机等)。
建立对象识别模型以自动检测并标记每个图像中的项目是否值得?
在这个案例中,图像数量不大,自动化带来的商业价值不高,可能不值得我们去为此付出大量努力,毕竟从头开始训练强大的对对象检测和维护的深度学习模型是非常耗时耗力的。
但是,也许使用预先训练的模型(例如YOLO,COCO,Mask R-CNN等)可以提供实现此目标所需的捷径,并且不会花费太多资源。

WHAT: 如果成功,好处是什么? 若失败,后果是什么?

到现在为止,量化一个成功的AI项目的潜在收益的重要性(无论是增加收入,还是节省运营成本等)都已经很清楚。但是风险亦是应该预先检查的事情。
没有人喜欢在AI项目开始之前就考虑失败的后果。根据VentureBeat,实际上87%的数据科学项目从未将其投入实际应用。因此,必不可少的一步是评估最坏情况发生之后的后果。比如:

品牌声誉或客户信任度是否会受到重大损害?
是否会破坏组织对AI项目的信任程度以及数据团队的执行能力?
是否存在有关合规性或客户隐私的风险?

Celent分析师Dan Latimore在他的2018年出版的《人工智能在银行》中说得最好,他说:“选择一个定义明确且易于管理的项目,其失败不会造成灾难性的后果,而其成功将会鼓舞人心。”

WHERE: 数据将从何处来?它们是否已经存在?

众所周知,数据是AI系统中是最重要的元素。当今,大多数现代AI解决方案都利用受监督(supervised)的机器学习算法,该算法需要一组标记的数据,数据科学家才能从这些数据中训练机器学习模型。换句话说,算法从训练样本(包括问答信息)中了解到它已被馈送,并且,通常这些算法需要大量带标签的训练数据才能产生高准确度的结果。

传统的机器学习都得从数据出发

当组织想要实施出色的AI解决方案但又没有可用的针对特定任务的数据在手时,就会出现断裂(断层)。那些跑在前面做第一批AI项目的企业可能会考虑选择仅依赖内部数据就可以实现的项目,而不是那些严重依赖第三方资源或定制大量培训数据的项目。
比如,想一想斯坦福的Snorkel,亚马逊的Mechanical Turk或Google的AI平台数据标签服务。

WHEN: 何时应提供初始工作原型以及随后的最终解决方案?

最后:时间线(Timeline)很重要。就像自己动手做的房屋建设项目一样,从有到无构建AI应用程序的过程实际上也很容易,但是我们似乎总要进行一些微调,要添加的这样或那样一个小功能,导致项目被无限拖延。

但是,为了建立内部利益相关者的信誉,最好的做法是在短时间内从头到尾使用有限数量的解决方案,而不是在第一阶段就寻求完全成熟的解决方案。

实际示例:以面向客户的聊天机器人为例,第一个原型既可以专注于广度(即可以回答涉及多个主题的各种简单查询),也可以专注于深度(可以回答以许多不同方式提出的非常详细的问题,但仅涉及几个主题)。但是,在第一次迭代中同时就实现这两个目标可能并不现实。一旦聊天机器人预览获得了内部用户的认可(即,利益相关者确认一旦建立,它实际上将提供期望的业务成果),只有这样才能充分充实应用程序。


假设开发一个语音机器人项目

「WHEN」问题还涉及到AI项目中的关键点:可操作性。运营化是将数据洞察转化为实际的大规模业务和运营影响的过程。这意味着弥合设计机器学习模型的探索性工作与在实际生产系统和过程中进行部署所需的庞大工作量(更不用说精度)之间的巨大差距。

用MVP方法去不断完善项目

项目时间线不仅应包括开发时间和工作原型的期限,还应包括部署到生产和第二次(或第三次)迭代的期限。AI项目非常适合MVP(最小化可实行产品,Minimum Viable Product)方法,因为监测机器学习模型的性能的最佳方法是在操作过程中使用,因此成功项目的关键是及早操作,经常调整和推出新版本。

结论

当今市场上成功的公司都承认:有效地利用数据和技术不仅可以提高竞争优势,而且可以改善员工和客户的体验。但是,非常重要的是——在规划组织的AI战略时,必须具有战略性和审慎性。

最后,回答以上提到的每个问题都需要一个基本策略:协作。为了能真正敲定一个AI项目并使其能顺利完成,唯一的方法是让每个人参与,从业务到IT再到介于两者之间的人员,使他们共同交流例如风险在哪,当前流程情况,可交付成果反馈,时间线等方面的信息——这些重要的信息不能简单地只由数据科学家或者更大的数据团队来单独决定和支配。

作者信息

本文来自微信公众号:线性资本

原文作者:Rihad Variawa、翻译 | 郭椋Valen

原文标题:AI大潮下,企业该如何找到成功的AI解决方案?

原文地址:https://mp.weixin.qq.com/s/75lwdPLf28BPqJeN9Yy_zg

题图源自:pixabay

版权声明:本文遵照“署名-非商业使用-相同方式共享(BY-NC-SA 3.0CN)”规则发布,主要目的在于增强前沿科技资讯的流通可及性,以此作为他人创业或共享的参考,所涉及之内容为原文作者的独立观点,不代表本网赞同其观点,亦不对其真实性负责。