龙猫数据成立于2014年,从2016年起开始提供 AI 数据服务,是国内最早布局相关领域的公司之一。公司旗下数据采集APP、小程序,以及数据标注平台是目前业界用户数最多、可承担样本量最大、智能化程度最高、结果最精准的数据服务平台。
数据、算力、算法是人工智能发展三要素,人工智能技术的发展催生出市场对数据标注的需求。为了得到海量多样化的数据,早期数据标注团队多以线下形式开展,以外包形式雇佣人力,借用众多人力进行数据的采集与标注,这使得行业劳动密集型的特点尤为突出,,而随着对数据需求量及数据品质要求的双重提升,人力成本高企、服务效率和质量低下却也成为了行业发展进程中的核心痛点。
龙猫数据正是抓住了这一核心痛点,将数据标注工作从线下转向线上,通过搭建AI数据平台,吸引线上用户参与数据采集和标注,以降低人力、场地成本,此外,还通过不断优化数据标注工具、自动化标注、对数据进行预标注等方式,大大提高了数据标注效率和质量。
这一抢眼表现也获得了大量投资机构的认可。
KIP中国投资董事林湧表示:
龙猫数据的创始团队有着丰富的互联网产品经验,谈及企业的发展,CEO 昝智表示:“龙猫从行业认为的AI元年(2016年)起转型到了AI数据服务,我们看到 AI 正在改变各行各业,认为未来每个公司都会 AI 化,并且都会在自己的产品业务、管理流程中融合 AI 技术,而数据正是在 AI 演进过程中不可或缺的‘水电煤’,会诞生出巨大的平台机会。”
目前,龙猫数据的服务以计算机视觉、智能语音、自然语言理解为主,公司客户遍布自动驾驶、人脸识别、家居、交通、通信、医疗、金融、教育、安防等多领域。 当前与众多知名企业已建立了长期合作关系,包括阿里、字节跳动、三星、百度、京东、小米、平安、快手、科大讯飞、商汤、旷视、蔚来、小鹏汽车等,同时为清华大学、北京大学、复旦大学、上海交大等众多高校和科研机构提供数据支持。
AI数据服务有两种基本模式:自建线下团队和线上平台模式,龙猫数据采用的是后者。近期肆虐的新冠肺炎疫情让一些自建团队的公司无法营业,而龙猫数据的订单交付丝毫不受影响,这与龙猫数据的线上模式密不可分:大量标注员具备远程工作能力,在家即可完成平台任务,赚钱同时还避免了感染风险。
疫情期间服务不减更是源于龙猫数据强烈的社会责任感。在抗击疫情的关键时期,人工智能行业推出多款产品助力“抗疫”行动。从替代人工进行口罩佩戴和体温检测的“商超守门员”,到病房里送药送食物的“智能配送员”,都离不开 AI 数据服务的支持。作为一家有责任有担当的公司,龙猫数据不仅积极捐献爱心,更是发挥公司核心优势,推出了大量为应对疫情而开发的专向AI应用数据。
采集来的数据需要进行打点、拉框、内容转写等操作,这都属于标注的范畴,目的是把人对这些内容的理解“翻译”给机器,让机器进行学习。龙猫数据依靠自研的标注工具,已经实现AI自动化标注:在积累标注项目经验和数据的基础上,通过开发工具对人脸识别、图像语义分割、OCR、语音识别、自动驾驶等场景数据进行预标注,之后再将任务分发给标注人员,因此可以实现对AI有针对性的训练和迭代。
自动化应用提升了用户的工作体验,原来费时费力的标注任务现在轻轻松松就可以完成,门槛低了,收入高了,用户粘性自然就上来了。平台以流量吸引的方式获得标注员,相比传统的线下标注场景能够获得更多人力资源。标注员在平台上接受培训,根据标注完成效果及熟练度分配不同的任务,按实际结果获得报酬。这些管控措施能够有效提高数据质量,同时使得服务报价比传统线下模式便宜30%。
目前龙猫平台旗下众包APP、任务小程序、标注平台,已经积累起超过500万注册用户,超过2000个标注团队。每周这些用户可以生产出百万张图像数据,五百万条语音数据,完成标注数据上千万条,标注准确率达99.5%以上。这些惊人数字的实现,正是龙猫数据核心竞争力——以智能化为代表的技术支撑体系和以精细化为代表的用户运营体系的最好表现。
从整体市场来看,数据标注行业国内起步较晚,行业代表公司有市值超28亿美元的Appen、Amazon旗下的AMT、估值10亿美金的Scale AI、以及近期完成2500万美元B轮融资的Labelbox等。
日前,AI数据服务平台龙猫数据获得由KIP中国领投、金沙江创投跟投的3300万元Pre-B轮融资,本轮融资主要用于增加技术研发投入,开发更多自动化标注工具,提升数据服务效率;开拓市场,在自动驾驶、智能安防、智能家居、智能零售等多个领域提供一站式 AI 数据服务。