采访来源:硅谷高创会
引言:在2020年1月的硅谷高创会CES贵宾晚宴暨年度突破创新大奖颁奖典礼上,Dilili Labs凭借在过去一年里在计算机视觉领域里的技术研发进展,斩获2020 SVIEF年度突破创新大奖。今天,硅谷高创会有幸邀请到Dilili Labs的CEO Stephen Li,来谈谈他对新一年技术开发的计划,以及对计算机视觉技术未来发展和应用的理解与展望。
Stephen Li,毕业于美国西北大学和南京理工大学。曾在美国摩托罗拉(Motorola)、美国硅谷高通(Qualcomm)和MagicLeap担任软件技术高管。2016年在硅谷联合成立了Dilili Labs,担任CEO,组建了拥有硅谷顶尖的人工智能技术、管理和商务人才的团队。
我们正一步步走向数字化的物理世界,机器将要理解世界。Dilili Labs专注于成为人工智能视觉平台的领导者,帮助客户快速部署功能强大,可扩展的视频分析解决方案。在未来的几年中,帮助全球客户从数十亿摄像头中提取视觉数据,理解世界,让世界变得更美好。
高创君:BrainFrame作为Dilili Labs的主要产品之一,可以先谈谈设计的初衷是什么吗?想解决什么样的问题?
Stephen:BrainFrame可以说是在我们团队工程师工作中应需而生的一个产品。我们在机器人视觉技术开发的过程中需要让机器人能迅速处理在运动过程中看到的各种图像和运动,需要开发这样的技术帮助我们解决算法开发的各种挑战。长期开发的过程中逐步演变成为一项独立的产品,面向广大的计算机视觉和深度神经网络应用开发者。作为一款平台产品,让神经网络开发和集成,和部署标准化;让效率和应用集成推广成百上千倍的提升。让传统行业企业能更简单、快速的看到投入产出效果,给传统应用行业带来价值飞跃。我们的工程师Bryce Beagle把这个产品命名为BrainFrame。
现在BrainFrame已经是成熟的一款人工智能视觉平台,不仅服务于技术开发者,非技术的普通用户也可以轻易使用BrainFrame提高业务和生产运营管理。它是业界第一个采用算法胶囊技术,在运营过程中,由用户根据业务对视觉深度神经网络进行实时配置和更新的人工智能系统。大家可以直接在Dilili Labs网站上下载BrainFrame免费版本,使用发布的算法胶囊或者进行二次开发。近期陆续会有更多视频教程发布。
高创君:您说到非专业技术开发者也可以使用这款产品,可以详细讲讲它可以被应用在哪些领域和场景吗?
Stephen:BrainFrame目前已经在零售、餐厅、法院、工地、工厂产线等领域开始推广和应用。BrainFrame会对视频图像内容进行实时分析和识别,并且根据预设的场景业务和管理流程,提供业务所需要的各种实时数据和统计信息。例如工作场所人员的位置,行为规范,车辆和物品的管理,生产的动态管理和安全管理等。
我们很早以前就发现了餐厅行业对数据和监控的需求。餐厅行业从操作上来讲,流程比较繁琐,而繁忙的前厅和后厨让生产流程的监控变得非常困难,同时随着消费者对卫生和服务的要求不断提高,连锁餐厅在管理方面的需求是非常刚性的。我们经过了许多市场调研之后,认为连锁餐厅是一个非常大的潜在市场。
在餐厅场景中,BrainFrame可以直接部署,准确地把服务员和顾客区分开来,实现各种个性化数据的统计,比如平均每一桌客人用餐的时间,从客人就坐到端上第一杯水的时间,上菜的时间等等,同时,还可以监控服务员和后厨的行为,是否有违反卫生安全的行为,如果后厨人员没有按要求洗手,BrainFrame可以根据摄像头采集的数据识别出来并发出预警。这些功能可以帮助餐厅完善前厅和后厨人员的管理。
BrainFrame除了可以帮助餐厅优化监控和管理之外,还能统计大量市场方面的数据,帮助经营者作出正确决策。比如餐厅的排队时间、客流量、翻台率、外卖占比等,这些数据对餐厅的市场营销会有很大帮助。可以说,在一切都“用数据说话”的时代,BrainFrame在餐饮业有着很广阔的需求。
BrainFrame可以被应用在餐厅、办公室、生产线、社区等多种场合的管理,图为BrainFrame分别对打电话、喝水和吸烟行为作出识别
高创君:那可以谈谈Dilili的另一款产品Synthall吗?它的开发理念是什么?针对的是哪个用户群?
Stephen:Synthall针对的主要目标客户是视觉深度神经网络技术开发者。例如谷歌、英伟达自动驾驶技术的开发者,需要从几百万英里的模拟驾驶中采集大量的数据来优化系统,所需的时间和金钱成本都非常高,因此他们采用3D建模来模拟汽车行驶的场景,并从中采集数据。
Synthall提供合成数据的解决方案,让普通开发者也能迅速从构建出的3D环境中产生出深度学习所需要的图片,这些图片都是自动被Synthall标注好的,可动态编程调整,方便训练神经网络,大幅度降低了产生数据的成本。Synthall提供的方案是非常个性化的,使用者可以自定义3D场景模型,虚拟相机拍摄的位置和角度,光线和物体运动的方式等,适用于各种视频和图像领域的深度神经网络技术开发者。此项技术在深度神经网络图像数据领域全球领先。
高创君:总体来说,今年Dilili Labs的市场计划是什么呢?
Stephen:BrainFrame是已经发展成熟的产品,今年处于一个市场推广的关键期。我们的目标是把它大规模推广到几个重要的应用领域,完成在业务和应用领域的落地。如我刚才说的餐厅、零售、安全生产、油田、工厂生产线等等不同的场合,BrainFrame都可以发挥用途。
我们为BrainFrame的一个关键定位是“Fast deployment”,用户可以直接下载系统,根据应用需求现场配置系统,快速规模部署,立即对运营进行人工智能化管理。我们和主要的芯片供应商合作,提供端到端的解决方案。对系统集成商,我们提供完善的开发接口,和其他企业应用进行集成。我们今年会参加各种展会、讲座活动,还会推出相关的视频,通过这些方式把BrainFrame介绍给更多开发者。
高创君:在市场推广方面,您可以预见到的最大挑战是什么?
Stephen:我相信我们的挑战也是其他很多技术开发者面临的挑战,即是做产品,还是做项目。客户的需求和销售是最初推动技术开发的动力,但随着各类客户的需求差异,如果最后完全变成了应每个客户需求定制的项目,就会不仅背离了产品的初衷,也增加了很多低效率的开发工作;最重要的是,为了单个客户定制的产品无法被直接应用在广泛的领域,最终从产品型公司变成项目型公司。
Dilili的定位是一个产品型公司,但怎样从这个过程中坚持下来,保持自己的产品特性,是对于我们这类公司的一个很大挑战。我认为克服这个难题的关键第一是聚焦核心应用。所以今年我们工作的重点是在针对几个重点用户的核心应用推广我们的产品,在垂直领域发力;第二,把我们的产品从云端做部署和授权管理,面向更广大的开发者用户。
我们通过OpenCV这个渠道,直接面对全球开发者,让广大开发者为用户进行个性化的开发。OpenCV是计算机视觉领域最大的开源软件库,每天有上万个独立访问,几乎每个做计算机视觉的开发者或多或少都会用到OpenCV。我去年加入了OpenCV硬件合作伙伴计划,并在委员会担任主席。我们在OpenCV发布了人工智能硬件兼容规范这个新概念,并通过OpenCV对算法胶囊技术进行了开源,作为源代码的maintainer,推动智能硬件做到应用端智能动态加载。通过与OpenCV的合作,迅速把算法胶囊在行业内推广,树立领先地位,实现人工智能硬件兼容的普及。感兴趣的智能摄像头制造商、芯片商、视频监控系统集成商,可以直接下载算法胶囊开源代码,并通过OpenCV网站硬件合作伙伴计划了解算法胶囊。
高创君:在人工智能飞速发展的今天,人工智能在很多领域的应用还处于探索阶段,在计算机视觉领域也有很多有争议的话题,例如个人隐私。作为一个计算机视觉技术的开发者,您怎么看待这个问题?您觉得Dilili Labs在未来发展中会遇到类似有争议的问题吗?
Stephen:隐私问题是人工智能,特别是计算机视觉技术发展的一个很重要的问题,尤其是在中国和美国文化差异的背景下,把人工智能技术应用在社会需要的领域是非常重要的。我个人是一个实用主义者,最初促使我创业的动力也是因为看到了这个市场的巨大需求。我认为,技术开发的根本是为了解决我们衣食住行、工作生产中遇到的困难,怎样让工厂更高效运转,怎样让远程的交流变得更有效率,或者具体到提醒用户外卖或者快递送到、取走,访客是客人还是陌生人等。
Dilili Labs拥有一个硅谷顶尖的团队,在产品开发理念和技术上处于业界领先的地位。但我们的技术一定要用在正确的方向,这是最重要的。我们希望能通过和硬件设备生产方的合作来把我们的技术具体应用到诸多工作和生产场景里,用数字化的方式运营物理世界,实现我们用技术造福人类、造福世界的朴素的愿望。