敞开怀抱拥抱森林。
文字|科技星球周小琦
商汤科技联合创始人兼CEO徐莉表示:“如果你想找到一棵大树,你会想去森林里看看,人工智能也是,其中有很多细分场景和应用,我们应该拥抱开放的生态,这是创新的关键驱动力。
7月10日,在全球人工智能大会商汤企业论坛上,徐莉宣布对OpenMMLab进行战略升级,成立了由商汤科技发起的“人工智能算法开放系统”。
战略升级后,OpenMMLab人工智能算法开放系统将涉及10多个研究方向,涵盖100+多种算法和600个预训练模型。
“OpenMMLab是我发起的一个项目。我的一些来自商汤的学生和研究人员参与其中,在商汤逐渐演变成一个开放的人工智能系统。目前,我将协调这个开源系统的未来发展计划”,商汤联合创始人、香港中文大学信息工程系教授林达华表示。
2018年,香港中文大学与上塘科技联合实验室启动了OpenMMLab计划。近两年来,MMLab逐渐开放了多个开源算法库和工具箱,获得了越来越多AI研究者的使用和反馈。
“虽然我们的算法面向公众、学术界和工业界,但开源算法并不是针对某些特定落地场景的需求而开发的。任何特定的场景都有独特的需求,企业需要知道如何将产业需求与算法相结合”,林大华说。
作为技术驱动型企业,商汤不仅需要解决技术难题,更需要接受产业落地的挑战。因此,对于商汤来说,一个系统化的算法框架平台不仅可以提高开发者的思路实现效率,还可以提高整体的生产力。
如今,人工智能经过多年的发展,已经应用于安防、教育、旅游、娱乐等领域。当AI模型应用到更多的关键领域时,如何提高决策的可靠性成为未来的重要挑战。
不可否认,目前人工智能在技术上已经达到了一个非常高的水平,但背后仍然需要海量的数据和巨大的计算能力。
商汤联合创始人林达华 商汤联合创始人林大华
未来AI如何更好地应用于行业?其中,商汤会侧重哪些方面?开源算法越来越多,AI企业如何提升竞争力?近日,Tech星球采访了林大华。以下是对话记录:
开放:不想一个人呆在森林里
科技星球:OpenMMLab人工智能开放系统在商汤的地位如何?OpenMMLab有什么价值?
林大华:OpenMMLab是商汤人工智能算法的开放系统,也是商汤拥抱开源的一个非常重要的战略步骤。它最重要的意义在于它与整个AI行业开源系统的连接。
AI算法研发的过程非常复杂,从一个简单的想法到最终落地需要很多步骤,在算法开发层面需要大量的工程实现,需要大量的实践和工程资源。
OpenMMLab的价值在于可以基于其提供的框架形成落地技术,加速研发进程。
科技星球:你是什么时候决定把OpenMMLab定义为人工智能的开放系统的?当时做这个决定的机会是什么?
林大华:首先,OpenMMLab在两年前逐渐开放了少量的代码库。当时我们知道在学术界实现一些算法有很大的困难。后来在算法实现的过程中,我们发现缺乏一个统一的、结构良好的代码库是当前业界和研究界的一大痛点。因此,从今年开始,我们就开始做准备,将OpenMMLab定义为一个开放的人工智能系统。
科技星球:目前,OpenMMLab重点关注十大研究方向。选择这十个研究方向有什么考虑?
林大华:我们对方向的选择,主要看学术界和工业界最常要求哪些方向,哪些方向在商汤积累了更多的算法。具体来说,这十个方向包括图像分类、图像检测、语义分割、运动识别等。这些是计算机视觉领域最重要的方向,也是实际应用中推广最广泛的一些方向。
Tech Planet:你认为OpenMMLab的开源会如何帮助开发者自己?它能给他们带来什么?
林大华:总之,他们从想法到实现的路径大大缩短了。以前,没有这些开源代码库的支持,他们需要大量的工程支持和实践来实现一个算法。现在有了这样的代码库和很多架构的支持,对于一个有新想法的R&D人员来说,他只需要实现创新的部分,其他部分可以依靠开源代码库来实现。
比如实现一个物体检测算法,从看到纸到实现算法,再把精度调整到纸的水平,可能需要两三个月的时间。现在从思考到落地只需要几天时间。
从技术到落地,没那么简单
科技星球:在将技术转化为生产力的过程中,OpenMMLab有哪些具体的帮助?
林大华:我们之前接到一个项目,客户要求一两个月内交付60多个型号。当时这个项目我们有十几个人,要在短时间内交付这么多车型,性能等方面需要达到一定的水平。
在OpenMMLab和商汤其他模型基础的支持下,我们每天可以交付几个模型,并保持一定的水平。该算法框架和平台对提高商汤的整体生产力起到了很大的作用。基本上,有这个平台和没有这个平台有很大的区别。
科技星球:你认为商汤从科技到产业的落地过程中会遇到哪些挑战?
林大华:有两个方面,一个是技术层面,一个是落地层面。我们发现,当技术落入各个行业时,会有不同的进化形式。比如以检测为例,我们检测街道上的人脸、工厂场景中的零件、医学图像中的病理特征,这些本质上都是检测。但是,当同一算法落地不同场景时,会演化出很多不同的版本,给技术积累带来很大的挑战。
其次,在落地层面,要深刻理解每个场景的需求和痛点。当我们没有深入到某个行业的时候,我们会有自己的想象,但是当我们深入到这个行业的时候,我们会发现其实是另一个景观,这对于从技术背景成长起来的同事来说是一个很大的挑战,需要我们既懂技术,又懂行业。
科技星球:商汤如何协调基础研究与商业化的关系?
林大华:不是矛盾的东西,其实是相辅相成的。首先,在研究过程中,商汤也会借鉴开源项目,因为各种参数都在调整,所以实现路径会变得很短。
同时,商汤在研发过程中会产生大量的算法,我们将这些成果贡献给开源项目,这将缩短我们的研发速度,加快商业化的步伐。
人工智能已经工业化,但挑战才刚刚开始
Tech Planet:目前有观点认为,相对成熟的开源算法在实践过程中结合硬件条件和外部建设的影响,最终结果不会表现出太大的差异,这可能对技术真正先进的AI企业不利。你觉得这个怎么样?
林大华:首先,如果一个企业独特的算法或者技术的效果和一个开源算法的效果差不多,那么企业就需要问它的主要价值在哪里,每个企业都要寻求自己独特的价值。
其次,开源是面向社区、学术界和工业界的。这些开源算法不是为特定的着陆场景开发的。我们会发现任何特定的场景都有自己独特的需求,这是开源算法无法解决的。
企业要有捕捉独特需求的能力,这也是核心竞争力的一部分。之后,他们应该知道如何将工业需求与算法相结合。事实上,开源算法可以更快地缩短实现想法的过程,让企业发挥竞争作用。
如果一个企业发现自己的技术因为开源算法而失去了竞争力,那么我觉得他应该思考一下自己工作的位置。
科技星球:去年底,你提到CV刚刚起步。你认为今年CV厂商会处于什么样的局面?商汤现阶段会重点关注哪些方向?
林大华:如果我们比较一个人的成长,他有100年的历史。现在我们只做了几年,所以才刚刚进入青春期。
本来在2010年之前,更多的是学术问题。后来商汤等公司出来后,CV处于产业化阶段。未来,随着更多人的加入,CV将逐渐从一些重要领域的产业化走向全社会的普及。
然而,虽然我们看到CV行业在不断扩张,但也面临着更大的挑战。我们可以看到,经过多年的发展,它在技术和工程上已经达到了非常高的水平,但我们也可以看到,它依赖于巨大的计算能力和大量的数据,所以当场景落地时,它将面临相对较高的价格。
同时,AI与更多领域结合时,如何克服新的挑战。比如AI应用于医疗、自动驾驶等关键领域,如何提高AI在决策中的可靠性是未来的重要挑战。
科技星球:你如何看待人工智能开源的现状?你对未来有什么看法?
林大华:目前人工智能领域的开源还处于起步阶段,全面开花。我们可以看到脸书、谷歌等公司在开源和开放方面的努力,但大部分都是从单一点、单一方面开源。未来整个领域将从单一论文、单一方向开源逐步走向开源体系,最终形成一个非常有活力的体系,将减少科研的路径和成本,加快产业的落地。