本文作者:商汤科技遥感事业部张琳、夏天博士
原文题目:《畅想下一个十年的新技术遥感AI解译技术》
本文编辑:36氪石亚琼
任何一种颠覆性新技术由愿景到成熟应用,从“思想火花”到“物质成品”,都应具备三个最为显著的特征:1、可以切实地解决人类活动中的至少一类问题;2、在一定范围内具有普适性和复用性;3、具备经济价值或社会效益。
遥感技术诞生于20世纪60年代,经过几十年的迅速发展,成为一门实用的,先进的空间探测技术,但仍然面临诸多制约。未来十年,遥感是否可以深刻地影响社会发展,切实解决了生产生活中的问题,兼具普适性和经济价值,其关键点在于对遥感数据的解译和应用,人工智能技术与遥感的结合或许是一把打开未来遥感行业应用大门的金钥匙。
遥感与人工智能
遥感,从字面上来看,可以简单理解为遥远的感知,泛指一切无接触的远距离探测,传统遥感解译技术对精准快速的处理效果不理想,对精细化状态分析缺乏有效手段。最为掣肘的是图像解译方法主要依赖人工判读和半自动化软件解译,这使得遥感应用无法从根本上脱离其劳动密集型的“传统”。
2015年至今,全球已发射并处于工作状态的对地观测卫星数量从223颗大幅增长增至710颗,随之而来的是卫星遥感数据分析市场的扩大。据卫星咨询公司NSR预测,到2027年,全球卫星数据分析市场总额将达到181亿美元。
多元遥感数据量的激增,遥感数据分析市场的巨大前景和传统遥感技术的瓶颈三者之间的沟壑急需一种全新的高效、精准、便捷的技术手段来填平。人工智能是计算机学科的一个分支,二十世纪七十年代以来与空间技术、能源技术被并称为世界三大尖端技术。如今,空间技术的前沿应用之一遥感技术与人工智能技术的结合,将人工智能赋能遥感技术,贯穿海量多源异构数据从处理分析到共享应用的全链路,在大幅缩短遥感图像解译周期、提高解译精准度的同时催生新的遥感应用领域,促进遥感技术应用的变革,
人工智能+遥感
伴随着人工智能技术近年来的蓬勃发展和广泛应用,遥感技术对新型解译能力的迫切需求,越来越多的高科技公司和科研院校已着手尝试利用深度学习解决海量遥感影像的解译问题,并取得了一些阶段性进展,付诸于遥感行业应用上。如商汤科技今年在WGDC上发布的SenseEarth智能遥感在线解译平台和其背后作为支撑的SenseRemote智能遥感解译系列产品。
然而,虽然现阶段人工智能与遥感技术的结合已经取得了一些进展,在部分应用场景中利用深度学习技术解译遥感影像的处理精度、效率和自动化程度都有较为明显的提升,我们却不得不正视目前成果的局限性和未来发展所面对的巨大挑战。
首先,目前大部分人工智能遥感应用均采取监督学习的方法,利用此类技术对海量遥感数据进行智能解译的基础是前置的对同样海量的特定解译对象已标注样本的训练工作,而这不仅需要大量的计算资源和精巧的设计能力,更重要的是在构建模型过程中对遥感数据已标注样本的需求。而遥感应用场景极为丰富和多样,甚至同一解译对象在不同空间、时间维度下所展现出不同的特性使得数据样本的复杂性呈几何倍数的增长,导致目前不可能出现一个机构可以将大部分遥感应用领域中正确标注的样本集合成库,从而进行训练出有效的解译模型。
以遥感技术发展较为领先的农业遥感行业为例,应用包括作物分类识别、估产、长势分析、田地土壤墒情、病虫害防治等十数个具体应用场景,其他暂且按下不表,单就农作物分类识别而言,地球上共有植物39万余种,其中被人类利用的栽培植物约2300种,农作物约90余种,我国常见的农作物有60多种,同一类别农作物在不同地区甚至相同地区不同地理环境下所呈现的特征各不相同,这种复杂性使得基于监督学习方式通过深度学习方法得到的遥感智能解译模型很难具备普适性和复用性。
其次,遥感数据来源的多元异构化,不同遥感平台如旋翼无人机、固定翼无人机、有人机、临近空间飞艇、低轨卫星、高轨卫星;不同载荷成像机理如可见光、SAR、高光谱;不同的空间时间光谱分辨率、精度、时效性等等都给遥感数据的一致性处理带来巨大的挑战,如何利用多源异构数据构建“一张图”式的应用场景,使得人工智能技术可以便捷地解决海量异构数据时空信息提取分析困难的问题将是破局遥感行业发展桎梏的重中之重。
最后,鉴于人工智能遥感技术发展的综合性,其发展不仅仅依赖遥感与人工智能自身的技术迭代和发展,计算机技术、存储技术、航天技术、互联网共享技术乃至数学、神经科学等与之相关联各个领域的技术与理论革新都会一定程度上影响着人工智能遥感行业的前行速度,这类似于一个庞大复杂的系统工程,其中任何一个环节既可能成为制约因素,也可能是发展助力。这使得人工智能+遥感技术在产生广泛的经济效益前,存在着漫长的研发周期和资本风险。
人工智能遥感的未来
样本积累
鉴于现阶段构建人工智能遥感解译深度学习算法模型对海量标注样本的依赖,利用云、区块链等新兴网络共享技术在某种共赢机制下,将散落在各个行业领域中政府机构、科研院所和公司中的遥感样本关联整合起来,互为补充,同时利用数据仿真技术的发展,共同构建属于大行业范畴的解译模型库也许是解决智能遥感技术发展中样本不足的途径之一。但这需要一个良好的商业模式,让参与各方在付出的同时均能获益;需要一个良性健全的产业生态圈,让数据资源、计算资源、科研资源可以无阻滞的流动起来;需要一个长远的布局和规则,使得这种整合健康的运转下去。无疑这是非常困难的。
所幸我们已然看到了业内相关企业的尝试和努力。比如商汤科技的SenseEarth平台的规划中提到“在未来,一个轻量级在线样本训练平台系统将依托SenseEarth搭载上线,希望借此与用户将产生更多的交流与合作。
无监督学习
从另一个角度来看,目前深度学习的基础是对大量被正确标注的结构化样本数据的训练。尽管我们处在一个信息爆炸、被各种数据淹没的时代,但这些数据尤其是遥感数据大部分是未经标注和整理的,这意味着这些数据对于大多数目前的监督式学习来说并不可用,即使现在已经有大量免费和公开的标签数据集,涵盖了各种各样不同的类别,但事实证明他们对人工智能解译遥感数据的作用依然存在很大的局限性。
标注样本集或许过孝或许标注存在偏差,在训练一个复杂的遥感解译模型时,使用小数据集可能会导致所谓的过度拟合,这是由于大量可学习参数与训练样本强关联所导致的,最终我们得到的可能是一个仅适用于这些训练样本的模型,而不是从数据中学习一般概念的模型。
无监督学习算法将会是解决遥感数据标注样本稀缺的重要技术发展方向,与监督学习需事先进行标注分类截然不同的是,他可以很好的帮助我们根据类别未知无标注的训练样本解决遥感数据解译中的各种问题。在面对海量遥感数据时,我们要处理面对的不在是进行结构化标注完善的各类样本,而是遥感数据本身。简单来说,无监督学习使得机器本身代替我们对影像数据集进行聚类和分析,例如遥感图像中有着汽车、飞机、船舶、建筑、道路等多种可检测目标,监督学习的方法是先将这些目标标注出来,提取特征进行训练,而后依据训练结果进行目标识别,无监督学习则是机器根据自身归纳的这些目标包含的人类可能无法理解的算法视角特征进行聚类,而后由人类或者相对简易的特征比对模型进行一类对象的识别。
决策型的人工智能解译
在实际业务场景我们需要给出的往往是一个综合性解决方案,这意味着解译模型的建立必须基于融合不同平台、不同载荷、不同时相和不同尺度的异构遥感数据,以多类别针对性的分析方法共同发挥作用得出结论。而以往的人工智能遥感大多是对传统数字图像处理方法的迁移,甚至仅以统计学的理念来解决问题。随着人工智能技术的发展,决策型的智能技术将成为未来的主流发展目标之一,这里的决策所指并不仅是利用成果帮助用户进行判断,而是在智能解译数据时让系统自带决策功能。就如人的学习和思维一样,在分析问题时,利用“经验”自主的选择判断依据。用何种数据类型,哪些不那么典型却行之有效的特征,针对性的对特定场景进行其包括专业性网络模型的适配、异构实体网络的自主构建、多多关联关系的动态优化等。
在未来,我们已经对细分目标对象建立了足够多离散的智能解译模型时,或许需要一种可以将数量庞大的模型库总结归纳的方法, 一个可以实现自我学习迭代,自我决策的系统,基于积累的模型设计经验,可以进一步将模型模块化,并建立一个模型搜索空间,通过增强学习,在搜索空间中寻找与自身问题更匹配的针对性模型,他可以被理解成各种网络的网络,模型的模型,分散到聚合,繁复到简约,专业到大众,将使得人工智能遥感真正成为可以被广泛深度使用,解决现实复杂业务问题,进而开拓崭新应用场景,产生巨大经济价值与社会效益的新型技术手段。
每一次智能技术水平的飞跃都带来社会生产力的巨大进步,我们也由此见证了云计算、大数据、物联网、人工智能等信息技术的爆发所创造的市场机遇以及由此催生的巨大变革。AI+遥感解放了劳动力,使遥感应用成本从经济上和专业性上得到了大幅降低,遥感技术不再是专业人员在专业领域的专业应用,如“旧时王谢堂前燕,飞入寻常百姓家”一样,其将真正成为普惠大众,人人得益的工具。
遥感AI解译技术,下一个十年的颠覆性技术,看似遥远,实则正在悄然发生……