一个新的证明表明,某些量子卷积网络可以保证经过训练,这为量子人工智能在材料发现和许多其他应用方面提供了帮助。图片来源:洛斯阿拉莫斯国家实验室
在量子计算机上运行的卷积神经网络因其分析量子数据的潜力比传统计算机更好而引起了极大的轰动。虽然被称为“贫瘠高原”的基本可解性问题限制了这些神经网络在大数据集上的应用,但新的研究通过保证可伸缩性的严格证明,克服了这一致命弱点。
“构建量子神经网络的方式可能会导致一个贫瘠的高原,也可能不会,”这篇题为《量子卷积神经网络中不存在贫瘠的高原》的论文的合著者马尔科塞雷佐说。X. Cerezo是洛斯阿拉莫斯的一位专攻量子计算、量子机器学习和量子信息的物理学家。“我们证明了一种特殊类型的量子神经网络不存在贫瘠的高原。我们的工作为这个建筑提供了可训练性的保证,这意味着人们可以训练它的参数。”
量子卷积神经网络作为一种人工智能(AI)方法,其灵感来自视觉皮层。因此,它们涉及一系列卷积层,或过滤器,与池层交错,降低数据的维数,同时保持数据集的重要特征。
这些神经网络可以用来解决一系列问题,从图像识别到材料发现。克服贫瘠的高原是挖掘量子计算机在人工智能应用中的全部潜力并展示其相对于传统计算机的优越性的关键。
塞雷佐说,到目前为止,量子机器学习的研究人员分析了如何缓解贫瘠高原的影响,但他们缺乏完全避免它的理论基矗洛斯阿拉莫斯的研究表明,一些量子神经网络实际上对贫瘠的高原是免疫的。
“有了这个保证,研究人员现在可以筛选量子系统的量子计算机数据和使用这些信息为研究材料特性或发现新材料,在其他应用程序中,“帕特里克科尔斯说,量子物理学家洛斯阿拉莫斯和论文的合著者。
科尔斯认为,随着研究人员近期更频繁地使用量子计算机并生成越来越多的数据,量子人工智能算法将出现更多的应用所有机器学习程序都需要大量数据。
避免渐变消失
“如果你有一个贫瘠的高原,量子加速或优势的所有希望都将失去,”塞雷佐说。
问题的关键是优化景观中的“消失梯度”。景观由丘陵和山谷组成,目标是通过探索景观的地理位置来训练模型的参数来找到解决方案。可以这么说,解决办法通常在最低的山谷的底部。但在平坦的地形中,我们无法训练参数,因为很难确定要采取哪个方向。
当数据特征的数量增加时,这个问题变得尤为重要。事实上,景观变得指数平的特征大校因此,在一个贫瘠的高原上,量子神经网络无法扩大规模。
洛斯阿拉莫斯的团队开发了一种新颖的图形方法,用于分析量子神经网络的规模,并证明其可训练性。
40多年来,物理学家一直认为量子计算机将被证明在模拟和理解粒子的量子系统方面是有用的,而传统的经典计算机却无法做到这一点。洛斯阿拉莫斯研究已经证明的量子卷积神经网络类型是可靠的,预计将在分析量子模拟数据方面有有用的应用。
“量子机器学习领域还很年轻,”科尔斯说。“当激光首次被发现时,有一句关于它的名言,说它是寻找问题的解决方案。现在激光被广泛使用。类似地,我们中的一些人怀疑量子数据将变得高度可用,然后量子机器学习将腾飞。”
Coles说,例如,研究重点是陶瓷材料作为高温超导体,这可以改善无摩擦运输,如磁悬浮列车。但是,分析材料中受温度、压力和杂质影响的大量相数据,并对这些相进行分类,是一项巨大的任务,超出了传统计算机的能力。
利用可扩展的量子神经网络,量子计算机可以筛选给定材料的各种状态的大量数据集,并将这些状态与相关联,以确定高温超导的最佳状态。