量子CNN不存在梯度消失的问题,物理学家完成了理论证书-量子比特,
量子计算机上的机器学习,即量子神经网络(QNN),有着量子数据分析等传统神经网络无法企及的潜力。
但是,在许多QNN体系结构中,由于存在随着系统规模的增大坡度呈指数消失的“贫瘠高原”(barren plateau),所以无法训练大问题。
这无疑是第一道冷水。
如果不能克服这个问题,就不能挖掘量子计算机在人工智能应用中的全部潜力。
幸运的是,来自美国阿拉莫斯实验室(LANL)的科学家经过分析发现,最新提出的量子卷积神经网络(QCNN),梯度不会消失!
这一发现无疑具有巨大的突破性,可以为量子人工智能在材料发现等应用中的研究道路扫清障碍。
无梯度消失问题的量子卷积神经网络
我们先来看看什么是量子卷积神经网络。
它由哈佛大学于2019年提出,是一种与一系列卷积层和池化层交错相关的特殊量子神经网络,在保留相关数据特征信息的同时减少了量子比特的数量。
QCNN可用于纠错、量子相位检测、图像识别等。
△QCNN概念图
阿拉莫斯实验室的研究人员一直在研究如何减轻量子神经网络中“贫瘠高原”的影响,但缺乏完全避免这一问题的方法。
ps.量子计算机之所以称之为“贫瘠高原”,是因为它不能说与普通神经网络中的梯度消失完全相同。
“贫瘠高原”是指量子计算机的比特个数越多,现在的量子神经网络框架就容易无法有效地训练,其目标函数变得平坦,坡度太低,难以继续训练。
回到这项研究,本次研究人员针对以下两个假设对QCNN成本函数梯度的scaling进行了严格分析:
(1、QCNN中所有的2qubit单元形成独立的非相关2designs(在低深度量子电路中容易满足)
(2、成本函数对于输入密度矩阵是线性的。
最终,在这两个假设下,他们证明了成本函数偏导数的方差随系统大小消失的速度并不比多项式快。
这意味着成本函数landscape不会表达“瘦高原”,因此QCNN架构可以在参数的随机初始化下进行训练。这在很多QNN架构中都做不到。
ps.证明过程采用新的图形显示方法,也涉及复杂的推导,感兴趣的可以看论文。
研究人员称,这样的QCNN是短期内能够实现量子计算机设备学习优势的候选框架。
作为具体的例子,在将陶瓷材料作为高温超导体来改善诸如磁悬浮列车的无摩擦传输的情况下,需要筛选给定材料的各种状态的大量相数据集,并将这些状态与相位相关联来确定高温超导的最佳状态。
但是,这种事情一般计算机上的神经网络是做不到的,而量子神经网络在未来是可能的。
论文地址:https://journals.aps.org/prx/abstract/10.1103/PhysRevX.11.041011
参考链接:https://phys.org/news/2021-10-breakthrough-proof-path-quantum-ai.html