1. 目的
参数化量子线路PQC是变分量子算法VQA的重要组成部分,广泛应用于多种算法如VQE、QAOA和机器学习。使用一系列的参数可学习的量子旋转门构成子程序,或称为Ansatz。
目前大部分的PQC是经过人工分析和设计的,这需要考虑贫瘠高原和一系列复杂度问题。在一个特定场景中如何进行最佳分析仍是一个活跃的研究领域。
在考虑硬件噪声的情况下设计PQC仍是耗费时间精力的过程。
量子架构搜索QAS的目标是自动化这些过程,为所使用的量子硬件生成尽可能符合当前任务的PQC和参数集。
这篇综述介绍了当前几种比较有前途的QAS方法。
2. 背景
主要研究过程
- 进化算法(上个世纪末)
- 深度强化学习
- 可微算法
- 贝叶斯优化
- 机器学习
- …
量子线路的自动化设计也被称为:
- 量子线路设计搜索(quantum circuit design search)
- 量子线路搜索(quantum circuit search)
- Ansatz结构搜索(ansatz architecture search)
- 自适应变分量子算法(adaptive variational quantum algorithms)
- 量子线路学习(quantum circuit learning)
- 量子神经结构搜索(quantum neural architecture search, QNAS)
- 混合优化(hybrid optimization)
还有一些用于一般量子线路的生成(非PQC)在这篇综述中没有提及。
近年的QAS技术都收到了NAS的启发。NAS和超参数优化HPO密切相关,它能自动搜索ML模型最佳超参数,如lr、adam优化器的选择。这也被视为AutoML的子领域,因为AutoML的目标是全自动化整个流程。
类似的有量子版的NAS——QAS。主要考虑在量子硬件上能否有效运行量子算法,于是有硬件感知的QAS。研究表明噪声会导致给定参数的cost function的估计值与无噪声的情况下不同。
Patel, Y. J., Kundu, A., Ostaszewski, M., Bonet-Monroig, X., Dunjko, V., & Danaci, O. (2024). Curriculum reinforcement learning for quantum architecture search under hardware errors. arXiv preprint arXiv:2402.03500.
本文对QAS的定义:
给定一个任务,根据性能指标/标准自动设计一个可优化的PQC。
能访问数据集,或有额外的约束条件,如门的集合,qubit数量等。
这种算法的搜索空间非常大,通常会根据任务类型和研究者的经验估计或推导得到限制集。还可以限制某些门集只能作用在特定位置。
还有编码方式,例如图像的像素、位置,meta data信息。
这个搜索过程还可以用图表示,有向无环图DAG,节点表示门,变表示顺序。这种方法也可以更好的限制双量子比特门的使用。
类似的在模拟量子计算使用的张量网络TN可以更类似或直接的表达。
性能评估:
以在含噪声的环境下为主,因为训练和运行线路这个评估过程会耗费大量计算资源,所以许多工作还用估计器来降低计算成本。
3. 搜索策略
3.1 强化学习
使用强化学习RL的QAS方法将问题建模为马尔可夫决策过程MDP。
MDP提供了顺序决策的形式化过程,从交互中学习,其中学习系统被称为agent,目标是找到一个最优策略。
应用RL的QAS一般会将动作建模为量子门,状态为多种量子线路,奖励函数为PQC待解决的任务。一些工作的RL代理选择了OpenAI Gym,奖励为哈密顿算子期望的cost。
深度RL的主要缺点是采样效率低,需要大量环境相互作用来学习最优策略,得到的PQC的泛化性能不明确,如果失效意味着需要重新训练。有工作提出了可以recall操作以在不同环境下学习的算法。
3.2 进化算法
遗传算法或进化算法EA是一种搜索策略。QAS中,每个个体代表一个特定的量子线路结构,基因是线路的门或层级,突变为门操作、交换或删除。基因特征定义为搜索空间。
3.3 可微QAS
3.4 自适应算法
作者定义:
自适应算法考虑初始线路架构,在每个阶段修改其中一部份。
修改是可随机的,也可以是基于某种规则的。
如果每个阶段执行最好的修改,那么这个搜索过程被称为贪婪算法。
自适应策略是一个很广泛且通用的概念,经常在搜索方法中使用。
一种用于QAOA的QAS策略,它从传统的QAOA中采用贪心算法,依次移除两双量子比特门,这些门对应图的边。
还有使用模拟退火SA修改初始线路。
3.5 蒙特卡罗树搜索
蒙特卡罗数搜索MCTS将搜索空间编码为搜索树。QAS中树的节点对应量子线路的门、层。从root节点开始沿路径遍历节点构建线路。评估搜索树中不同节点,MCTS会收集这些信息用于后续迭代的选择过程。搜索选择策略需要评估之前所选择的、有前途的节点,探索其它未知的分支。
3.6 贝叶斯优化
贝叶斯优化BO是一种优化策略,用于优化计算代价高昂的黑盒函数。
如何工作:
给定最小化定目标函数和初始量子线路集
BO首先构建一个代理模型,概率模型
该模型基于过去评估中的数据来近似目标函数
在迭代中根据获取的函数,从搜索空间中采样一组新的量子线路
获取:平衡BO中探索和开发
对新样本进行评估,确定真值性能,其数据用于更新代理模型。
一些工作使用量基于高斯过程GP对代理模型,期望改进EI是由EA优化后的获取函数。
3.7 生成模型
引入生成式量子特征求解器GQE,使用了经典生成模型生成PQC。自然语言处理NLP,Transformer架构在这里用于生成量子线路序列。生成算法包括生成对抗网络GAN、Flow模型、受限波尔兹曼机或自动编码器。
4. 效率
4.1 One-shot 技术
One-shot又名权重(weight)共享,作用于量子域。
首先对超级线路进行初始化和充分训练
每一步中对单个子线路,即包含在超级线路中的结构并继承参数,对其进行采样和评估
选择top-k表现最好的子线路,然后重头开始训练
最终返回最优子线路解
迭代中训练。
4.2 性能预测器
可选预测器(代理)来降低训练资源。
可训练的预测器:循环神经网络RNN回归模型和卷积神经网络CNN分类模型被用来预测候选量子架构的性能。它们部分在量子线路中进行训练。在准备训练数据集的时候,每个线路都用不同初始化的参数进行多次评估,因为损失值可能有局部极小值。
对预测器进行训练,那么基于cnn的二元分类器(好线路、坏线路)会被用于筛掉差的量子线路,剩下的交由RNN进一步评估。
预测器还使用图神经网络GNN,将DAG的离散线路结构映射为连续特征表示。另外还有多感知层设计的方法。
无需训练的预测器:。
4.3 Meta学习
元-学习,它利用先前的其他相关任务经验帮助模型更容易获得新的技能,只需要更少的样例或更少的环境交互。类似已训练的模型被用于其他工作。热启动、前一学习、主动学习、few-shot学习等都被应用在ML学习中。
4.4 减少搜索空间
搜索空间的修剪操作作为QAS的预处理。门集在迭代中减少,因而搜索空间减少。
该方向多为探索/调查简化的场景。
该工作搜索生成了纠缠设计的最优解。