CVPR writing structure:
- Introduction
- Related Work
- Background
- Method/Solution
- Experimental Evaluation/Main Algorithm Introduction*
- Conclusion/Experimentals*
- Conclusions*
Paper formatting: Papers are limited to eight pages, including figures and tables, in the CVPR style. Additional pages containing only cited references are allowed.
Formatting instructions: CVPR 2024 Author Kit
Keyword: Quantum
2022
1. A hybrid quantum-classical algorithm for robust fitting
Doan, A. D., Sasdelli, M., Suter, D., & Chin, T. J. (2022). A hybrid quantum-classical algorithm for robust fitting. In Proceedings of the IEEE/CVF conference on computer vision and pattern recognition (pp. 417-427).
Authors Institutions:
School of Computer Science, The University of Adelaide, South Australia
Centre for AI&ML, School of Science, Edith Cowan University, Western Australia
问题
在计算机视觉任务中,数据经常受到异常值的影响,如在3D视觉中恢复场景结构和相机运动场景。现有的共识最大化(consensus maximisation)方法常依赖随机采样,不仅难以找到最优解,还易受随机性影响。这篇论文提出了一种新的方法——通过量子近似提供误差界限(Error bound),提升算法的实用性。1, 3
方法
提出了新的共识最大化算法,使用整数规划解决组合优化子问题,找到全局最优解或有界误差次优解。Hypergraph vertex cover,将问题处理为超图顶点覆盖问题,最后转换为QUBO问题使用量子退火求解。这个算法采用混合量子-经典方法将量子退火与经典优化算法结合,量子退火被用于解决整数规划问题,有效地收敛误差界。经典算法以平衡算法的效率和准确性。3, 5
实验
使用小规模数据集在D-WAVE量子计算机进行真机实验,结果显示该方法能获得更高质量或表现更好的解,误差界限有显著优势。但运行时间比经典方法如随机采样方法相比更长。
另外还是用模拟器和真实数据进行多项实验,基础矩阵估计、多视点三角测量的结果进一步验证了算法的性能。6
结论
研究结果表明量子退火在鲁棒拟合问题中有良好前景,在处理异常值方面表现出显著优势。
2. An iterative quantum approach for transformation estimation from point sets
Meli, N. K., Mannel, F., & Lellmann, J. (2022). An iterative quantum approach for transformation estimation from point sets. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 529-537).
Authors Institutions:
Institute of Mathematics and Image Computing, University of Luebeck, Germany
问题
对于求解刚性变换(平移,旋转)估计问题,现有的方法在高纬度和高噪声数据下表现欠佳。本文通过改进的旋转矩阵估计方法,利用绝热量子计算请确求解问题,研究如何提高算法在噪声和异常值影响下的鲁棒性。1
方法
使用绝热量子计算解决复杂的组合优化问题,提出了基于量子计算的迭代方法来进行点集之间的刚性变换估计。相比之前的工作,该方法利用自适应量子算法来高精度求解变换问题,解决了旋转矩阵不一致的问题。
提出了一种基于K-binary表示的旋转矩阵逼近方法,确保矩阵随着精度的提高趋近正交。为了近似旋转矩阵,将变换估计问题表示为QUBO问题。使用迭代量子估计IQT方法优化误差——对QUBO问题每次优化旋转参数以逐渐收敛至目标解,另外通过调整搜索区间半径以提高精度。3
实验
使用D-WAVE 2000Q执行量子算法,并与经典算法对比。在2D数据集Synthetic、MNIST、Lena和3D数据集Synthetic、Bunny、Completion对算法进行验证。实验结果表明该方法有较好的对其精度,在高异常值率下表现优异,与传统算法相比更能保持矩阵的正交性。还通过实验分析了不同量子比特数量K的影响,2D数据集随着K的增加,矩阵精度逐渐上升,K=10时得到最高的精度。但在3D数据集的结果与2D完全相反,K=10时误差增大,这可能是因为量子退火Chain Break增加导致的,系统噪声的增加导致了更多计算误差。4
结论
研究结果展示了绝热量子计算在点集刚性变换估计中的潜力,IQT算法不仅提升了对齐精度,同时在高异常值和噪声下具有鲁棒性。该方法能够有效逼近真实旋转参数,为量子计算在图像处理中的应用提供了新思路。
3. Adiabatic quantum computing for multi object tracking
Zaech, J. N., Liniger, A., Danelljan, M., Dai, D., & Van Gool, L. (2022). Adiabatic quantum computing for multi object tracking. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 8811-8822).
Authors Institutions:
Computer Vision Laboratory, ETH Zurich, Switzerland
MPI for Informatics, Saarbrucken, Germany,
3KU Leuven, Belgium
问题
多目标追踪MOT在计算机视觉中被广泛应用,MOT通常涉及离散优化问题,尤其在跟踪-检测范式中需要对目标和检测结果进行时间关联。但该问题通常是NP-hard的,在规模较大时无法有效求解,当前的解决方案依赖近似求解算法以及深度学习等启发式方法来减小计算复杂度。
论文的核心问题是如何设计适用于量子计算的MOT公式,将离散优化问题转换为适用于绝热量子计算的结构。现有MOT公式难以在量子计算设备上运行,传统的流网络结构(flow formulations)会引入大量不等式约束会消耗大量量子比特。
提出了一种基于分配矩阵(assignment matrices)的模型,能够线性扩展量子比特需求,同时允许在不添加额外量子比特的情况下,使用成本矩阵建立长期关联。1
方法
将每帧检测结果与轨迹关联的信息定义为一个分配矩阵的二元元素,以表示检测与轨迹的关联关系。并将优化目标转换为QUBO问题。基于拉格朗日乘子优化策略,将MOT公式写为QUBO模型,利用绝热量子计算求解Ising模型的最低能量态。通过多次迭代优化拉格朗日乘子,以提高模型解的概率性和准确性。4
实验
使用D-WAVE量子计算机测试算法以及与传统算法进行对比。实验结果表明在小规模任务中,量子计算能够找到最接近最优解的分配方案,尽管是在绝热量子计算的高噪声和解概率分布广的情况下。在MOT15数据集中的实验结果显示该方法的准确度接近当前最先进的方法。5, 6
结论
研究结果表明量子退火在鲁棒拟合问题中有良好前景,在处理异常值方面表现出显著优势。在小规模的实际跟踪任务中已具有可行性,能与经典方法的精度相媲美。该研究为量子计算在多目标追踪中的应用开辟了新的可能性,为量子计算在计算机视觉中的应用提供了方向。
4. Semiconductor defect detection by hybrid classical-quantum deep learning
Yang, Y. F., & Sun, M. (2022). Semiconductor defect detection by hybrid classical-quantum deep learning. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 2323-2332).
Authors Institutions:
National Tsing Hua University, Taiwan R.O.C.
问题
为了准确高效地识别成产中的缺陷半导体晶圆,传统的深度学习方法虽然在缺陷检测方面有所应用,但在高维数据和复杂特征映射上存在计算瓶颈。该研究提出了基于混合-经典计算的深度学习架构HQCDL来解决半导体缺陷检测中的计算瓶颈问题。因为传统深度学习在高维特征提取上效率优先,因此本研究通过参数化量子线路PQC实现特征的非线性变换。
方法
HCQDL框架包括经典层、量子层、全连接层。经典层由自增殖(线性变换)与自注意力模块(Self-Proliferation-and-Attention block, SP&A Block)组成(聚合信息捕获特征之间的长距离依赖关系),可高效提取特征。量子层由PQC组成,使用了三种编码方式,将经典特征映射到高维空间以增强表达能力。全连接层用于分类和概率计算。4
实验
在ICCAD-2012和WM-811K数据集上进行实验,另外在RestNet50、SENet、MobileNetV3数据集与传统深度学习方法进行对比。
实验结果表明,HCQDL框架在缺陷检测和热点检测的准确率优于现有模型,展示了量子计算在提升分类精度方面的潜力。
结论
本研究展示了量子深度学习在半导体缺陷检测中的应用潜力,并提出了基于量子线路的特征提取方法。实验结果也表明该方法在精度和效率存在明显优势,为未来量子计算在半导体制造中的应用提供了可能性。
2023
1. Quantum-inspired spectral-spatial pyramid network for hyperspectral image classification
Zhang, J., Zhang, Y., & Zhou, Y. (2023). Quantum-inspired spectral-spatial pyramid network for hyperspectral image classification. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 9925-9934).
Authors Institutions:
Department of Computer and Information Science, University of Macau, Macau, China
School of Computer Science, China University of Geosciences, Wuhan, China
问题
高光谱图像HSI通常包含空间和光谱维度的丰富信息,这些数据在农业、矿业及目标检测等领域有广泛应用。然而其数据的高维性,HSI分类通常面临计算复杂度和高维特征提取的挑战。传统深度学习虽然有效,但在有效地融合空间和光谱信息存在不足,往往会导致模型荣誉和低效的特征表达。本论文的核心问题是——在于如何设计一种能够在同一框架中有效地融合光谱和空间特征的模型,克服现有经典模型分别处理光谱和空间信息的局限性,从而提高HSI分类的精度和效率。
方法
受到量子计算的启发,提出了量子启发的光谱-空间网络QSSN用于HSI分类。通过结合相位预测模块(Phase-Prediction Module,PPM)和相似测量的融合模块(Measurement-Like Fusion Module,MFM),在同一操作中融合空间和光谱信息。QSSN利用量子态表示HSI数据块(cuboid),PPM模块预测相位,动态地调整光谱与空间特征的相关性。
QSSPN金字塔结构中,多个QSSN模块逐层连接可逐步减少特征通道并提取更鲁棒更具有判别性的特征。最终通过分类器对HSI进行分类。该网络的设计结构结合了量子态的数学形式和深度学习的层次结构,使得能保持较低计算复杂度的同时获得高质量的分类结果。3
实验
分别在Indian Pines、Pavia University和Salinas数据集上进行实验,结果显示QSSPN的总体准确率OA、平均准确率AA和Kappa系数上均优于现有方法。4
结论
实验结果表明,本文提出的量子启发方法通过QSSPN框架在HSI分类任务上表现出良好的准确性和计算效率,该方法能够有效融合光谱和空间信息,是实现HSI分类的一种新颖且有效的方法。
2. Quantum multi-model fitting
Farina, M., Magri, L., Menapace, W., Ricci, E., Golyanik, V., & Arrigoni, F. (2023). Quantum multi-model fitting. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 13640-13649).
Authors Institutions:
University of Trento
Politecnico di Milano
Fondazione Bruno Kessler
MPI for Informatics, SIC
问题
多模型拟合(Multi-Model Fitting, MMF)在计算机视觉中有广泛的应用,尤其是3D重建、运动分割等任务需要在同一个场景中拟合多个独立的几何模型。传统的单模型拟合方法无法有效应对此类任务,因此出现了基于量子计算的解决方案。本论文主要的问题是如何将多模型拟合问题转换为QUBO问题。
方法
现有的绝热量子计算方法多用于单模型拟合,多模型拟合的组合优化复杂性使得该任务非常适合使用量子优化方法。但由于组合复杂度的增加,直接将MMF扩展到量子优化的过程并不是直接有效的,因此提出了新的偏好矩阵(Preference-Consensus Matrix)一致性结构来适应量子计算框架。
提出的QuMF算法就是用这一结构来表示QUBO问题,偏好矩阵用于捕捉数据点对模型的偏好关系,然后将MMF问题转换为集合覆盖(Set Cover)问题,以保证所有数据点能被最佳模型集所覆盖。受限于物理量子计算机的规模,DeQuMF采用分解策略将大规模MMF问题切割为若干子问题,逐步消除冗余模型并降低问题规模,令子问题在QPU上求解。3, 4
实验
分别在合成数据和真实数据集AdelaideRMF,Hopkins benchmark进行实验,结果显示QuMF在多模型分割中的错误率显著降低,与经典RANSACOV方法的结果相比具有竞争力。在更大规模的任务中DeQuMF表现出更好是适应性,在200个-1000个模型拟合的维度上保持了较好的精确性和较低的误分类错误率。5
结论
本研究将多模型拟合问题引入到量子计算框架,通过QuMF和DeQuMF展示了MMF任务在量子硬件中的应用潜力。这项研究为未来QC在CV中的应用提供了重要参考方向。
3. Ccuantumm: Cycle-consistent quantum-hybrid matching of multiple shapes
Bhatia, H., Tretschk, E., Lähner, Z., Benkner, M. S., Moeller, M., Theobalt, C., & Golyanik, V. (2023). Ccuantumm: Cycle-consistent quantum-hybrid matching of multiple shapes. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 1296-1305).
Authors Institutions:
Indian Institute of Technology, Jodhpur
MPI for Informatics, SIC
Universit ̈at Siegen
问题
多形状匹配(Matching of Multiple Shapes, MMS)是计算机视觉和图形学中的一个重要问题,亦在多个3D形状之间寻找点对应关系。现有的量子-形状匹配方法无法处理多形状匹配,也无法保证循环一致性。传统方法在形状数量增加时计算复杂度呈指数增长。本研究的问题是设计出一种适用于多形状匹配且循环一致性的量子-混合方法。
方法
提出的CCuantuMM方法将多形状匹配分解为多个三形状匹配问题,并确保每次三形状匹配的循环一致性。最后转换为QUBO问题。通过量子退火确保每次三形状匹配的循环一致性。循环α-扩展(Cyclic α-Expansion, CAE)算法用于二进制决策向量的更新,以更新匹配矩阵。可保证不同形状之间的循环一致性。另外还是用了锚点形状(Anchor Shape)将所有形状的对应关系与锚点形状进行匹配,以简化多形状匹配问题。3, 4
实验
在FAUST、TOSCA和SMAL数据集中的实验显示,CCuantuMM在匹配质量和时间效率上优于传统的MMS方法,与现有的Q-Match相比更优越。
结论
本研究首次提出了能够处理多形状匹配的量子-混合方法,CCuantuMM在匹配准确度和扩展性方面有显著优势。研究表明量子硬件在计算机视觉的应用潜力,特别是在形状匹配等高复杂度任务中。
2024
1. HDQMF: Holographic Feature Decomposition Using Quantum Algorithms
Poduval, P. P., Zou, Z., & Imani, M. (2024). HDQMF: Holographic Feature Decomposition Using Quantum Algorithms. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10978-10987).
Authors Institutions:
University of California, Irvine
问题
高维计算(Hyperdimensional Computing, HDC)利用高维向量(超向量 hypervectors)来表示符号信息,具有大脑启发的特性(brain-inspired properties),这些向量具有容错性、鲁棒性和并行处理能力。这种结构允许对复杂数据进行绑定、聚合和排序操作以模拟大脑中的认知过程,如信息存储、模式识别和逻辑推理。在处理不精确的数据和高噪声条件时,保持较高的准确性和鲁棒性。
在HDC模型中,分解已绑定和聚合的的特征至关重要,但传统发放需要穷举所有可能组合,复杂度极大。因此该论文提出一种基于量子算法的解决方案,解决“记忆化分解问题”。
方法
现有分解方法效率底下,尤其在高纬度和大规模数据集下,HDQMF通过改进的Grover算法的相位控制来实现对已绑定特征的高效分解。每个迭代中交替应用正反相位操作(Phase-Shifted Inversion)来实现分解,其中还引入了相似度的相位便宜,用于量化当前分解状态与真实状态的相似度。分解计算这一过程是通过局部相位变化累积为全局相位。
绑定操作——每个子向量用qubit表示,通过多控制XOR门实现超向量的绑定和计算你相似度。作者修改了Grover算法中的查询步骤,使其能在含噪音的相似分布上工作。4
实验
在高维数据集上进行了模拟实验,结果展示出HDQMF算法优于经典谐振网络(Resonator Network),在不同维度的结果表明该算法能够快速收敛到最优分解状态。相比经典算法实现了更高的准确性和更少的迭代次数,证明了量子加速的有效性。
结论
本研究提出的HDQMF算法在高维特征分解中展示了出色的性能,在含噪环境中具有鲁棒性。试验结果表明该研究为高维特征分解任务开辟了新的方法。
2. Probabilistic Sampling of Balanced K-Means using Adiabatic Quantum Computing
Zaech, J. N., Danelljan, M., Birdal, T., & Van Gool, L. (2024). Probabilistic Sampling of Balanced K-Means using Adiabatic Quantum Computing. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 26191-26201).
Authors Institutions:
ETH Zurich, INSAIT, Sofia University, Sofia, Bulgaria
ETH Zurich
Imperial College, London
问题
在机器学习和计算机视觉中,平均聚类要求每个聚类具有均等大小的样本。传态的平衡K均值算法在处理大型数据集时的计算量极大,在处理不确定性量化(Uncertainty Quantification, UQ)时更复杂。该研究的问题是如何通过量子硬件来高效地生成平衡K均值的多个高概率解,并使用这些多解进行不确定性量化。传统方法只使用最佳解而忽略了其它结果,本论文利用绝热量子计算机来计算后验概率,以识别出模糊点(Ambiguous Points)和替代解。
方法
将K均值聚类目标表示为二进制变量上的能量函数,构造为QUBO问题后,使用D-WAVE量子退火计算机,结果由Boltzmann分布采样,用于生成多解。由于量子退火系统的温度匹配问题(Temperature Mismatch),采样分布与实际分布存在偏差,作者提出通过重参数化方法对Boltzmann分布重新校准,以保证后验概率的准确性,生成较高置信度的多解。
为获得高置信度的解,作者还设计了CoresetSearch筛法贪心选择剔除不一致的点集,生成高置信度的核心解(Coreset)。 4
实验
分别在D-WAVE量子计算机和经典模拟计算,实验结果表明在合成的数据集以及IRIS等真实数据上的有效性。该方法与传统K均值算法相比,在准确性和不确定性量化方面具有明显优势,有钱是识别模糊点上更为突出。5
结论
本研究展示了量子加速在概率采样和不确定性量化的潜力,通过生成的多解并结合重参数化方法,实现平衡K均值聚类的置信度估计,该方法为聚类问题的量子优化方法提供了新的解决方案。
3. Circuit Design and Efficient Simulation of Quantum Inner Product and Empirical Studies of Its Effect on Near-Term Hybrid Quantum-Classic Machine Learning
Xiong, H., Tang, Y., Ye, X., & Yan, J. (2024). Circuit Design and Efficient Simulation of Quantum Inner Product and Empirical Studies of Its Effect on Near-Term Hybrid Quantum-Classic Machine Learning. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 26162-26170).
Authors Institutions:
Department of Computer Science and Engineering & MoE Key Lab of AI, Shanghai Jiao Tong University
问题
内积(Inner Product, IP)——是现代机器学习的基本操作,从向量内积到矩阵乘法被广泛应用于分类、聚类等任务中。然而在高维数据上面临极大的计算复杂度,量子内积(QInner Product, QIP)被认为是量子计算中可有效加速高维IP的操作。目前虽然在理论上讨论了QIP的复杂度,但缺乏在NISQ设备上实施QIP的实际方案。因此本论文的主要问题是如何设计出适用于多种NISQ的QIP线路,同时实现高效的经典模拟,以在真实机器学习任务中集成QIP操作。
方法
设计了三种QIP线路,分别为一对一(1-to-1)、一对多(1-to-N)和多对多(N-to-N)等不同计算场景。通过改进Hadamard测试和量子相位估计QPE,线路能够计算不同向量对的内积,并将结果存储在量子态的相位中。为了在经典计算机上高效模拟,作者提出了基于概率采样的快速模拟方案,利用量子态搜索(Quantum State Search, QSS)与计算结果复用的方法大幅降低模拟时间。
另外作者还开发了一个包以支持QIP自动微分。3, 4
实验
QIP线路模拟在不同机器学习任务中进行了实验评估,同时使用Qiskit SDK和IBM Brisbane量子计算机测试了一对一的QIP线路。实验结果表明,QIP误差对ML任务影响较小,在NN训练中的表现与经典方法相近,但在K均值聚类中对误差较为敏感。
结论
本文提出的QIP线路和高效模拟方案为QIP在机器学习中的应用提供了有效思路。尽管在NISQ中的噪声和误差影响了部分任务,但研究验证了在NISQ设备上应用的潜力,为未来QIP在量子机器学习中的应用奠定基础。