216 Views
February 20, 25
スライド概要
DL輪読会資料
松尾研 輪読会 2025.2.20 Classification of the Fashion-MNIST Dataset on a Quantum Computer Kevin Shen+, “Classification of the Fashion-MNIST Dataset on a Quantum Computer”, arXiv:2403.02405 東京慈恵会医科⼤学附属病院 佐野 圭 Kei Sano, MD, PhD.
背景知識
古典的⼿法 vs 量⼦的⼿法 古典的NN Quantum-NN (QNN) 特徴量︓単⼀の値 (scaler) 特徴量︓重ね合わせ状態 (superposition) パラメーター︓線形変換の重み⾏列 パラメーター︓量⼦回路のゲート設定 学習︓O(N)の back propagation 学習︓O(N)の parameter shift(各M=2) 更新︓勾配降下法(局所的探索) 更新︓勾配降下法(広域的探索+⼲渉) 利点︓deepにすれば表現⼒が豊富 利点︓量⼦もつれ・重ね合わせによる表現⼒ ⽋点︓勾配消失・爆発問題 ⽋点︓ノイズに脆弱で 誤り訂正が未熟 ・QNNにおいても タスクに応じたアーキテクチャー設計が重要. ・Quantum feature spaceは「もつれ」「重ね合わせ」による⾼い表現⼒をもつ
具体的なゲート操作(例) ゲート名 説明 変分パラメータ X (パウリX) ビットを反転させる (0 ↔ 1) なし H (アダマール) 量⼦状態を重ね合わせる (1と0が半々) なし Z (パウリZ) 状態 |1> の符号を反転 なし Rx(θ) x軸周りにθ回転 θ Ry(θ) y軸周りにθ回転 θ Rz(φ) z軸周りにφ回転 φ U3(θ, φ, λ) θ, φ, λ を持つ⼀般的な回転ゲート θ, φ, λ ⾓度に関するパラメーターが学習可能︕ ・量⼦状態︓あるqubitにおける「1と0の重ね合わせ状態」を⽰すベクトルのこと ・ゲート︓量⼦状態(2*1ベクトル)に対する⾏列演算(2*2ユニタリ⾏列)のこと
具体的なゲート操作(例) qubit #1 qubit #2 出⼒ビット列の候補は 出⼒ビット列の候補は 出⼒ビット列の候補は |00> |00> 50% |10> |10> 50% 100% 100% N個のqubitをもつ量⼦計算では 3次元極座標での表記が可能なので 2^N通りの表現が可能 量⼦状態の回転操作が可能(ブロッホ球上の変換)
連動的なゲート操作(もつれ) ゲート名 説明 CNOT (CX) 制御ビットが1なら 標的ビットを反転 (XOR演算) CCX (Toffoli) 制御ビットの論理和が1なら 標的ビットを反転 CZ (Controlled-Z) 制御ビットが1なら 標的ビットの位相を反転 CRx (Controlled-Rx) 制御ビットが1なら 標的ビットをx軸周りにθ回転 CRz (Controlled-Rz) 出⼒ビット列の候補は (0,0) 50% (1,1) 50% 出⼒ビット列の候補は (0,0,0) 50% (1,1,1) 50% 制御ビットが1なら 標的ビットをz軸周りにφ回転 ⾓度に関するパラメーターが学習可能︕ *同様にCY, CRy等も存在する 2量⼦ビットゲート操作とは 2 qubitの量⼦状態(4*1ベクトル)に対する ⾏列演算(4*4ユニタリ⾏列)に相当
計算が⾼速化できる理由 1)重ね合わせ (superposition) →⼊⼒や特徴量空間を並列的に考慮したネットワーク ・古典計算では bit (1 or 0 の確定状態)というスカラー値を操作 ・量⼦計算では qubit (1 or 0 の量⼦状態)という確率分布を操作 2)もつれ (entanglement) →inferece速度を格段に向上させる(可能性) ・古典計算では N個のbit操作には 当然にO(N)かかってしまう ・量⼦計算では N個の連動したqubit操作は 究極的にはO(1)で操作可能 (ただ実際には ノイズ考慮して複数回inferenceする必要がある)
論⽂の内容
研究コンセプト ・量⼦機械学習 (Quantum Machine Learning, QML) では 特定の問題において古典コンピュータよりも⾼速に学習・推論が可能とされている. ・しかし量⼦計算をするには 古典データを量⼦データにエンコードする必要があり 既存⼿法の量⼦エンコーディングでは 計算コストがボトルネックとなる. 1)量⼦ビット数が膨⼤になる(Product Encoding) 2)回路の深さが指数関数的に増える(Amplitude Encoding) 3)ノイズの影響で正確な計算が難しくなる ・そこで本研究では Sparse Ansatz(スパースな量⼦回路)を活⽤することで 「量⼦ビット数を抑えつつ 浅い量⼦回路で古典データを符号化する⼿法」を提案.
論⽂のポイント(落合フォーマット) ### 1. どんなもの︖ ・効率的な量⼦エンコーディングと変分量⼦分類器(VQC) の設計・評価 ### 2. 先⾏研究と⽐べてどこがすごいの︖ ・Sparse Ansatz により 回路を浅くして 量⼦コンピュータでの実装を容易に ・それでも既存⼿法と精度は同等で 実機ではアドバンテージが⽰唆された ### 3. 技術や⼿法の"キモ"はどこにある︖ ・データの埋め込みを⼯夫した(FRQI の近似エンコード) ・Sparse Ansatz による浅い回路設計を実現した ### 4. どうやって有効だと検証した︖ ・シミュレーションと実機(IBMʼs ibmq-kolkata)で精度評価 ・量⼦ノイズと “VQC回路の出⼒バラツキ” の関係を分析
研究概要 1)Sparse Ansatz を⽤いた量⼦回路設計 2)Variational Quantum Classifier (VQC) の学習(量⼦回路の最適化) 3)実際の量⼦コンピュータ (IBMʼs ibmq-kolkata) を⽤いた分類精度検証
量⼦エンコーディング(画像の埋め込み) FRQI(Flexible Representation of Quantum Images) PQC(Parameterized Quantum Circuit) 1)Fashion-MNIST の画像 28×28 を 32×32 (1024ピクセル) にリサイズ 2)座標情報を 10 qubit で表現︓画像のx座標(2^5) y座標(2^5) ・例えば (0,0) = |0000000000⟩, (31,31) = |1111111111⟩ 3)ピクセル値を 1 qubit で表現︓ピクセル値(0〜255)を 回転⾓ θ に変換 ・FRQI では θ = 180 * (X/255) →例︓0=0°, 255=180° ・PQC では θ = F(X) で置換(変分推論みたく このFのパラメータを学習) 4)1ピクセルに対する変換を 1024ピクセル分たすことで 量⼦状態 |ψ⟩ に埋め込む (参考)通常のFRQIの式 |j⟩は1ピクセルの座標情報(10 qubit)で x(j)はピクセル値を0 to 1に正規化した値
量⼦回路の設計(従来法) ・General Ansatz︓2量⼦ビットゲートを階段状に配置した量⼦回路 ・2量⼦ビットゲートが多く 深い回路となり実装が困難(エラーも頻発) ・課題︓量⼦ビットを増やさずに より浅い回路でエンコードしたい︕ *90°回転 *90°回転 CXゲートなどの2量⼦ビットゲート(4*4ユニタリ⾏列) はエラーを⽣じやすいため なるべく減らしたい︕
量⼦回路の設計(提案⼿法) ・Sparse Ansatz︓CX + 単⼀qubit回転(Rz)のみからなる量⼦回路 ・2量⼦ビットゲートCXを削減(回路の深さは 1/3) →ノイズ耐性が向上 ・精度︓3層 Sparse Ansatz で「2層 General Ansatz」同等 (95.1%) CXゲートを最⼩限に抑えており エラーに強い︕ *90°回転 *90°回転
Variational Quantum Classifier (VQC) ・モデル構造(量⼦回路)︓Sparse Ansatz (CX + Rz のみ) ・⼊⼒︓11 qubit の量⼦状態 ・学習パラメータ︓単⼀qubit変換Rzの⾓度パラメータ(各Uに3つずつ含有) ・CXゲートを最⼩限に抑えており エラーに強い 観測するのは4 qubitで ・下段ほど「もつれ」の影響が⼤きい︖ 残りは補助qubit
量⼦回路(VQC)の出⼒値の解釈 1)オブザーバブルO(i)の設定︓測定した 4 qubit に作⽤するエルミート⾏列(16*16) ・出⼒ビット列の候補は16 通りなので 16次元の確率振幅(1000 shots)がわかる ・O(i)とは 確率振幅(16次元ベクトル)に作⽤して 各クラスのスコアを出す関数 ・10クラスの分類問題では 10種類の O(0) … O(9) を定義すればいい 2)出⼒値(クラス)の決定︓VQCの出⼒W(θ)とO(i)の演算スコアが最⼤のクラス(i) 4 qubitの理由は(たぶん) 2^4 > 10クラス となるため
学習 損失関数 log-softmax ・PQCとVQCのパラメータは⼀括学習 ・パラメータ更新は通常の勾配降下 (古典的コンピュータで処理) この部分をパラメータシフト法で効率的に計算 ・ユニタリ演算ではパラメータが⾮線形な位相回転を伴うため微分計算が困難 ・代わりに量⼦回路のパラメータを微⼩に変化させ 期待値の変化から勾配計算
精度評価 分類精度 General Ansatz の最良モデルは 実機では精度40%でればいいのが現状 (期待値は10%なのに対して) Sparse Ansatz を上回るが 浅い回路でも同等の精度を実現. 実機ではSparseの⽅が精度がいい. 出⼒ビット列のばらつき Sparse Ansatzの⽅がノイズ少ない. 実機で General Ansatz の深い回路は ノイズが強すぎて全ての出⼒が 0.625%ずつ等確率で安定している︖
結論 ・画像の量⼦エンコーディングと分類タスクの精度を 実機も含めて検証した. ・Sparse Ansatz を⽤いて より浅い回路でも General Ansatz に匹敵する精度を達成した. ・実機ではノイズの影響で精度が低下するが Sparse Ansatzではノイズ耐性が強化された︖
量⼦計算の応⽤可能性 ・量⼦計算では「重ね合わせ」「量⼦もつれ」等の物理学的性質を使えるのが利点なので 古典的コンピューターを⽤いた通常の機械学習研究には無意味なのか︖ → quantum-inspired algorithms という研究ジャンルが存在 1)「量⼦状態」を混合確率分布とみなし 量⼦計算ルールを応⽤したアルゴリズム ・Quantum-Inspired Neural Networks (QINN)︓量⼦回路構造を模倣 ・Quantum-Inspired Kernel Methods︓量⼦状態をカーネル関数として利⽤ 2)「量⼦もつれ」をテンソルネットワークで近似した効率的なアルゴリズム ・Quantum-Inspired Tensor Networks (QITN)︓もつれ状態をテンソル分解 ・Matrix Product States (MPS)︓量⼦状態の確率振幅をテンソル分解