📱 概要#

しかし、これらの画像には視野(FoV)の不一致や解像度・色のドメイン差が存在し、単純な画像融合では高精細な再構成が困難でした。
🔍 背景と課題#
スマートフォンのデュアルカメラでは、 • 広角カメラ:広い視野をカバーするが低解像度 • 望遠カメラ:狭い視野ながら高解像度のディテールを含む
この望遠画像を「参照画像(Reference)」として利用し、広角画像を高精細化するのが**デュアルカメラ超解像(Dual-Camera SR)**の目的です。 従来の手法(例:DCSR, KeDuSR)はパッチ単位の特徴マッチングにより高周波情報を転送しますが、スケールの制約により細部再現性が低下する問題がありました 。
🧩 提案手法:DM³Net の主要構成#

1️⃣ Multi-Scale Matching(マルチスケールマッチング)
複数の受容野スケール(1/4, 1/2, 1)で特徴パッチの類似度を計算し、最適な参照パッチを選択。 これにより、従来のシングルスケールマッチングよりも構造整合性とディテール再現性を大幅に向上させました。

2️⃣ Domain Modulation(ドメイン変調)
広角画像(LR)と望遠画像(Ref)は、異なる撮影パイプラインによりドメイン差が生じます。 そこで、DM³Net はそれぞれのペア(LR-GT, LRc-Ref)から**グローバルドメイン埋め込み(z, zgt)**を学習。 両者の分布を整合させる「ドメインアウェア損失(L_domain)」を導入し、再構成過程に適応的に組み込むことで、高解像ドメインへの滑らかな写像を実現しました。
3️⃣ Integrated Reconstruction(統合再構成)
最終的に、マッチングで再構成した高周波特徴と、ドメイン変調された埋め込み情報を統合し、視覚的に自然で高忠実度なHR画像を生成します。
🧪 実験結果#


⚙️ アブレーションと考察#
• マルチスケール化:スケールを増やすほどPSNRが向上(27.75 dB)。
• ドメイン変調:z と zgt を併用した場合が最良性能。
• Key Pruning:閾値0.7、サンプリング間隔16で最適バランス。
これらの結果から、DM³Net の性能向上は局所的マッチングの精度とグローバルドメイン整合の導入の両立によるものであると分析されています。
🌏 応用と展望#
DM³Net は、スマートフォン・ドローン・車載カメラなど複数レンズを持つ撮影環境に直接応用可能です。 特に、ハードウェア間で異なる画角・解像度・ISP処理を統合する**計算写真技術(Computational Photography)**において高いポテンシャルを示しています。
今後は、モデル軽量化とリアルタイム化を目指し、Diffusion型復元や動画拡張への適用が期待されています。
