这段时间一直在做全景图像拼接,略有小成。总结一下:
图像拼接概括起来说,分两大步骤。第一步,配准。第二步,融合。
配准有基于模板匹配的,有基于特征点匹配的。现在的主流是基于特征点匹配的,SIFT是热点。
融合的方法有很多,有最简单的线性过渡,有经典的拉普拉斯金字塔融合(多波段融合),有基于小波变换的融合,还有比较新而且效果很赞的泊松图像编辑融合,可惜泊松图像编辑的这个方法我还没有实现出来,只是实现了基于拉普拉斯金字塔的融合,效果挺不错。
以下三篇论文是权威和经典,如果有能力消化并实现,那么一个完整的全景拼接系统就有了。
1) Construction of panoramic mosaics with global and local alignment.
Heung-Yeung Shum and Richard Szeliski. 2000.
2) Eliminating Ghosting and Exposure Artifacts in Image Mosaics.
Matthew Uyttendaele, Ashley Eden and Richard Szeliski. 2001.
3) Automatic Panoramic Image Stitching using Invariant Features.
Matthew Brown and David G. Lowe. 2007.
ps: 上面论文作者其中的Richard Szeliski是计算机视觉界的翘楚,在微软研究院工作,最近出了新书《Computer Vision: Algorithm and Applications》英文版,200多美刀。不过该大牛在他的个人网站上放了书稿,pdf格式,绝对值得下载。