计算机视觉中的多视几何:序言(by Olivier Faugeras)

| 研究学术  | 文献阅读  计算机视觉  多视几何第二版 

早在60年代,人工智能领域的权威专家认为:让计算机具备视觉功能的难度相当于暑期的学生项目水平。40年过去了,该任务仍悬而未决,而且似乎很棘手。整个计算机视觉领域,本身已成为一门学科,它与数学和计算机科学联系紧密,与物理学、认知心理学和神经科学联系松散些。

对于这个半失败项目,一个可能原因是事实上研究人员没重视实际情况,可能是由于犯了自以为是的幼稚病(plague called naive introspection)——动物和人普遍的认知,特别是视觉感知,远比最初设想的复杂。我们当然没有理由要计算机视觉算法模仿生物学算法,但事情的真相如此:

  1. 生物视觉的工作方式在很大程度上仍然未知,因此难以通过计算机模拟;
  2. 试图忽略生物视觉并重建一种基于芯片的视觉(silicon-based vision),并非像当初预期的那样成功。

虽然存在这些消极的声音,但是计算机视觉的研究人员已经在实践和理论中都取得了一些突出的成就。

在实践方面,挑出一个例子:多年前欧洲、美国和日本已经证实,在规则道路和崎岖地面,利用计算机视觉技术引导诸如汽车和卡车的车辆是可行的。这需要实时三维动态场景分析能力,该技术相当复杂。如今,汽车制造商正逐步将其中一些功能整合到他们的产品中。

在理论方面,几何机器视觉领域已经取得了一些显著的进展,这包括:当从不同视角观察时,用对象形状和摄像机参数的函数表示对象外观的改变方式。若不采用相当精妙的数学方法,这一努力无法实现,这些古老的和新颖的方法涵盖了几何学的多个领域。本书着重阐述现实世界中对象的图像之间复杂而美妙的几何关系。由于解释表象是科学的目标之一,对这些关系自身而言,它们对分析至关重要;由于这些关系的明确拓宽了应用范围,它们对分析也至关重要。

本书由两位几何机器视觉的先驱和权威专家撰写。他们在那些挑战之处已获成功,也就是:以简单且易于理解的方式表述了理解基本几何概念必须的数学;十分详尽地涵盖了他们和全球其他研究人员取得的成果;分析了几何学和真实情况之间的相互作用关系,真实情况的图像测量必然是有噪声的;许多这些理论结果以算法的形式表示,以便它们能被转换成计算机代码;列举了许多真实示例阐明这些概念并展示了理论的适用范围。

回望最初的圣杯,让计算机具备视觉功能,我们可能想知道这样的工作是否向正确的方向迈出了一步。我必须把该问题的答案留给本书的读者。我乐于这样说:那些将使用接到计算机的相机构建系统的设计者,没有一个在可预见的未来能忽略本书。对定义什么意味着计算机具备视觉功能,这可能向该方向迈出了一步。


打赏作者


上一篇:高性能Python程序     下一篇:计算机视觉中的多视几何:前言