Marr是一位跨学科的传奇人物,他在1970年代将神经科学、心理学的成果与数学方法相结合,提出了视觉计算的理论框架,并厘清了计算理论、算法、实现三个研究层次,对计算机视觉在1980—1990年代的蓬勃发展提供了指导思想。我在1989年作为一名大三学生有幸读到这本书的第一个中译本,从而走上了计算机视觉的科研道路。
朱松纯 北京通用人工智能研究院院长,北京大学、清华大学讲席教授
我看过的第一本计算机视觉英文书就是David Marr的Vision。非常高兴看到吴佳俊教授将此书翻译成中文。Marr提出的用于研究和理解视觉感知的计算框架,以及如何通过神经科学和认知科学问题来达成闭环的思路,深刻影响了几十年来计算机视觉领域的发展。我也特别喜欢本书第七章自问自答的写作风格。在深度学习广泛应用于计算机视觉的今天,再读1980年出版的Marr的经典著作,同时参考Ullman、Poggio和Grimson 教授为中文版特别撰写的推荐序和后记,我相信会对人工智能从业者和学生们有非常大的启发作用。
沈向洋 粤港澳大湾区数字经济研究院理事长,美国国家工程院外籍院士
Marr的《视觉》在35年前我开始职业生涯时发挥了极其关键的作用。按照Marr提出的框架,视觉表示从图像到初草图(边缘提取)到2.5维草图(深度图重建)到三维模型表示。那时边缘提取已经非常成熟,深度图重建已经有了长足的发展,但三维模型表示才起步不久,我义无反顾地投入三维视觉的研究及在移动机器人领域的应用,很幸运参与并为后续近20年三维视觉的蓬勃发展做出了一点贡献。
Marr的《视觉》成书于40多年前,它不是一本计算机视觉的书,而是关于人类视觉的计算理论。在深度学习时代,有了足够的数据,端到端的训练似乎不需要计算理论,但我观察到在过去的两三年,一个有趣的现象悄悄发生——无论是视觉、语音,还是自然语言处理,数据红利慢慢消失,新的突破往往来自在神经网络结构设计中加入对领域的深入理解,而这,离不开计算理论的指导。强烈推荐Marr的《视觉》一书。
张正友 腾讯17级杰出科学家,AI Lab和Robotics X实验室主任
很高兴看到这本Marr的经典著作的中文版的面世,仿佛又回到了九十年代在MIT读书时的课堂。经典永流传,四十年后,在深度学习开启的人工智能时代,本书仍旧在不断启发我们对计算机视觉的研究。
汤晓鸥 香港中文大学教授,工程学院杰出学人,商汤科技创始人
Marr在《视觉》一书中描述的视觉计算理论的思想,在数十年间主导了计算机视觉的发展。四十年后的今天,我们再读这本书,会发现虽然Marr的具体计算理论可能是理想化的,但他对计算理论这一概念的追求,启发了我们找到了物体识别这个新的计算目标,构建了ImageNet这样的数据集,并最终影响了今日计算机视觉的发展。在此,我向大家郑重推荐我的同事吴佳俊翻译的《视觉》中文版。
李飞飞 斯坦福大学红杉讲席教授,美国国家工程院、国家医学院、艺术与科学院院士