当前位置:首页 > 新闻资讯 > IT业界 > 新闻
第八回 第二双眼睛
  • 2017/4/6 9:37:55
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:电脑报
  • 作者:
【电脑报在线】2017年央视315晚会上,一段攻破人脸识别过程的演示引发争议。AI专家集体进行反打假。打假与反打假,余波未平。但这段节目,使人脸识别这样的AI新技术,得到前所未有的关注与普及。

@陈宗周

      2017年央视315晚会上,一段攻破人脸识别过程的演示引发争议。AI专家集体进行反打假。打假与反打假,余波未平。但这段节目,使人脸识别这样的AI新技术,得到前所未有的关注与普及。

计算机视觉前史

      人脸识别,是计算机图像识别的重要应用。而图像识别,又是计算机视觉领域中的重要技术。

      计算机视觉(Computer Vision,CV)是AI中的一门交叉学科,主要解决让机器看的问题。人类认识世界,有耳朵和眼睛这两个重要感觉器官。计算机语音技术让人耳聪,计算机视觉技术使人眼明。计算机视觉研究如何用摄像机等视觉传感装置代替人眼对物体进行识别、跟踪和测量,并由计算机处理这些视觉信息,从而达到像人眼一样对事物进行感知和认知。简单说来,计算机视觉是看的科学。计算机视觉可以看成人类的第二双眼睛。

      人类获取的外界信息, 80%来自视觉,我们得到的所有信息中,视觉信息最丰富而复杂。经过长久进化的生理构造,使我们很容易能够看清楚并理解身边的场景,但是要让计算机处理这些视觉信息,却非常困难。所以,与AI中一些学科相比,计算机视觉是起步比较晚的新兴学科。

      20世纪50年代,计算机开始用来进行一些二维图像的分析和识别,如光学字符、显微图片、航空图片等,这类工作,被划入模式识别。而模式识别本身也很年轻,要到60年代才成为独立学科。至今,计算机视觉和模式识别仍然是联系得很紧密的学科。

      也是在60年代, MIT的罗伯茨(Roberts)才开始用计算机程序分析三角体、立方体等简单物体, 虽然只是研究辨识度很高的简单白色积木玩具,但却使计算机视觉进入了三维空间,有人把计算机视觉的这一时期称为积木时代。

      到了20世纪70年代中期, MIT的AI实验室,第一次开设了“机器视觉”这门课程,由颇有名气的伯特霍尔德·霍恩(Berthold Horn)教授授课。定名为机器视觉非常自然,因为计算机视觉发展一直受到机器人学科推动,机器视觉始终是机器人的关键技术之一。

 

学科奠基人:戴维·马尔

      当时, MIT的AI实验室主任是明斯基,由于他的声望,吸引了国际上许多知名学者参与计算机视觉的研究工作,马尔就是其中一位,他在这里建立了计算视觉的理论框架。

      戴维·马尔(David Marr)1972年在剑桥大学脑科学专业博士毕业后, 1973年受明斯基邀请来MITAI实验室做访问学者。1980年在这里成为正教授,不久因白血病去世,年仅35岁。他在这短暂时间内奠定了今天红遍全球的计算机视觉学科基础。

      1977年,马尔第一次系统描述了计算视觉(Computational Vision)这个领域,其中包含了计算机视觉(Computer Vision)和计算神经学(Computational Neuroscience)两个分支学科,他的工作对认知科学(Cognitive Science)也产生了深远影响。

      马尔思想的精华,都汇聚进一本书里。得知来日无多,他争分夺秒整理。但仍没能亲眼看见自己的著作出版。这本名为《视觉:从计算的视角研究人的视觉信息表达与处理》(Vision:A Computational Investigation into the HumanRepresentation and Processing of Visual Information),在他去世后两年,1982年由学生和同事修订出版。

      加州大学洛杉矶分校著名学者、统计和计算机教授朱松纯教授这样评价马尔:基本上,他定义了这个学科的格局。

      马尔对计算机视觉的贡献是开创性的。他提出了解决视觉问题的三个层次——计算(表达)、算法、实现;理清了视觉到底要计算(表达)什么,并给出了纹理、立体视觉、运动分析、表面形状、光照、深度等一系列表达。他还把计算机视觉处理描述为三个阶段,第一阶段将输入原始图像抽取出角点、边缘、纹理、线条、边界等基本特征,特征的集合称为基元图,第二阶段由输入图像和基元图恢复场景可见部分的深度、轮廓等,称为二维半图;第三阶段由输入图像、基元图、二维半图,恢复和识别三维物体。

      这一理论推进了计算机视觉科学的发展,为纪念他的贡献,从1987年第一届国际计算机视觉大会(ICCV )开始,连续20年以马尔的名字来命名最佳论文奖,是计算机视觉学科唯一的奖项和最高的荣誉。

      马尔主导了计算机视觉多年,直到现在,还有学者不断研究马尔的著作。他的书 2010年再版,在亚马逊仍然是畅销书。

 

本文出自2017-04-03出版的《电脑报》2017年第13期 A.新闻周刊
(网站编辑:pcw2013)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交
读者活动
48小时点击排行
论坛热帖