新智元报道
来源:北大新闻网
编辑:白峰、依明
【新智元导读】刚刚,北京大学官网显示,前UCLA教授朱松纯受聘担任北大人工智能研究院院长,北大常务副校长龚旗煌代表学校,对朱松纯受聘北大表示热烈欢迎。此前曾有消息传出朱松纯拟入职清华,现在来看,还是北大「抢」得了先机!
北京大学新闻网发布消息:朱松纯教授受聘担任北大人工智能研究院院长。
这则新闻在AI学术圈再次掀起热议。就在本月中旬刚有消息传出「朱松纯拟加入清华大学自动化系,任教研系列教授」。
然而,知乎上入职清华相关的帖子现在已经被删除了。
前脚还传进清华,此时落地入北大
没有帖子,也没有传言。
9月24日,朱松纯已经以院长的身份在北大开了工作会议。北大常务副校长龚旗煌代表学校,对朱松纯受聘北大表示热烈欢迎。
朱松纯表示,他与北大、清华的相关学者一直保持着密切的学术交流与合作,有很多朋友和合作伙伴。近一段时间来,自己又深入考察了解了北大、清华等高校的情况。
在北大,他与多个研究方向的师生进行了充分的交流,深入了解了北大人文社科领域的发展状况,与多位知名学者进行了跨学科的探讨,收获颇丰。
朱松纯认为通用人工智能的实现,离不开哲学层面的思考,也需要与理工文医深入融合。
而北大在各方面都有深厚的积淀,因此,坚定了自己在北大开展人工智能研究的信心。
他将全身心投入到关键领域、重大问题的研究,培养更多国家需要的拔尖创新型人才,争取取得更多突破性、原创性的成果。
朱松纯还特别强调,他将主动发挥好桥梁纽带作用,推动北大、清华等各兄弟院校精诚合作,整合各自优势资源,形成合力,共同来参与、支持北京通用人工智能研究院的建设。
清华北大都来「抢」的朱松纯:三次问鼎计算机视觉最高奖
朱松纯于1996年获哈佛大学计算机博士学位,师从国际数学大师大卫曼福德教授,在国际顶级期刊和会议上发表论文300余篇,并三次问鼎计算机视觉领域国际最高奖项马尔奖。
朱松纯对计算机视觉有着自己独到的看法,在认知科学领域,如视觉常识推理、场景理解等领域做出了重要贡献。
他信奉一句话,「一个民族如果忘记了历史, 她也注定将失去未来」,而这句话,对计算机视觉来说,也是同样发人深剩
他提到,现在很多新发表的视觉的论文,很少有文章能够引用到 5 年之前的文献,都是引用近两年arxiv上的文章,去比一些Benchmarks。
很少有人认真去看 10 年前,20 年前,甚至 30 年前的论文,而当时的一些思想和框架性的东西,对现在的研究仍有重要的意义,大家几乎都用同样的方法在比小数点后面的精度。
大家都相当短视,只关注这几年的历史和流行的方法,根本无法传承这个学科。特别是等当前这一波方法退潮之后,这批人就会慢慢失去根基和源创力。
谈到自己的学术生涯,他认为David Marr 对他影响最为深远。
60 年代开始的时候大家已经很多人研究视觉神经生理学、心理学问题,也有人做一些边缘检测的工作。但是,计算机视觉到底要解决哪些问题?如何实现?大家莫衷一是,谈不清楚。
David Marr 分出了三个层次来解决这个问题,分别是计算(其实应该说成是表达)、算法、和实现。
首先,在表达的层次, 如何把它写成一个数学问题。任务是什么?输出是什么?这是独立于解决问题的方法的。
其次,对这个数学问题去求解时,可以选择不同的算法, 可以并行或者串行。
再次,一个算法如何在硬件上实现, 可以用 CPU,DSP, 或者神经网络来实现。
除此之外,David Marr 还理清了视觉到底要计算什么。
Marr 提出了一个系列的表达,从primal sketch(首要简约图), 到 2 D sketch(深度简约图), 到 3D sketch。
这里面还包含了纹理、立体视觉、运动分析、表面形状等等。Marr认为,视觉计算不是单纯去求一个解,而是一个连续不断的计算过程,越看、越琢磨,可能得到的理解就越多。
值得一提的是,Marr 在1978 年冬诊断得了急性白血病,在得知来日无多后,Marr就赶紧整理了一本书《视觉:从计算的视角研究人的视觉信息表达与处理》,去世时年仅35岁。
朱松纯和同事在这本书上花了8年时间,把 Marr 提出的早期视觉概念, 包括纹理 、图像基元以及原始简约图等转换成了一个统一的数理模型。
从此,视觉就可以从纯粹的理论、计算的角度来研究了。
除了视觉的统计建模和计算理论,朱松纯还实现了图像与场景的解译(parsing)计算框架, 扩展了模式识别创始人傅京孙先生的句法模式识别理论。
自2010年以来,朱松纯将计算机视觉与认知科学、自然语言理解、机器人等学科结合,探索他所称的「人工智能的暗物质」占95%的、无法通过感知输入观测到的智能。
现在,朱松纯团队构建了一个大规模、物理逼真的VR / AR环境,用于训练和测试负责执行大量日常任务的自主AI智能体。
这些智能体可以整合视觉,语言,认知,机器学习和机器人技术等领域的能力,在此过程中发展物理常识和社会常识,并使用认知架构与人类进行交流。
熟悉朱松纯教授的人,对他严谨的治学精神,也从不吝惜赞美之词。
他对数学一丝不苟,对视觉领域有着一流的直觉
微软亚洲研究院视觉组研究员代季峰,曾经在朱松纯教授的VCLA实验室访学一年多,为我们分享了一些朱松纯教授的学术人生。
对视觉领域大方向有着一流的直觉
朱松纯教授的实验里学生人数较多,自然要用雄厚的funding资金来支撑。朱教授在最近几年应该都是美国大学视觉界里funding最多的教授(不知道是不是要加个「之一」)。
从2011年起,朱老师的实验室,作为PI拿到的资助超过4000万美元,其主要原因就是其「研究思维超前」。
能够拿到这些大funding,意味着朱教授对这个领域的大方向「有着一流的直觉以及领先和准确的把握」。
而朱教授这种的「第六感」在多年前就已经有所体现。
2012年,朱松纯教授主持的一个MURI大项目在UCLA开会,他上台讲了一通「vision meets language」,说视觉和语言的结合会是一个重要的问题,比如看到一整个图片,系统应该输出一段话描述它,比如看到一个bounding box区域,要描述这里面发生了什么,这个用一个hierarchical的And-Or graph该如何实现。
当时很多视觉领域的大佬都觉得有些天方夜谭。没想到过一两年,这就是红极一时的VQA任务,不过是用神经网络实现的。
「能够提前感知到未来的大方向」,这是顶级的research感觉,这也是朱松纯教授最厉害的地方。
朱松纯教授提的大方向,虽然有错的,但是正确的概率已经是很高了。
对数学(尤其是统计)一丝不苟
跟朱教授讨论的时候,最经常被challenge的就是「这个算法不对,数学上是错的,这个CV领域最近火的技术在统计上是不对的」
对大部分研究者来说,概率模型流行就用概率模型,SVM流行就用SVM,神经网络流行就用神经网络。
而朱松纯教授是有信仰的,那就是他的「概率模型」,曾经在SVM之前引领了视觉领域的潮流。那是他们自己的东西,所以不像其他人那样可以轻易舍弃。
朱教授曾经说过「做research像下围棋,不能东下一颗西下一颗,地盘全被别人占了」。
对学生刀子嘴豆腐心
这是朱教授受到的争议最大的地方。
刚去他实验室的时候,会很不适应他的批评,但你慢慢了解他,就好了。
他对学生的长远发展和重要利益,是非常好的;虽然批评时很难受,但过后他不记仇;还有同实验室吴教授的平衡和调和。
其实学术圈的老板,脾气大一些、对学生push的非常多,算是research人的通病吧。
但最后找工作什么的关键时刻,他和同实验室的吴教授都是非常supportive,有人情味的。
朱松纯教授的女儿在年满18岁之际放弃了美国国籍加入中国国籍,也许从那时起,朱松纯教授的回国计划就已经提上了日程。
朱松纯这次回国,将为国内人工智能尤其是通用人工智能的发展,带来强劲动力。他也离「人工智能大一统理论」的梦想上更近了一步。
参考链接:
http://www.stat.ucla.edu/~sczhu/research_blog.html#VisionHistory(朱松纯:正本清源 | 初探计算机视觉的三个源头、兼谈人工智能 ,2016)
https://www.zhihu.com/question/59182074(文中评价来自微软研究员代季峰的知乎回答)