孙剑:博观而约取,厚积而薄发
作者:2013级工科试验班学生 蒋雪莹
孙剑,1993年进入西安交通大学学习2003年毕业于西安交通大学人工智能与机器人研究所,先后获得学士、硕士、博士学位。(2019年6月更新)
“在清华读完本硕博叫‘三清’的话,那么我就是‘三交’了。”孙剑风趣的开场白,道出了他与西安交通大学10年的缘分。1993年,孙剑考入西安交通大学,2003年毕业于西安交通大学人工智能与机器人研究所,先后获得本科、硕士和博士学位,毕业后加入微软亚洲研究院至2016年。今年7月,孙剑加入旷视科技担任首席科学家(Chief Scientist)和Megvii Research负责人。2010年曾被美国权威技术期刊MIT Technology Review评选为“全球35岁以下杰出青年创新者”,拥有四十余项国际或美国专利,他和他的团队的研究成果被广泛应用在微软Windows、 Office、Azure、 Bing、 Xbox等产品中。落其实者思其树,饮其流者怀其源,今年是西安交大人机所成立30周年,孙剑身着30周年纪念衫,回到母校,为研究所献上祝福。
愈挫愈勇,砥砺前行
科研,对于孙剑来说,既是学业,也是事业。百折不挠,勇于尝试的毅力,是他在十几年的科研工作中最闪光的品质。孙剑告诉记者,在读博期间,他和大多数博士生一样,一开始非常迷茫。知识有限,创新不足,谁也不知道哪个项目是自己的“命中注定”,除了不断尝试,别无他法。硕士期间,他从事人脸检测的识别研究,博士期间钻研立体匹配,而毕业后的近五年时间,孙剑都在开展关于计算摄影学的研究。就这样,孙剑在不断地尝试中愈挫愈勇,前行不止。
2015年,孙剑带领的团队斩获了图像识别国际大赛五项冠军(ImageNet分类,检测和定位,MS COCO检测和分割)。然而,这并非一帆风顺。在视觉智能这个领域,核心技术有三部分:深度学习平台,视觉理解核心问题和关键视觉应用,而孙剑所带领团队主要的突破口,在于深度神经网络的改进。
说到深度神经网络,重点是要“深”。这个深度往往受到计算资源和训练算法的双重限制。孙剑和他的团队尝试回答一个问题:“是否越深的网络,错误率一定越低呢?”团队的实验性结果发现原来并非如此——过深的网络容易出现欠拟合等现象,反而降低了正确率。
为了解决这一问题,孙剑与他的团队从对问题的重新定义角度出发,研发出了深度残差学习的方法,解决了“网络越深,错误越多”这一矛盾。在2015年的国际大赛中,他们的“图像识别的深度残差学习”系统达到了152层的深度,而错误率仅有3.5%!要知道,普通人眼的错误率约为5.1%。
困难、瓶颈,永远与科研相伴而行。从研究生时进入西安交大人机所接触科研,到毕业后进入微软亚洲研究院,十余春秋,孙剑坚持在科研道路上。“抗击打能力很重要,因为挫折和瓶颈太多了,做每一个实验前,我们都做好失败的思想准备,但若不尝试,就注定失败。”他坚定地说。毕业十几年来,孙剑累积在CVPR、ICCV、SIGGRAPH、 PAMI等世界顶级学术会议和期刊上发表了学术论文90余篇,并于2009和2016年两次获得CVPR计算机视觉年会的最佳论文奖。
厚积薄发,“神鬼”兼并
工作时是受人敬仰的“大神”,生活中是平易近人的学长。孙剑回到母校,很多在校的研究生和博士生纷纷围上来,请教研究中遇到的难题,孙剑都十分耐心地一一解答学弟学妹们的问题。
在接受采访时,孙剑也从多年经验出发,分享了很多从事科研的心得。在寻找方向上,他建议大家可以通过观察下一个五年内,那一个领域会有巨大的应用前景来决定自己大体的研究方向。找到方向之后,就要坚持长时间的积累。科学界也遵从“一万小时定律”:成为某个领域的专家,需要投入一万小时的精力。“那么研究要出成果,就算不要一万小时,三千小时也得有吧。”孙剑说,“认准目标,不断积累,或早或晚就会取得突破。”
此外,孙剑还讲述了一套颇有意思的“神鬼”论,来诠释科研过程中研究与实践的关系。“既要做鬼,也要做神。”这句话是孙剑上学时老师讲的,他一直铭记在心。“做神”是指基础问题研究,“做鬼”是指解决实际问题 。
“神”与“鬼”,在顺序上的差异对科研有重要影响。孙剑在微软亚洲研究院时师从当时的院院长沈向洋,而他的做法是不强调那个在先。即便是“先鬼后神”:出现实际问题,先以“鬼”的做法,不求理论做出结果;而成功之后,再回到“神”的思路,反过来推理其背后的原理,往往对问题会产生全新的认识。这样的作风也极大地影响了孙剑。孙剑说,“先神后鬼”还是“先鬼后神”因人而异,但是一定要“神鬼兼顾”,只有综合经验和理论,才能在科研路上越走越远。(原文刊登于《校友之声》2017-2018第1期)