作者介绍:

8.让你的研究员经常进行辩论。让他们把别人的构想撕成碎片,确保他们之间能够坦诚交流,并观察这一过程中体现出的优势和弱点。

从不做清华第三种人到在读女博士

所以,不要总是因为自己不够优秀而郁闷,和最优秀的人在一起,你也会变得更优秀。

很多事情只有当你回顾ุ的时候,才会觉得别有滋味。就像当我被问起你是怎么เ进入微软的时候,我才会幡然感觉到เ其实与微软结缘真的是一段颇有意思的经历,曾经怀疑ທ过自己้,也曾经战胜了自己,但是,最重要的是在这个ฐ过程中我认清了自己想要是的什么。

张峥,2002年加入微软亚洲研究院多媒体组,ไ目前是微软亚洲研究院副院长,负责系统和网络研究领ๆ域。1984年就读于复旦ຆ大学电子工程系;1987๕年作为复旦大学批本科跳级的13名学生之一进入研究生课程;19๗90่年赴美国德州ะ大学达拉斯分校留学;199๗2年获硕士学位后,于199๗3年春转至伊利诺思香槟分校求学,并于19๗96年秋获得博士学位。此后,张峥一直在惠普中央实验室工作,其研究领域涉及高性能级计算机系统结构和大规模分布式系统。张峥也๣是网络杂志和的创น办人之一,以竹人”为ฦ笔名主持编辑二卷,并曾在主持及专栏。

外企风格之一就是众多用让人听起来摸不着头脑的缩写,请让我来解释一下我们的职衔。微软程序员的职衔是sde,即软件开工程师soft9aredesignengineer或者soft9๗apmentengineer。创新工ื程组的大多数组员的职衔是rsdere色aທr9eer即隶属研究部门的软件开工程师。这个多出来“r”意味着我们的任务一部分需要做sde的事情,写代码编程序,另一部分是和研究员们并肩工作,把概ฐ念和想法实现为原型系统和算法,并进一步帮助把研究成果转化为高质量的微软产品代码,这就是所谓的技术转移te9sfer。技术转移是我们组的主要任务之一,所以ttgte9sferg肉p即“技术转化组”是我们使用时间最长的组名之ใ一,即使目前仍然是是创新工ื程组的主ว要部分。

还有一个有趣的说法描述我们的工作:研工作一般叫做raທndd,“研”指的是研究部门r,re色arch,“”指的是产品开部门d,development,而rsde的位置就恰恰在那个“and”中ณ,是连接研究和开的纽带。

技术转移

每年都有不少研究技术从亚洲研究院的实验室进入到微软产品中ณ,变成产品的某个功能มfeature。作为研究院的一员,我很骄傲的是,9indo9๗sxp、vista、office、tabletp9do9slive、游戏、硬件等等微软产品中都有来自于北京海淀区知春路城铁边上的这个ฐ实验室的技术。其中研究员们的智慧是关键,其中ณ创新工程组的rsde们也是这些技术产品化的幕后英雄。很多年以前๩,人们把中关村叫成硅谷的时候,我眼中只是好多买຀电脑零配件的摊位,而现在的中关村才真正地有了一个it技术的聚集地的模样。

技术转移是一个需要时间的过程,不是像同城递那ว么快捷一个下午就到达目的地。很多大学的孵化中ณ心就是一种类型的技术转移过程。这里说说微软研究院中一个典型的软件技术转移的过程:

1研究组选研究题目。这个题目可能ม是领域内长久ื的研究方向,希望可以得到เ某些突破,或者是来自与已๐有产品的问题。

2研究员深入分析问题,设计算法,构造原型系统,收集数据,选择算法,评估结果,不断迭代尝试。

3当原型系统显示有能ม力解决问题的时候,我们开始与相关产品部门接洽技术转移。研究部ຖ门有专人负责与产品组的信息沟通。同时我们也可以得到产品组对我们结果的反馈意见。

4๒当原型算法的质量到达相当不错的阶段,产品组看过后便有了更有明确的需求。rsde开始和研究员成立一个临时的虚拟小组virtuaທlteam,有别ี于平时的管理组一起工作,进一步提升原型系统的设计和质量以达到产品组的要求,研究员、产品组的项目经理、开工ื程师๲、测试工程师一起工作,最终把算法代码实现写入到产品组的代码中去。

5๓最终产品布。到เ了这个时候,参与项目的人会得到一个石头或金属嵌玻璃的奖牌ship-ita9๗aທrd,上面写着“感谢对x产品做出的贡献——比尔?盖茨”。

这是一个相当明确的流程,而现实常常出乎意料,任何一步都不是那ว么简单,而是变数丛生、繁复无比。产品部门的要求来自与市场,通常期望值很高,可这时往往暴露了研究阶段成果的一个ฐ问题,那就是——研究成果和产品要求的差距。

不是所有的研究项目都会成功产品化,为了提高研究的效率,通常当一个算法解决了问题的主要方แ面就可以开始向产品部门推销了。当“买຀方”对算法结果基本认可并有意向集成之ใ前,会提一系列的具体要求,希望算法可以达到产品标准。很典型的要求比如是否能够能否达到เ99%以上的正确率,融入产品已有架构的容易程度,算法复杂度、实现的度、数据适应性、资源内存消耗、安全性、可靠性、等等。我们在这些方面有过不少坎坷。

第87节:研究院“and”的故事3

例如我们做人脸卡通,第一步在是用户输入正面肖像照输入后自动的配准面部ຖ五官,然后再继续后续步骤。最初的的算法在亚洲人的照片上可以工作得很好,可是产品组要求算法必须ี在世界其他国家市场上要正常工作。这就带来了新的要求,必须考虑世界上其他人种的肤色、色、眼睛鼻子大小。新า的要求导致了数据和算法上的很大改动。

当一项技术是“基本可用的”,假设它已经达到80%的产品要求,而产品的真正要求是“非常好用”,可能意味着90-99%,产品组的众多要求累็积在一起,这之间将近20%的距离往往就是生量变到เ质变的那一段。这常常意味着算法要做相当的调整和适应,甚至结构需要大修改。rsde的典型技术转移工ื作就在这20่%的一段。这个象“and”一样拧吧的阶段,我们要和研究员开会,学习๤他们的东西,出差去总部和产品组面谈,或者每天大早起床赶时间与总部开跨16个小时时区的电话会议,与产品的开测试工程师๲一起工作,共同努力让一项研究技术完美地实现用户需求。

研究是高风险的事情,能够变成真正产品的研究只是成功的极少数。很多项目就在这个阶段前不幸夭折了。长江后浪推前浪,死在沙滩上的前๩浪研究项目的数量相当可观。这个艰苦的过程,难的不光是技术,还有在长长的辛苦、烧掉无数脑细胞之后却要接受项目无຀果而终的现实。

所以每当有一个ฐ技术转移项目顺利ำ完成时我们都很兴奋。当我们收到เ一份产品组高级经理的感谢信,还有看到好久不见的同事从总部ຖ出差回来挺着腰围暴涨了一圈的肚子时,就会上前恭喜他,然后和他一起抱怨总部的中餐馆的菜真油,公司楼下的食堂pizza吃得太多了,ship-ita9aທrd奖牌的玻璃太难看了……

我们说研究院是帮助公司赚后天,甚至5年以后、10年以后的钱。从我们的经验看来,做技术转移,过程有长有短,3个月不算短,5年也不算长。这从另一方แ面验证了关于这个时间的说法所言非虚。如同任何一件事情的成功,必须努力也要有运气,是天时地利人和的结果。

技术转移过程也是一个人与人、机构与机构之间互动、互相支持和取得信任的过程。研究院成立之初做研究项目推广的时候,研究院对产品组的周期、市场定位、核心问题和希๶望、工作优先级还不太适应。相当多产品技术研究项目消耗了人力、时间却无法找到เ合适的敲门砖。随着每年逐步取得的成果转化成绩,一方面亚洲研究院渐渐得到了产品组的信任。同时研究院也逐步建立与产品部门保持同步的机制。从rsde的角度来看,随着研究院能ม力和规模的扩展,产品组的“胃口”也渐渐提高了:问题的规模不断增长,难度加大,质量需求也越来越明确。产品组更容易采纳准备充分的研究成果:合理的功能设计,相当扎实的算法结果,同时核心算法还需要通过完备的测试。这新一阶段的期望对研究员们和rsde们提出了更高的要求。迎难而上,我们没有其他选择,研究院里有一大拨视困难为ฦ乐趣的人。

说到这些人,有一个ฐ故事很有意思。研究员们和微软产品组的同事们是很不同的两类人。在一次研究院和产品组的同事都参加的微软内部培训中ณ,大家做了一次性格分析。结果显示ิ研究员中相当大比例喜欢思考、冒险、质疑权威、幻想、外向有创造力;而更倾向于喜欢动手,脚踏实地,有纪律,讲程序、保守、精确的人群中工程师们占据多数。这固然有着职责选择了人的原因,而后天的职业要求也进一步加强了双方的特点。其实两ä类人还有很多共同的东西:不满足于现状,追求卓越。

微软对联

为了让研究更上一层楼ä,从2007年起,创新工程组的项ำ目中增加了一个新的重点,我们把这叫做“部署驱动的研究”deployment-drivenre色aທrch,讲起来有些拗口,简言之就是帮助研究员们把研究项目直接做到เ9eb上去。在搜索ิ、9eb20应用越来越兴旺的时代,研究也要和最终用户直接接轨,可以接触到第一手的信息。

第88节:研究院“aທnd”的故事4

经过自然语言组和创新工程组的共同努力,微软对联20赶在2008春节前๩给大家带来了新春的祝福。在短短几天内,微软对联的访问量出大家预料,国内海外的中国人都试用了这个极具中国特色的对联工具。而用户的热情参与,为我们后续的中文的自然语言研究了很有帮助的数据。

这里和大家分享有一些在对联布之后有趣的现:

1三天之内,天下皆知,通过社ุ区的信息传播度令人惊讶。本来对联是很低调的,我们本希๶望该系统慢慢被人所知,但是访问量的猛增和各大上的热帖让它在三天之ใ内成为了一个热点。

2海外华人高度热情。我们的记录显示来自海外的访问量不可小视。由á于对联应用的特殊性,不大可能ม是大量的外国人使用。我们未曾预料能够为ฦ如此之多的海外中国人服务,这很让我们高兴。

3年节前后,流量升降。在春节和元宵节前,有更多人使用它。而进入长假后,流量陡降,大家都在走亲访友吧。

4有非常多的对联相当的有趣,而且很多和时事贴近。大众的创造力真是无穷啊。

对联项目大大鼓舞了我们继续这个方向的信心。可以乐่观地预计,在未来研究院会有更多更好的研究项目为大家设计和使用。

回八年,我深深庆幸在这个热火朝天的地方开始了我的职业生涯,能够与那么多聪慧、真诚、热情、执着的同事们共同奋斗。作为ฦ一个ฐ开工程师,让我很兴奋的是我们一直在做真正“前沿”的东西。在研究院成立十年之际,我深刻感受到研究院仍然在最初ม的想道路上奔跑,而我会继续和研究院一起成为这想的一部分。

作者介绍:

陈刚,1993年进入北京科技大学计算机系,2๐000毕业获硕士学位,同年加入微软亚洲研究院从事研究技术到产品的转化开工ื作。现任微软亚洲研究院创น新工程中心开经理,他的工ื作着重于研究成果到商业产品的转化,其中包括inter应用、图形图像应用,研基础系统,以及研究院软件工程优化。在业余时间,他非常喜欢爬山和摄影,而摄影这个爱好对他参与的研究项目也很有帮助。

第89๗节:“掌上”视频拉近你我的距离1้

“掌上”视频拉近你我的距离

作者:李江

20่04年6月,美国知名的学术杂志麻省理工学院《技术评论》在当月的封面赫然放上了“微软肖像”的巨เ幅图片,并且把微软亚洲研究院誉为“世界上最火的计算机实验室”。作为被编辑有幸挑选出来成为最能代表研究院创น新成果的技术,“微软肖像”随着杂志的甫一付梓,越来越多地受到了全世界计算机学术界和工业界ศ的关注。它也๣让更多的读者相信在科幻作品中虚构出来的那ว些移动视频通信技术终于可以在现实生活中看到端倪了。

2๐004年6月,麻省理工学院《技术评论》以“掌上视频”为封面照ั片,用六页的篇幅全方แ位报道了微软亚洲研究院的历史和成果

n多双眼睛的集合

如今,随着手机功能的日຅益强大,通过手机拍照或者录制一段视频已๐经屡见不鲜了,可是,通过手机进行实时视频通信却仍然没有普及。早在2๐001年,由微软亚洲研究院多媒体通信组研出的“微软肖像”软件,就已๐经较为ฦ逼真地实现了双向交流的实时视频通信。这一技术不仅可以支持个人电脑、掌上电å脑、手持电å脑แ等设备,而且可以运行于局域网、拨号网络,甚至带宽为9๗6千比特秒的无线网络。特别值得一提的是,这项技术还具有自适应性。如果用户只有低带宽网络,微软肖像就会传送黑白视频;而如果用户拥有较高的宽带的话,则可以传送真彩色的视频๗。在低带宽时,相比传统的视频技术而言,肖像视频能ม够更清晰的轮廓、更流畅ม的运动,并且具有更短的延时以及更低的计算消耗。“微软肖像”是我在微软亚洲研究院参与过的第一个重要项目,也是持续时间最长的项目之一。

从2001年8๖月1้8日“微软肖像”第一个版本的诞生,我们组就把这个技术上传在微软研究院网站上供用户自由下载。令我们感到เ意外的是,虽然这还是比较稚嫩的第一个版本,但是用户对它的反响还是很不错的。因为随着掌上电å脑在当时的问世,很多用户也很想在上面看看通话状态的对方是什么样子,而之前从来没有这样一种软件出现过,所以,有段时间,大概有几万用户下载试用了我们的软件,使得“微软肖像”成为了微软研究院网站上下载量最大的软件之一。

很多用户在下载了我们的产品后,非常巧妙地将这项技术应用在了日常生活或者工ื作环境中ณ,给他们的生活与工作带来了很大的便利ำ,于是他们也纷纷通过网上留言的形式把这些新奇的用法分享给了我们团队。

我印象比较深的是两个外国朋友对这项技术独具匠心的使用故事。john是一位新生儿的父亲,当周末妻子出去购物,留แ下他和孩子两个人在家的时候,他时常为寸步不能离开孩子而烦恼。当他从网上下载了“微软肖像”之后,他在婴儿床前按了一台摄像头。于是他可以带着掌上电脑แ随心所欲地在房子的每个角落活动,通过视频观察孩子的一举一动,他甚至还能放心地在院子里除草,而这往往是周末最占用他时间的一项劳动了。

peter是一家医院的见习๤医生,经常会轮到晚上值班巡视病房的差ๆ事。可是因为ฦ住院病人多,医生少的缘故,很多生突情况的病人往往无法得到及时的救护。于是,当他拥有了“微软肖像”技术之后,他在巡视某一个病房的时候,也๣可以通过掌上电脑看到安在其他病人床前的摄像镜头做的情况。他可以在移动中实时“观察”每个病人,一有紧急情况便可以跑过去处理或者通知其他医护人员。peter说有了“微软肖像”,就像有了n多双眼睛同时在帮他巡ำ视病房。

上面的主人公只是很多用户中的两位。他们对这项技术的认可和别出心裁的应用也极大鼓舞了我们对“微软肖像”不断改进的信心。直到2007年5月20่日຅,我们组推出了最近也是最新一款试用版本为ฦ止,细数下来,“微软肖像”前前后后经历了20่个版本的更新和改进。在这八年中,“微软肖像”项ำ目也经历了一段曲折的展历程。

难题迎刃而解

退回去想想,也许你很难想象2000年时9๗6千比特秒的手机网络的带宽能做些什么?可是,就在当时网络带宽较低的情况下,我们便在捉摸:如何实现移动设备的可视通信呢?显然用传统的彩色视频技术是实现不了的,因为彩色视频๗对传输度和网络带宽的要求都比较高。96๔千比特秒的带宽就把这个可能给否决了。另外,既ຂ然是手机,cນpu的处理能力就不如台式计算机那ว样强大,所以本来在台式计算机上运用的视频๗压缩和解码技术就不能被照搬到手机上。我们就要对压缩和解码算法进行一些简化,才能最终运用到手机上。在综合考虑上述两ä种条件的基础上,我们开始了“微软肖像”的研究。

当时,在跟我们的研究主管、视觉计算领ๆ域的专家沈向洋博士讨论中,我们认识到:既然,视频压缩技术已๐经相当成熟,想要从这方面寻求突破几乎不大可能,那ว么是否可以结合视觉技术从数据本身来寻求解决呢?要进行实时通讯,使得你讲话的意思能ม够被对方了解,除了语音之ใ外,表情也很重要。那么表情怎么来传递,我们就想到เ了用线条的方แ法来传递,想着用线条的方式带宽是不是就可以占用得少一些。

当时我们注意到,在实时视频通信中,人们对图像的要求,并不像在定睛观看一幅图画时那么高。人们不太注意形象,而更注重表情;不太注意细节纹理,而更注意整体轮廓。从这个ฐ意义上而言,在视频通信中,通话者大脑真正感兴趣的有效信息并不多,所以通过提取通话者的表情轮廓和线条等简单信息,就可以有效表达一帧视频的绝大部ຖ分内容。如果只压缩和传输这部分用线条表示的信息,将会大大降低计算和通信的负荷。

静态“素描”一帧的线条虽然看上去依稀可辨,但是如果要实现由静至动,让多帧静态“素描”连续动起来,就会出现很多问题。先,在光线强度常易变化等条件的影响下,两帧之ใ间的过渡非常不平稳、闪烁不定。另外,用线条表示出的通话者头,因为其迹覆盖处没有黑色填充而显得非常的不自然。在这种情况下,我们研究组就想到用“二值视频”技术来解决这两ä个问题:在0-2๐56之间确定一个ฐ亮度的阈值,图像像素า灰度值高于该值则为白,低于该值则为黑。非黑即白一般用1和0表示。这种技术不只区分出了线条,而且内部什么地方是白,什么地方是黑,都可以填充进去,这样头的问题就解决了。

第9๗0节:“掌上”视频拉近你我的距离2

“二值视频”技术大大降低了视频๗的原始数据量,而且传输中的连贯性较好,可是其间产生的噪声还是比较多。后来我们又想了一个更为巧妙的办法,这也是“微软肖像”中的核心技术:在区分黑白的时候,不是设定一个单一的阈值来比较,而是设定一个阈值带来比较。阈值带有一定的宽度范围。如果图像像素า的灰度值在这个阈值带的上限以上,我们能够很明确地说它是1้;如果在它的下限以下,我们也可以很明确地说它是0่。但是如果图像像素的灰度值处于这个阈值带之内怎么เ办呢?我们的处理办法是根据它同一帧内周围的像素和它前一帧相应点周围像素า的情况来确定。简单地讲,比如前๩一帧该点位置是黑的,这一帧该点位置也就是黑的。这样两帧播放起来就连贯了。根据这个ฐ原理当时,还是实习生,现在已๐经是副研究员的许继征给出了相应的算术编码解法。

填补学术界空白

总的来说,我们组投入了较大的精力于“二值视频๗”技术的摸索和创น新,也通过一系列ต的开创性研究填补了学术界的空白,而且始终居于世界领先地位。同时,我们还创立了一种新า型的视频形态——“二值视频”。

大家知道,国际上静态的彩色图像有jpeg图像,动态的彩色视频๗有mpeg视频,静态的黑白二值图像有j逼g图像,而我们创立的可称为动态的黑白“二值视频”。后来,在“二值视频๗”的基础上,我们又进一步推出了“四值视频”与此同时,随着带宽条件的不断改善,我们也试着用“第二条腿”走路——在确定了黑白版的微软肖像视频的基础上,我们组又开始向“彩色版”挺进。

从黑白版的“二值视频”到เ“四值视频”,再到彩色视频,随着对传输度和带宽要求的递增,“微软肖像”为用户了可以满足不同网络条件而可供选择的软件类型。这三种技术从视频的效果来看,应该说已๐经包含了所有的功能。近一两年中,我们所做的工ื作主要是为增强这个可视通信软件的一些其他辅助功能ม,比如能够更多地支持不同类型的摄像头,能ม够增强连接性,或者拍张照片,可以传送文件等。

“微软肖像”软件是很多人团结协作的成果。当时是软件工ื程师๲,现在是开主管的陈刚,编译出了第一个可运行的软件版本。其后又有余可曼、唐健、和林庆维接手这个软件的制ๆ作。很多访问学生如周涵宁、王勇、王凯波、王利ำ杰、贺铁林、林云峰、吕江波等都对算法等各方面的研究做出了贡献。当时的研究主管沈向洋博士、李世鹏博士、张亚勤博士等对这个项目给予了大力支持。

虽然目前“微软肖像”还没有被正式运用到微软的产品中ณ,但是这项技术却通过各种各样讨论掌上电脑แ和手机的社区网站不断被世人认识,并通过资源共享真正让用户体验到其中的交互乐趣。200่1年,“微软肖像”技术在国际多媒体大会上向国际学术界ศ宣布它的诞生。同年8๖月8日,当usatodaທy《今日美国》的记者第一次通过媒体的声音公开向全世界ศ读者介绍“微软肖像”的时候,我们从来没有想象过这项技术会受到如此的青睐和好评。后来随着包括《麻省理工学院技术评论》等重量级媒体对这项技术的报道和千千万万热心用户对我们软件的反馈之后,我们坚信了”做真正满足用户需要的产品才是创น新研究的根本”这一信条。我想这也是我们从事计算机基础的研究工作者应该谨记的信条。

作者介绍:

李江,19๗99年1月加入微软亚洲研究院任研究员,2๐004年任多媒体通信组主任研究员。之前他曾任浙江大学物理系副教授。他于198๖9年获清华大学物理系学士学位,19๗92年获浙江大学物理系光学硕士学位,1988年获浙江大学数学系应用数学博士学位。他做研究项ำ目看重对人的意义แ和潜在的商业模式,做事讲究简单有条理,平时爱看书、看电影及外出旅๓游。

第91节:让语音技术改变人们的生活

让语音技术改变人们的生活

作者:余鹏

在msra的办公区墙上,贴着比尔?盖茨曾经说过的一段话:“每天清晨当你醒来的时候,都会为技术进步给人类生活带来的展和改进而激动不已。”这句话也诠释了msra这1้0年来成就的动力源泉――用技术改变人们的生活。

我在清华大学的博士课题是语音识别,毕业后进入msra的语音组。语音技术经过多年的展取得了长足的进步,但是在应用领域,却面临着一个尴尬的局面:一些在实验室的理想环境下表现完美的技术,很难找到现实的应用;而在现实生活中,目前语音技术的稳健性和适应性却又达不到应用场景的需求标准。