[窥探未来的时光机] 时光机能发明出来吗

时间：2019-02-10 来源：东星资源网本文已影响人手机版

　　3月6日，一年一度的微软技术节（TechFest 2012）在微软位于美国雷德蒙的总部举办，来自世界各地微软研究院的研究员带来了最新的研发成果，向我们展示了科技的美好未来。
　　
　　每年举办的TechFest是微软研究院面向微软内部举办的技术节，该技术节始于2001年，被誉为“计算机研究领域盛宴”。作为微软研究院年度最大的活动，来自全球6大研究院的研究员们都会聚集到微软总部，展示包括内部研究以及外部开放合作的创新成果。在这个像市集一样的场所，微软产品部门的员工能够与研究员进行充分地沟通和交流，零距离接触各种最新技术，寻找合作契机以将研究院领先的技术应用到微软的产品中。
　　可以说在微软发布的每一款产品中几乎都有微软研究院的烙印，微软研究院的研究成果已经融入到几乎所有的微软产品之中，任何一款微软的产品，不是含有来自微软研究院的技术，就是基于微软研究院的核心技术制造而成。它们对微软整个产品线的影响都是巨大的。今年的TechFest围绕“融合虚拟与现实”（Blending Virtual and Physical）和“大数据有大智慧”（Profound Insights from Big Data）两大主题展开，重点介绍微软研究院在自然用户界面（NUI）以及大数据处理方面的研究成果，共有155项来自微软研究院全球各机构的最新研究成果在为期3天的活动上亮相。
　　TechFest 2012上展示的技术正在向我们表明，计算机开始具备更多像人一样的认知能力，能够更好地观察、倾听和感受用户的一举一动、一颦一笑。现实世界与虚拟世界正面临融合的拐点，计算将变为生活中自然且不可分割的一部分，从而带来无限创造力、新体验和可能性。而针对海量大数据进行更智能处理的技术，也正在为我们营造全新的信息和服务、沟通和协作方式。TechFest 2012使我们仿佛置身于驶往未来的时光机之中，思考技术的未来。
　　
　　未来摄像头
　　Gesture Recognition with Next Generation Webcam
　　Kinect无疑是近几年最具创意的人机交互技术，它为Xbox360的用户带来了前所未有的游戏体验，更令人振奋的是Kinect for Windows SDK的推出，为Kinect应用到计算机上提供了可能。
　　而微软亚洲研究院在TechFest 2012上展示的下一代网络摄像头技术中的一项是精度更高的深度摄像头，该摄像头借助红外技术生成深度信息，能在30cm~50cm的距离内工作，能够获得大约640×480的高精度深度信息，借助这些数据和Kinect原有的算法，PC能够生成现实物体更加精细的3D模型，用户也能够实现更精细的手势控制。
　　在体积上，新的深度信息摄像头与目前普通的摄像头尺寸相仿，在结构上它也没有采用过多特殊部件。因此可以预计，这样的产品在面世后，在售价方面也不会比现有的Kinect高多少。
　　
　　一年一部阿凡达
　　High Fidelity Facial Animation Capturing
　　詹姆斯?卡梅隆历时4年才拍摄出了科幻巨作《阿凡达》，该片将计算机特效的制作水平推向了全新的高度，其中为了让阿凡达们的面部表情更加自然，影片的特效师们使用了十分复杂的面部跟踪技术，并耗费了大量的时间制作人物的各种表情。而如果他们拥有微软亚洲研究院的高保真面部动画捕捉技术的话，就会大大降低特效制作成本并缩短制作时间，甚至一年做出一部阿凡达都不成问题。
　　这项技术将高精度面部3D扫描技术与面部表情分析、动作预测技术相结合，能够让计算机自动生成虚拟的高精度3D面部和各种表情。该技术首先利用高精度3D扫描仪对人脸的某几种表情进行高精度扫描，获得包含极高精度、细节的3D面部，类似动画中的“关键帧”，接下来在人脸上标注关键特征点，并拍摄该面部的各种表情，通过分区域分析每组特征点的运动规律，获得这个人表情的变化规律。最后将这些特征点的运动规律与之前获取的高精度3D“关键帧”相对应，即可让这些高精度表情按照真实用户的表情规律“动”起来。之后3D虚拟面部的各种表情就都可以由PC自动生成了。
　　
　　街景车“下岗”
　　Automatic Building Parsing in Urban Areas
　　CHIP曾不止一次地介绍微软亚洲研究院基于高维图像算法研发的图像处理技术，这一技术能让PC看“懂”图片，简而言之就是让PC不再只会寻找相似像素区域，而是懂得图片中这里是桌子、那里是窗户。而在TechFest 2012上我们再次看到了研究员们基于这一技术开发的图像分析技术的演进版本。
　　这一技术被称为城市地区建筑物自动解析，该技术能够自动分析并找出图像或视频中的建筑物表面，并根据这种2D的图像数据自动生成建筑物的3D结构。该技术除了能对建筑物进行定位之外，还可以在不依赖人工干预的情况下计算每个建筑物表面的几何形状、位置和方向。换句话说，就是我们通过给PC输入一个固定角度的2D图像，计算机就能够绘制出这个图像中每个建筑物的3D图像，而且建筑物中相互被遮挡的部分也能够自动补全，这样我们就能够从各个角度观看这一区域的建筑物。这一技术一旦成熟，我们将不再需要借助3D街景车辛苦地巡街才能生成整个城市的3D街景，也许几张高精度2D照片就能够让我们获得整个城市的立体模型。
　　
　　换个角度看历史
　　Chronozoom
　　历史信息往往需要在图书馆以及互联网中进行手动整理，对于从事历史教育、学习的人来说，这会占据大量时间。而Chronozoom提供了一种图像化的类似时间轴方式的历史数据整理方式，这个系统采用数据虚拟化技术，在一个云计算平台上汇聚了137亿年间关于宇宙、地球、生命以及人类的历史。我们可以用缩放的方式快速地在一年至数十亿年的界面间转换，系统会自动汇集选中时间段的数据信息，并自动根据信息的重要程度进行有选择的罗列。而且Chronozoom提供的是一个富媒体集，包括音频、视频、文字、PDF文件、图表、图形等数据。另外其允许不同用户根据需要定制功能，使得教授、老师和研究人员能够分享各自的工作。
　　
　　翻译的群策群力
　　Machine Translator Hub
　　基于PC的翻译系统通常都是由技术专家设计和维护的，而基于微软Machine Translator Hub技术的微软翻译定制版（MTCE）则采用了新颖的设计理念，即人人为我、我为人人。这一系统基于目前常见的采用统计技术的翻译模型，提供基本的词义翻译等数据，之后其面向语言工作者开放了一个平台，用户能够向这个平台上传自己翻译的某段文字的双语内容，系统能够自动给出两种语言翻译的对照效果，随着这两种语言对应翻译内容的增多，翻译系统会根据这些翻译内容进行自动升级和更新，以让翻译结果更加准确。
　　另外，用户在上传翻译内容时还可以选择所翻译内容的类别，如科技或医学，以保证翻译数据的精准性。这一产品能够有助于保持非主流语言的活力和生命力，用户也可以借助这个平台构建和部署定制化的翻译模型或使用微软翻译API及网页小工具来获取这一翻译平台的服务。
　　
　　气候趋势分析
　　FetchClimate
　　FetchClimate是一个能够分析和显示全球气候变化的系统，它能够提供智能的气候数据检索服务。这个系统收集了来自全球各个气象服务系统的数据，时间涵盖自1900年至2010年。用户可以手动选择地图上的某个区域以及气候变化的时间段，之后还可以设置选定区域气候信息的精细度，例如我们可以将选定区域细分成100个甚至1000个子区域，每个子区域的气温趋势会以颜色来表明。这一系统基于Azure平台搭建，它最大的特点在于不仅可以显示所有具备气候历史记录数据地区的信息，在一些历史数据不完善区域，这一系统还能够根据区域所在的经纬度、地理环境的周边特征生成模拟的气候数据。这一特性对于那些需要在特殊区域进行气候研究的学者来说十分实用。
　　
　　当虚拟“撞到”现实
　　Beamatron
　　Kinect及深度信息的应用，让虚拟世界中的物体能够与现实中的物体发生交互。TechFest 2012上展示的Beamatron模型将投影机与Kinect整合在一个运动的云台上，投影机投射出来的虚拟汽车可以用无线手柄进行遥控并在现实房间的地板上行驶，当虚拟汽车碰到现实中的障碍物，如斜坡，甚至伸到画面中的一只脚时，小车的投影图像会发生相应的倾斜或偏转，就像真地碰到这个障碍物一样。这是因为Kinect所提供的深度信息事实上让PC“看”到了现实房间地板上的凹凸变化，当虚拟的小车行驶到这些有凹凸变化的区域时投影机就会投射出不同样子的小车图案，就好像这个小车真的碰到了某个障碍物一样。将这一技术与3D显示技术配合，从特定角度观看时用户将获得更加真实的画面效果。
　　
　　“懂事”的投影
　　Wearable Multitouch Projector
　　Kinect与投影机结合能够实现很多独特的应用，例如将微型投影机与Kinect相结合而设计的可穿着的多点触控交互应用。
　　这一应用将一个微型投影机和一个小型化的Kinect捆绑在一起，架在用户的肩上。用户在这个设备面前举起任何平面，如一本杂志甚至手掌，投影机即可在上面投射出画面，而且这个画面是支持多点触摸的，用户用手指在上面可以随意点击或滑动。
　　这款设备在使用之前无需校准，用户只需将投影面举到Kinect前面，即可轻松启动系统。不过真正精彩的地方在于，Kinect的介入能够让投影机更好地适应投影平面，Kinect能够提供面前投影平面的深度信息。比如投影机面前是一个手掌时，Kinect能够将手掌的轮廓反馈给系统，系统就可以控制投影机只将画面投射在手掌中能够平整显示画面的位置上，而不会投到手指上。类似地，当投影机面前的平面是倾斜的时候，投影机也会自动进行梯形校正，保证最终画面的观看效果。
　　
　　关于微软研究院
　　微软研究院创建于20年前的1991年9月，致力于从事计算机科学、软件工程基础和应用研究。它成立时整个微软也只有几千名员工，销售额刚刚跨过10亿美元。因此，能在当时做出决定建立一个从事基础研究的机构实属不易。
　　现在，微软研究院已经是计算机科学领域最大的基础研究机构之一，已经在全球6个地方建立从事基础研究的研究院，包括位于美国雷德蒙的微软雷德蒙研究院、位于美国马萨诸塞州剑桥镇的微软新英格兰研究院、位于美国加州山景城的微软硅谷研究院、位于英国剑桥的微软剑桥研究院，位于中国北京的微软亚洲研究院以及位于印度班加罗尔的微软印度研究院。除以上研究院外，微软研究院还在埃及的开罗微软创新中心、德国亚琛的欧洲微软创新中心、雷德蒙的FUSE实验室、雷蒙德的微软研究院学术合作部和the eXtreme Computing Group开展研究工作。
　　微软研究院拥有850多名具有博士学位的研究员，它吸收这些计算机科学领域最聪明的大脑，并让他们基于自己特有的天赋和研究兴趣开展研究，因此微软研究院所涉及的领域不仅限于传统的计算机科学，也延伸到融入计算机科学的其他领域，例如生物学、化学、物理以及环境科学。
　　从计算机科学基础研究论文发表上看，微软研究院已经成为全球第一大机构，其获得的最佳论文奖比世界上任何其他机构都要多。作为全球性质的研究机构，其还与世界各地的大学、研究实验室、政府以及其他公司展开合作。
　　
　　声音
　　我们之所以成为一个全球性的机构，原因之一就是我们从世界各地聘请到最好和最聪明的人。其实我并不直接投资于具体的研究项目，也不直接投资于特定的领域，而是投资于人才。只要有可能，我们总会尝试聘请最好和最聪明的人，因为这才能真正推动长期研究的发展，才能真正带来对公司至关重要的创新和突破。
　　――里克?雷斯特博士
　　微软公司首席研究官
　　作为微软在海外最大的基础研究机构，微软亚洲研究院始终坚持通过技术创新推动整个计算机科学领域的发展，并帮助改善人们的计算体验。我们希望能有更多微软亚洲研究院的创新成果转化到微软产品中，加速实现这些激动人心的计算体验。
　　――洪小文博士
　　微软亚洲研究院院长
　　非常高兴能在2012微软技术节上见到如此之多令人振奋的技术演示，它们在大数据和自然人机交互领域的巨大应用潜力更是让我印象深刻。本次技术节让我看到了微软运用基础研究成果解决实际难题的努力，涉及教育、医疗、交通等与生活息息相关的众多领域。多年来，微软亚洲研究院对中国计算机学会和清华大学给予了大力的支持，双方在人才培养、学术交流等多个方面有着广泛而深入的合作，希望未来双方能继续加强合作与交流，共同开创计算机科学领域的新疆界。
　　――郑纬民
　　清华大学教授、中国计算机学会理事长

标签：窥探时光未来

[窥探未来的时光机] 时光机能发明出来吗

文章分类

最新发表