这是本博客的第一篇翻译文档,笔者已经苦逼的竭尽全力的在翻译了,但无奈英语水平也是很有限,不对或者不妥当不准确的地方必然会有,还恳请大家留言或者邮件我以批评指正,我会虚心接受。谢谢大家。
原文网址:https://msdn.microsoft.com/en-us/library/dn782041.aspx
2014年10月由微软发布的Kinect for Windows 2.0 SDK中包含如下文所述的新特性、新工具以及新文档。
本次发布的改进:
1、Windows应用商店的支持
通过此版本的Kinect for Windows,你可以针对Windows商店开发并发布Kinect应用程序。我们看到开发者所创造的东西,一定会异常的兴奋。除了语音外,所有的Kinect传感器和其SDK的功能在此应用程序接口上都是有效可用的。想要查看关于使用Kinect开发的Windows商店应用的更多信息,请点击:http://go.microsoft.com/fwlink/?LinkId=517592
2、Unity的支持
这是有史以来第一次,Kinect的API通过一个Unity的Package文件可以被应用到Unity专业版的开发中。我们很兴奋,可以将这样的平台提供给我们的开发者。Kinect for Windows的API核心功能,可视化手势构建器和面部识别可以在Unity的应用中被调用。Unity插件可以点击右侧网址下载:http://go.microsoft.com/fwlink/?LinkID=513177
3、.Net APIs
对于此类API,很多过去从事工作与托管API有关联的开发者应该觉得熟悉。我们知道这是我们能够获得的最快的开发环境之一,并且很多正在发展的商店在这一领域现在拥有许多的资本投入。Kinect和其传感器的所有功能都可以在此API中被应用。
4、Native APIs(原生API)
注:Native API是指以二进制方式,函式库(DLL)直接开放的应用程式开发接口,可以直接由C/C++来呼叫存取使用。
许多Kinect应用程序需要玩家像在写原生C++代码一样火力全开。我们很高兴能够分享Kinect原生API的这种迭代方法。这类API的形式和结构与托管API集合相同,但它允许开发者的程序能够达到C++代码运行的最大速度。这类API和v1.x版本的Native APIs有很大的不同,他们更容易被用户去使用。Kinect和其SDK的所有功能都可以在此API中被应用。
5、音频
Kinect和SDK提供了麦克风阵列技术和信号处理技术最好的成果——虚拟的、基于硬件的高指向性的麦克风,它可以识别出声源的方向。另外,对于输入的语音,Kinect提供了高质量的语音识别。
6、面部APIs
从v1版本的SDK延伸扩展了很多,面部APIs提供了丰富功能来适应面部的各种情况。在面部APIs中,开发者能够以传感器的视角来侦测面部,校准为5个单独的面部标识,并且实时的跟踪方向。高清的面部识别技术将每张脸分为94个单独的形态单元,来创建一个和用户高度相似的脸部网格模型。这个网格模型能够被实施跟踪,来体现用户丰富的面部肌肉运动以及富有表达性的表情。
7、手部姿势指针的支持
如果你想要通过手部的姿势指示操控你的应用程序,Kinect for Windows v2已经针对这点做出了改进。可以通过SDK中自带的例子来了解怎样使用手部指示来功能化你的应用程序,新版本的SDK增加了手部关节的骨骼节点识别。
8、Kinect Fusion
注:Kinect Fusion技术在支持GPU加速的机器上能够对物体进行实时的三维建模。
通过Kinect for Windows的新版本,你可以建立和部署Kinect Fusion类的应用程序。相比于1.x版本的Kinect Fusion,我们提供了更高的分辨率,更好的摄像头追踪和性能。
9、Kinect Studio
Kinect Studio从v1时代就已经开始了重大的修改,目的是为了能够hold住新的传感器并且为用户提供更好的定制体验服务和控制感。新的用户接口在不同的工作区域和用户模式提供了更大的灵活性。比如说,现在可以比较两个并行的2D或者3D视图,或者建立一个一种默认的布局来满足自己的需要。监测,记录,重放数据流的分离,为我们提供了更多的功能,比如文档级和流级的元数据。
时间线功能:输入点和输出点来控制播放重放功能中的哪一部分;暂停点,可以让你在多处设置想要暂停(悬挂)的点;标记点,可以让你及时的附加元数据给不同的点。这种时间线的预览也会体现出循环播放和额外的2D/3D可视化设置。
10、Visual Gesture Builder(预览版)
引入visual Gesture Builder(视觉姿势生成器),使用机器学习和身体帧数据来定义一个姿势。众多的身体数据被与姿势相关的元数据标记,这些元数据会被机器学习装置在姿势生成阶段应用以从身体数据中提取一个姿势定义。
姿势定义可以在随后的姿势检测运行的时候被应用,也就是被你的应用程序调用,来检测一个或多个姿势。然而在姿势检测的时候应用机器学习是不适合心脏虚弱的人的,我们提供了一种快速建原型的途径。使用Vgbview,你可以不通过任何写代码的操作就标准化你的姿势定义。有关详细的演示视频和VGB使用白皮书,请参见:https://social.msdn.microsoft.com/Forums/en-US/02e0302a-e3bd-46d3-9146-0dacd11d2a8d/deep-dive-videos-and-whitepaper-for-visual-gesture-builder?forum=kinectv2sdk
11、样本
通过SDKBrowser,我们可以获得一个广泛的样本,包含一系列的框架和语言。
- Audio Basics-(D2D, WPF)
- Audio Basics (IStream) -D2D
- Audio Capture-Console (Raw)
- Body Basics-(D2D, HTML, WPF, XAML)
- Color Basics-(D2D, HTML, WPF, XAML)
- Controls Basics-(DX, WPF, XAML)
- Coordinate Mapping Basics (D2D, HTML, WPF, XAML)
- Depth Basics (D2D, HTML, WPF, XAML)
- Discrete Gesture Basics (WPF)
- Face Basics (D2D, HTML, WPF)
- HD Face Basics (WPF, XAML, XAML-CPP)
- Infrared Basics (D2D, HTML, WPF, XAML)
- Kinect Fusion Basics (D2D)
- Kinect Fusion Explorer (D2D, WPF)
- Speech Basics (D2D, WPF)