已尽科学研究 (ID:Weijin_Research),作者:已尽科学研究,书名副标题:《当AGI界忙着发学术论文时,苹果公司拿起了两个Vision Pro》,宋军兵来自:Kunming
增强现实生活、VR生活、现实生活间的丝滑转换。萤幕浮在此刻的现实生活内部空间。
不是与现实生活阻隔的沉浸于,而是各种现实生活相得益彰的沉浸于。老年、SNS、自然,情景间能即时调整。
苹果公司历史上,如果缺少在界面上的创新,极难称为“颠覆性商品”。从1980二十世纪起在笔记型电脑上的GUI(滑鼠),到2000二十世纪起的智能机的多滑鼠控(手掌),到2020二十世纪的互(声音、表情符号、表情)。接下去需要想像力和预估了。
坎贝尔称作内部空间排序(spatial computing)黄金时代。内部空间排序的下一步棋,应该是矽谷晚期控制技术先驱者们所断言的基本概念排序(ubiquitous computing)。
今年底,美国顾客们火速侧发力Vision Pro时,应用领域将有梦工厂,也有word 和excel,这样人们在组织工作和影视娱乐时,能转换自己所处到情景,尤其是在组织工作时,实现真正愿意沉浸于其中的办公设备内部空间。
设计充满著奇幻感,但是毛蕊极权主义式的。显示出个人对设备的控制,人对电脑的主导力量。
直面AI的作假考验,苹果公司面世了更安全的成像身分辨识控制技术 。在Deep Fake黄金时代,微生物物征的要求也越来越深,靠脸没用了,要靠扫描器可见光黄斑。
苹果公司面世了两个visionOS和两个新开业的应用领域零售店。iPhone和iPad的应用领域,在Vision Pro上都能原生植物使用。未来会有更多专门针对特别针对Vision Pro开发的应用领域,例如3DRamanathapuram等。
商品取向,科学研究主脑
当人们兴奋地谈论着各种AI控制技术概念、科技界争先恐后地发各种学术论文时,苹果公司已经不动声色地把商品和体验都做出来了。好的控制技术是无感的。
苹果公司不谈AI,而是把它们统统变成了有用户体验的商品。例如Journal,可能会让许多果粉转用苹果公司的智能笔记——它已经带有本地化的电脑学习功能。
作为苹果公司生态的新成员,visionOS自然也能与其他设备联动。Vision Pro的萤幕能变成Mac的显示屏,在虚拟世界拥有多块大屏高效地组织工作。进行长文编辑之类的复杂输入操作时,也能用回键盘、滑鼠等蓝牙设备。
只有润物细无声,才能万物皆备于我。
这给许多人上了一课,包括一直盼望苹果公司“XR”商品的英伟达AI科学家Jim Fan。
Apple Vision Pro 终于成功地让 AR 成为了主流。
我对用户体验印象深刻:没有控制器,只需用手掌操作。苹果公司训练了最佳表情符号辨识模型——可能比我看过的任何最先进的科学研究学术论文都要好。它需要对手掌进行超精细跟踪,能够在各种室内光照、手部姿势和遮挡情况下稳定组织工作。
调节旋钮能控制真实世界和完全沉浸于式VR生活间的插值,从而阻挡视线。这是一种很酷的物理方式来调节线性混合系数。
EyeSight是两个很好的SNS功能:它能够辨识周围的人类,并在必要时打断沉浸于感。
在排序方面:双芯片设计,M2 + R1。R1 从 12 个摄像头、5 个传感器和 6 个麦克风接收输入。它消除了延迟,并快速传输显示内容,以避免晕动病。
人物形象:扫描器你的脸部并重建出神经化身。
我认为 Apple 有两个非常强大的视觉基础模型团队(“VisionOS”),他们保持低调。
虚拟实境U31KI48JG?
在苹果公司担任过神经控制技术原型科学研究员的Sterling Crispin,2021年前参与了 Vision Pro相关控制技术的开发三年多,他称Vision Pro 为AR/VR“整个行业发展的巅峰之作”。他还在推特上透露了一些控制技术细节:
我在苹果公司所做的组织工作涵盖了 Vision Pro 的基础开发、正念体验、▇▇▇▇▇▇商品以及与神经控制技术相关的更有雄心的前沿科学研究,例如预估你在点击某个内容之前的行为,基本上是心灵读取。
具体来说,我为 Vision Pro 的▇▇▇▇▇▇项目的初步愿景、战略和方向做出了贡献。我在一个小团队中的组织工作帮助推动了该商品类别的启动,我认为它可能在未来对全球产生重大影响。
Crispin在苹果公司的大部分组织工作都受到保密协议的约束,涉及了广泛的主题和方法。但是,通过专利,一些组织工作已经公开。以下是他能引用和改述的专利内容。
总体而言,我所做的组织工作很大一部分涉及通过用户在沉浸于式体验中的身体和脑部数据来检测用户的心理状态。
用户处于混合现实生活或VR生活体验中,AI模型尝试预估你是否感到好奇、思维漫游、害怕、注意力集中、记起过去的经历或其他认知状态。这些能通过眼动追踪、脑部电活动、心脏跳动和节奏、肌肉活动、大脑中的血液密度、血压、皮肤电导等测量数据来推断。
为了实现具体的预估,我们使用了很多技巧。其中最酷的结果之一是在用户实际点击之前预估用户将要点击某个内容。你的瞳孔在你点击之前就会有反应,因为你期望在点击之后会发生某些事情。因此,通过监测用户的眼动行为并实时重新设计界面,你能通过检测用户的眼睛行为,创造用户大脑的微生物反馈,从而产生更多的预期性瞳孔反应。这是通过眼睛实现的初级的大脑-排序机接口,
非常酷。我宁愿选择这种方式,而不是侵入性的脑部手术。
其他推断认知状态的技巧包括以用户可能无法察觉的方式快速闪烁视觉或声音,并测量用户对其的反应。
另一项专利详细介绍了如何使用电脑学习和来自身体和脑部的信号来预估你的专注度、放松程度或学习效果。然后通过更新虚拟环境来增强这些状态。因此,想象一下一个适应性的沉浸于式环境,通过改变你在背景中看到和听到的内容来帮助你学习、组织工作或放松。
他认为,Vision Pro 只是VR生活之路上的一小步。“要让整个行业完全实现这项控制技术的宏伟愿景,需要到2030年前。”
One More Thing
留下两个问题。我们在《看DAO2023》报告中断言,“元宇宙”能否再往前走一步棋,最关键的是苹果公司等公司在今年面世的AR/VR设备:《苹果公司两个AR/VR硬件支点,今年能撬动元宇宙吗》。
留意了没有,苹果公司的MR头显商品,没有像大家事先预料的那样叫Reality Pro(Meta有个Reality Labs),而且一如既往地没有用元宇宙(Metaverse)这个说法。
在品牌上,苹果公司没有用Reality,而是用了Vision;没有用Metaverse,而是用了“New Worlds”。
最后,让坎贝尔领大家跳个广场舞蹈吧。
您目前设备暂不支持播放
已尽科学研究 (ID:Weijin_Research),作者:已尽科学研究