文 | 雷科技Ieitech
聚合式AI的下限在哪里?那个问题的标准答案也许在短天数内都不会有标准答案,至少那时聚合式AI似乎又吞并了一个捷伊领域。此前,聚合式AI的工作范凑主要集中在文字处置、油画、声音处置等方面,但是聚合式AI的能力显然不止于此。
ion 数学模型(以下简称Stable)也正式发布新版本,那时使用者能更好的控制AI聚合的3D数学模型,因此对某一模块进行修正。
也许很多人看到那个消息的设想是:“3D数学模型?是指魔方、菱形等等的东西?”,毕竟在多数人看来,真正的3D可视化复杂程度恐怕是普通AI难以处置的。不过,聚合式AI的气质就在这里,透过对数据的处置与分析,配合对语义的理解,如今的AI能根据叙述聚合更加复杂、完善的数学模型,并不仅指简单的魔方数学模型。
更为重要是2D变3D所需的天数,也不足以领略到大家非常大的震撼人心。
而在Stability AI发布的最新模拟音频中,Stable的3D数学模型已经不仅指素描,即便是一直在体育运动的人物性格,也能随心所欲转变为3D数学模型,因此体育运动的幅度、姿势都与美版十分接近。类似的技术在动画电影制做中其实经常被加进,一些动画电影为了让镜头、球体显得更具有层次感时,就会透过2D转3D的方式来制做这段镜头,突显镜头的张力
图源:Stability AI
而在传统的动画电影金融行业里,想将2D镜头转成3D,须要不少值班人员忙一段天数,而在Stable的帮助下,只须要将2D镜头输出数学模型中,方可获得高效率的初始3D数学模型,大幅提高可视化所需的天数与成本。
当然,如果而已这样,或许也就专业人士会高兴,对于广大网友来说,Stable又有什么用呢?关键就在于Stable的3D数学模型聚合无须精巧的鼓励,即便而已图画,Stable也能聚合格普雷差不差的3D数学模型,比如梵高如图幼稚园小孩般拼贴,经过Stable的“润饰”后就变成了一个还算能看的3D镜头。
图源:YouTube
让你的一切油画作品,甚至文字动起来,这就是Stable的期盼与目标。所以,Stability AI的所有成果都是直接公开,以开源的方式提供给网友使用,对于广大二次元爱好者来说,也许这是让他们的“纸片老婆”们动起来的最简单方法。
而且从Stable的3D动态数学模型聚合能力中,我们也能看到一些未来的应用场景,比如更低廉、便利的动作捕捉系统,理论上只要算力足够,就能透过摄像头捕捉的镜头实时聚合对应的3D数学模型动作。
除此之外还有什么妙用呢?不知道大家是否有看过近日的一个热闻,海外网红Caryn Marjorie通过与AI团队合作,用GPT-4复制了一个数字版的自己,然后将数字版的使用权以每分钟一美元的价格出售给自己的粉丝。
在短短的一周里,Caryn Marjorie就以此获得了7.1万美元的收入,而她提供的仅仅是语音对话闲聊服务。作为视觉生物,我们对于声音的敏感度其实要低于镜头,如果Stable也被应加进相关领域,是否可能打造出真正意义上的AI女友呢?可动、可聊,不足以抚慰你空虚的内心。
咳咳,好吧,那个话题先打住,至少在目前的数学模型效率和算力规模下,个人想实现实时且高规格的3D动态数学模型聚合,恐怕还十分困难,但是考虑到半导体金融行业的进步速度,也许这一天离我们并不遥远。
全捷伊生产力工具Stable此前最大的问题在于只能根据叙述或图像来聚合3D数学模型,如果聚合的效果不好,只能重新调整图像或文字信息来重新聚合,根据显卡的性能不同,3D数学模型的聚合天数也会有所区别,相较于ChatGPT等传统问答式AI,Stable的天数成本高很多。
所以,虽然Stable的3D数学模型聚合效果远优于以往的类似应用,使用场景却十分受限,仅仅是能够给社区爱好者提供一个简单便利的3D数学模型聚合工具。一直以来,社区使用者都希望Stability AI就能给Stabel增加模块调整功能,这样就能对不满意的数学模型细节进行修正。
Stability AI给出的回应就是Stable Animation SDK,该接口能被加载到Stabel的数学模型中,使用者在使用Stabel聚合3D数学模型后,能透过接口直接输出对应的模块,调整或增加数学模型的细节,让数学模型更符合使用者的要求。
图源:Stability AI
从接口的叙述文件来看,支持修正的模块非常多,从基础的颜色、形状、大小、纹理到动作坐姿等都能进行调节,而且调节过程无须输出专业数据或是名词,只须要如图聚合3D数学模型时一样输出文字信息方可。
比如你聚合了一只小狗的3D数学模型,然后觉得小狗身上的花纹不太满意,只须要从接口输出你想的花纹叙述,Stabel就会根据叙述对数学模型进行修正并重新渲染相关图层。
除此之外,Stable Animation SDK还支持动作命令的输出,能让静态的3D数学模型直接执行你的动作指令,比如你渲染了一只飞龙,然后输出指令“让龙飞起来喷火”,Stable就会开始对3D数学模型进行动作渲染。
而且Stable还提供摄影功能,使用者能调整拍摄机位、照明效果、背景等一系列的模块,对3D数学模型进行静态和动态的录像。是的,大家估计都猜到了,3D可视化、3D动画电影等与3D可视化有关的金融行业,都将会感受到来自AI的“温暖”。
另外,部分网友认为Stable与VR设备结合,也许会让VR设备的生产力表现得到飞跃式提升。大家应该都看过漫威电影《钢铁侠》,电影主角史塔克就拥有一个高级人工智能程序“贾维斯”,在史塔克制造钢铁侠铠甲时给予了许多帮助。
其中一个片段就是史塔克透过对话直接聚合了一个零件的3D模型,然后对其进行调整并应加进铠甲上,这套流程听起来是不是有点耳熟?没错,某种意义上这就是Stable+ChatGPT的未来版本,透过对话直接创造出3D数学模型,让设计师能在VR设备中直接检视物品的外观、使用效果等。
将那个过程放到现实生活照,就相当于将产品设计中最耗时的打样、调整过程简化,实质性的提高产品从设计到落地的整个流程效率。而且,结合VR设备的功能,甚至能让设计师提前在VR中使用和体验自己的产品。
当然,那时的产品设计流程中,其实就已经广泛利用类似的3D数学模型软件来渲染场景,但是Stable的优势在于聚合的速度,本来须要数小时甚至数天进行调整渲染的数学模型,如今只须要十分之一或更短的天数方可聚合,背后所带来的效率提升不言而喻。
随着聚合式AI的遍地开花,能看到AI对我们的社会、生产等方面会造成十分深远的影响,今天是3D数学模型,明天又会是什么?我非常期待。