萧箫 丽翔 凹非寺
当听觉特技师与GAN强强联合携手,做出的动画电影会不能更快看?
标准答案是YES。
这是一名听觉特技师,用英文版抖音上超火的上恩Bella Poarch的视频,聚合的克林顿TikTok版动画电影:
不但动画电影效用精巧,眼神生动活泼,GAN聚合的人物形象也不能发生意外“进料”的情形。
彼时,那位专精动画电影师一碰触到AI,就看上了AI搞表演艺术的“胆量”——用GAN将两个音频中的人物动画电影化,只须要几秒钟。
相对而言,假如用恒定的应用软件展开动画电影制做,可能将须要花费两个动画电影师数周的天数。
但是,他迅速辨认出,原有的那些AI人脸识别动画电影化的数学模型,做出的米老鼠形像毕竟相差太大。
如下表所示图,在此之前用AI将安倍晋三动画电影化后,米老鼠人物形象的面色看上去不好……
△动画电影化后有点儿印堂发黑的怪异感
只好,他索性他们上手,紧密结合原有的GAN数学模型展开强化修正。
效用全由!
不但像给恒定的人脸识别加了自拍特技,米老鼠形像毕竟堪称迪斯尼动画电影中的主人公:
连克林顿都“返老还童”,比开了自拍看上去还年轻。
而且,任何人都能控制那些米老鼠人物形象的眼神,即使是提前录制好的音频也可以。
那么,这样的动画电影效用,到底是怎么做出的?
迁移学习的妙用
那位听觉特技师,选择了用一种特殊的方式制做好看的米老鼠人物形象形像。
他利用迁移学习聚合了两个7×6的表格,根据迁移学习的强度来聚合不同风格的人脸识别。
也就是说,假如迁移学习强度越大,人物形象就会越接近米老鼠化,而迁移学习强度越小,人物就越接近真实形像。
可以看见,图像越靠近左下角,人像就越真实;而越靠近右上角,人物形象就更接近米老鼠化。
这样,既能最大程度上保留人物形象的特点,又能使米老鼠脸看上去更精巧。
而且AI还能根据“客户需求”,判断出更适合的人像,并展开数据训练。
连尤金老爷子看上去都年轻了不少,甚至有点儿《飞屋环游记》里老爷爷的慈祥意味了。
在这其中,听觉特技师利用了GAN来聚合米老鼠人物形象的形像。
既能“性别转换”,也能变化年龄
那位听觉特技师采用的基础数学模型是Justin Pinkney和Doron Adler的作品StyleGAN2 FFHQ (Nvidia的数学模型),主要根据DeepAI做成。
StyleGAN的原理在于,它摒弃了输入层,添加了两个非线性映射网络。
此外,它创新了一种名为style-based generator的聚合器,能够控制所聚合图像的高层级属性(high-level attributes),如 发型、雀斑等。
而且,这个StyleGAN自带两个开源数据集FFHQ,里面包含着各种各样的人脸识别数据集。
而那位听觉特技师,则是将这个StyleGAN2 FFHQ展开了微调。
利用GAN聚合的人物形象形像,不但可以米老鼠化,还可以让图像模式化(Stylized),聚合风格相似的人物形象眼神和特征。
不但可爱的小朋友能被米老鼠化,而且还能根据眉毛和脸部特征构建两个女孩子的面部:
假如人物形象“长大”了,那么模式化出的女孩子的面部,也会变得更成熟:
这份应用软件目前还没开源,因为看上去,那位听觉特技师对他们做出的动画电影还不是太满意,认为仍然有更多可以改进的空间。
但是,网友似乎已经有点儿急不可耐。
有热爱二次元的网友表示,希望这样的工具能将所有的漫画改成动漫。
也有网友表示,这样的工具看上去已经很棒了,不知道作者是否有意愿在对作品满意后,展开开源。
期待那位听觉特技师能够达成目标,将这份数学模型代码开源。
作者介绍
Nathan Shipley,听觉特技师,动态图形表演艺术家,创意技术人员,目前感兴趣的研究方向是AI聚合表演艺术。
此外,那位特技师还曾经在2019年,为佛罗里达州圣彼得堡的达利博物馆“复活”了超现实主义画家Salvador Dali本人。
那些对画家Dali的著作有兴趣的观展者,只要按下按钮,就能看见屏幕中的Dali正对你“打招呼”,神态非常惟妙惟肖。
假如对他的表演艺术作品感兴趣的话,可以戳下方地址主页查看。
Nathan Shipley主页地址:
http://www.nathanshipley.com/gan参考链接:
https://www.reddit.com/r/MachineLearning/comments/j0btow/p_toonifying_a_photo_using_stylegan_model/https://www.dezeen.com/2019/05/24/salvador-dali-deepfake-dali-musuem-florida/—完—
@量子位 · 追踪AI技术和产品新动态