有什么上菜的小技巧吗。不抖的那种!
如果没有,看看这个:不管你怎么动,盘子和食物都安然无恙。
Emmm...其实仔细看还是能发现这不是上菜的妙招这个盘子和热狗不是粘在一起的,是后来合成的
播放人工智能合成图像的研究人员来自香港中文大学,浙江大学和英伟达。
除了空降一盘热狗,他们还把宫崎骏其人的《我的龙猫》搬到了一张白纸上,任何弯曲或移动都不会影响播放。
这张白纸没有经过特殊处理,我们看到的画中画也是AI合成的。
可是——众所周知,视频不能p,所以是真的!
另外,这些人改变了小电视的眼睛和嘴巴的颜色。
现在,相关论文已经收录在图形峰会SIGGRAPH Asia 2022。
我们来看看他们究竟是如何实现这些神操作的。
利用神经网络实现纸上视频
如何把抖动纸上的一张图变成另一张图,让人几乎看不出p图的痕迹。
第一步,收集各种资料以梵高的《星空》为例首先,在不同的角度,光照条件,晃动条件下拍这张图
光流是什么呢:在计算机视觉中,光流是一个关于物体运动的概念,可以表示为连续两幅图像中代表同一目标的像素的位移。
为了实现丝绸般逼真的视觉效果,研究人员提出了一个新的框架NeuralMarker,来捕捉标记和参考图像之间的密集对应关系。
从这个框架的名称中的Neural,我们可以看出它与神经网络有关系。
比如把动感的星空变成日本名画《神奈川冲浪》就是酱紫:
其中只有NeuralMarker是成功的,这个模型成功的关键因素在于它的两个组成部分和一个标记评估方法:
1.飞行标记捕捉几何变化
首先,为了处理像素级的密集对应,运动调节器必须能够实时捕捉各种几何变化。
研究人员通过使用拍摄的材料,一些人工标记和合成的参考图像作为数据集,训练了一个名为FlyingMarkers的工具。
在FlyingMarkers的帮助下,运动调节器可以对各种变形进行编码,从而捕捉大多数几何变化。
2.SED+SfM捕捉亮度和颜色的变化
除了几何变化,颜色和亮度的变化也至关重要。
研究者指出,在训练模型的数据集中,连续动画外观变化不大,最后要求把一张图换成另一张图,外观差别明显。
因此,他们提出了对称极距损失的概念,并结合运动重建结构技术,根据相机的拍摄角度约束密集对应的预测。
这样即使在暗光下拍原图,也能有很好的生成效果。
3.DVL标记的评估
从几何变形,摄像头角度,光照三个方向进行评估。
经过测试,研究人员发现,使用DVL标记,这种AI模型的图像质量评价指标SSIM和PSNR的性能优于同类模型,任务成功率达到100%。
有了这些工具的加持,NeuralMarker也可以解决在纸上播放视频的问题。
看到这里,大家应该觉得这个AI已经溜走了,但还没完——
对此,他们表示会在训练数据集中随机添加拦截器,让这个AI变得更加智能。
论文地址:
参考链接:
。声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
最新文章
- 9月15日见!荣耀X40开启预约:当彩云追
- 德昌股份获得合计约11.6亿元EPS电机及
- 产业结构转型升级驱动下,同道猎聘的路越走越
- “老干”与“新竹”彰显北京精致餐饮
- 索尼发布A7M4微单1.10新固件,新增两
- 追踪丨一针难求的九价HPV疫苗去哪了
- 《羊了个羊》为何这么火
- 中汽协:“全产业链低碳发展”是汽车行业“双
- “碳捕手”崛起:CCUS方兴未艾
- 我国轻工大国地位不断巩固已形成290个特色
- 微软Xbox公布最新XGP名单,《英灵神殿
- 首批Smart精灵1量产车将于9月23日开
- 8月土地供应规模上升一线城市升幅居前
- 闪迪推出新款PRO-G40移动SSD:IP
- 跑得比猎豹快的机器人来了,还能游泳跳跃,大
- vidalido品牌简发展迅速
- 服装业持续提升时尚活力自主品牌已成主流
- iPhone全系支持电量百分比iOS16.
- PSVR2明年初面市
- 哈佛专家称扎克伯格是“坏老板”,只要他继续
- 《羊了个羊》为何出圈幕后推手月流水曾破亿
- NothingPhone1手机在印度20天
- 华硕Q3营收同比增长4%,成少数逆势增长的
- 《利刃出鞘2》成为首部在美国三大连锁影院首
- 存款利率又降了!六大国有银行今日启动已有股
- 粮油行业首家碳中和工厂益海嘉里金龙鱼践行绿
- 合并后彻底转向PoS机制以太坊完成近年来最