首页 >>  正文

cameo

来源:baiyundou.net   日期:2024-09-29

无需会议室和出差,打开手机,登录APP,就可以和千里之外的人“面对面”开会。疫情下,这种场景已经成为很多打工人工作的常态。

作为一种实时的网络应用,视频会议对网络的要求比较高。当下视频会议过程中,因网络信号问题,常会导致与会者频频掉线、屏幕共享画面不清晰,影响开会的效率。此外,成像角度不佳、客观原因造成个人形象不佳等问题,也将影响与会者的开会体验。如何在低网络带宽下,进行流畅、清晰的视频会议,成为困扰众多视频会议开发者的难题。

此前,开发者大多通过调整图像分辨率、码流、帧数等方式实现视频数据压缩,解决低网络带宽下视频会议问题。虽然这类方法可以缓解视频会议卡顿问题,但会导致视频图像模糊、不连贯。

而以深度学习为代表的卷积神经网络具有更深的学习层次,能够有效的去除掉冗余数据特征,获得更高的压缩比,开发者们倾向于使用神经网络来替代以前的方法。同时,由于带宽一般很难增加,而增强算力相对容易,所以开发者们也更希望将带宽问题转化为计算问题。

基于此,NVIDIA 研究团队从AI维度出发,开发了一个用于视频会议软件 NVIDIA Maxine SDK的深度学习模型Vid2Vid Cameo,只需一张照片或卡通头像,就能合成逼真的3D人脸说话视频。

一、视频会议Maxine SDK背后的AI生成模型

受疫情影响,远程协作和办公已逐渐成为不可逆转的趋势,这使得各种视频会议APP下载量激增,成为打工人的标配。

为了增强用户的视频会议使用体验,NVIDIA推出了一套基于云的、GPU加速的 AI 视频会议软件Maxine。NVIDIA Maxine 包括三个 AI SDK:视频特效 SDK 、音频特效 SDK 和 AR SDK ,每个SDK里面都配有预训练好的深度学习模型,使开发者可以快速构建或增强其实时应用程序。

Vid2Vid Cameo 是基于 NVIDIA Maxine SDK 专为视频会议打造的深度学习模型之一。它使用生成式对抗网络(Generative Adversarial Networks,GAN),在一个人的真实照片或卡通头像上合成动态的3D说话视频。

二、仅需一张照片合成逼真的3D人脸说话视频

NVIDIA Vid2Vid Cameo只需两个元素:一张参考照片和一个指导图像应该如何动的视频流。其中,把上传的清晰照片作为源图像,从中获取外貌特征;然后把视频中一帧帧画面作为重构视频的依据,从中提取出面部表情和头部姿势等信息。通过这些信息,模型可以将参会者的面部动作映射到静止的照片上,进而合成视频会议上的逼真人脸说话视频。

同时,该模型基于NVIDIA DGX系统开发,并使用包含18万个高质量人脸说话视频的数据集进行训练。这让该网络学会了识别20个人脸关键点,而这些关键点可以在没有人工标注的情况下用来模拟面部运动,借此修正使用者在会议中低头、看两旁,而未专注于镜头方向的情况,让使用者在会议中看起来更有参与感。

在 NVIDIA Vid2Vid Cameo 提供的交互式体验Demo中,可以在Pitch俯仰角(向下/向上)、Yaw偏航角(左/右)、Roll翻滚角(顺时针/逆时针)三个方向上任意旋转,每个方向上最多旋转30度。甚至眼球也可以上下左右的旋转,每个方向上最多旋转20度。

现在点击【AI Demo | NVIDIA 研究团队】试用NVIDIA Vid2Vid Cameo交互式Demo。

此外,NVIDIA Vid2Vid Cameo还可利用 AI 从专业摄像头或智能手机拍摄的标准 2D 视频中捕捉面部动作和表情,协助动画师、照片编辑师和游戏开发者轻松制作脸部动画。

三、视频会议的网络带宽成本最高可降低90%

NVIDIA Vid2Vid Cameo能够辨识脸部的20个关键点,而这些关键点可以针对包括眼睛、嘴巴和鼻子在内的位置进行编码。接着模型会从通话者的参考图片中撷取这些关键点,并将这些关键点可以提前发送给其他的视频会议参与者。

如此一来,视频会议平台只需发送参会者脸部关键点的移动情况数据,而不用在每一个与会者之间发送庞大的直播视频流。而对接收者来说,GAN 模型在接收端使用这些信息合成一个模仿参考图片外观的视频内容。

由于关键点的分布十分稀疏,比全像素图像的数据量小得多,因此发送的数据要少得多。而Vid2Vid Cameo通过来回压缩及发送头部位置和关键点,而不是完整的视频流,可以让视频会议的网络带宽成本最高可降低90%,从而提供更流畅的用户体验。同时,该模型可以进行调整,传输不同数量的关键点,以实现在不影响视觉质量的条件下,适应不同的带宽环境。

四、视频会议和直播软件开发团队的新Pick

作为 NVIDIA 研究团队的重要成果之一, Vid2Vid Cameo 将网络瓶颈问题转化为计算任务,从而借助本地或云端资源更轻松地解决此类问题。Vid2Vid Cameo 也可用于直播软件,制作表演者说话、唱歌或移动头部的视频片段。此外,它还可减少了对高网络带宽的依赖,这不仅为提供商削减了成本,也为最终用户提供了更流畅的视频会议体验,成为视频会议和直播开发团队解决因网络所造成画面卡顿及模糊问题的新选择。

Vid2Vid Cameo 很快将在NVIDIA Video Codec SDK中作为AI Face Codec推出。SDK 支持免费下载,还可与 NVIDIA Jarvis 平台搭配用于对话式 AI 应用,包括转录和翻译;也可与3D 人体姿态估计工具协作,像Notch 和 Pixotope 等公司,创作者们使用 NVIDIA Vid2Vid Cameo 和 3D 人体姿态估计工具,将自己的动作传输到虚拟角色,从而快速制作数字角色上的特定动作。

之后,我们还将陆续介绍 NVIDIA 研究团队推出的计算机视觉、深度学习模型以及有意思的交互式Demo,如NVIDIA GauGAN360,可将粗略的草图变成可用于3D场景的360度环境。

体验更多人工智能和深度学习互动Demo,点击【AI Demo | NVIDIA 研究团队NVIDIA HomeMenuMenuCloseCloseCloseCaret down iconCaret down iconCaret up iconCaret right iconCaret right iconCaret right iconCaret left iconCaret left iconCaret left iconShopping CartSearch iconNVIDIA 引领人工智能计算NVIDIAFacebookTwitterLinkedInYouTubeNVIDIA】立即体验“NVIDIA AI 互动 Demo”。

","force_purephv":"0","gnid":"96c58125702b22687","img_data":[{"flag":2,"img":[{"desc":"","height":"748","title":"","url":"https://p0.ssl.img.360kuai.com/t017086f0f5263dc752.jpg","width":"1080"},{"desc":"","height":"260","s_url":"https://p0.ssl.img.360kuai.com/t0165c0a00bea370e7a_1.gif","title":"","url":"https://p0.ssl.img.360kuai.com/t0165c0a00bea370e7a.gif","width":"462"},{"desc":"","height":"441","title":"","url":"https://p0.ssl.img.360kuai.com/t01ebdebe9d10251f4e.jpg","width":"906"},{"desc":"","height":"219","s_url":"https://p0.ssl.img.360kuai.com/t012aa2137bc6b2ce0b_1.gif","title":"","url":"https://p0.ssl.img.360kuai.com/t012aa2137bc6b2ce0b.gif","width":"390"}]}],"original":0,"pat":"art_src_3,fts0,sts0","powerby":"hbase","pub_time":1661872620000,"pure":"","rawurl":"http://zm.news.so.com/4ff9452d4091335a743126d6bb19ddd4","redirect":0,"rptid":"a9a84a65a051127b","s":"t","src":"智东西","tag":[],"title":"用GAN消除视频会议模糊,还能降低90%带宽,神奇的Vid2Vid Cameo模型

鱼琬庭1448以c或ch开头的姓氏 -
莫包清17386362418 ______ crescendo 渐强 commando 别动队 crusado 十字军 condo 公寓 cameo 宝石 colorado 科罗拉多州

鱼琬庭1448CAMEO,CAMEO 歌词 -
莫包清17386362418 ______ 歌曲名:CAMEO,CAMEO 歌手:清水爱 专辑:発芽条件M CAMEO,CAMEO 作词/作曲:畑 亜贵 编曲:伊藤真澄 歌:清水 爱 そうっと立てば 终わらない様に 引き换えには节度 狂おしくありふれた热意 适切なら非日常 CAMEO,CAMEOの时...

鱼琬庭1448王牌特工2黄金圈最后一段和牛仔的打斗时的BGM -
莫包清17386362418 ______ 歌名叫Word up,原唱是CAMEO,优酷现在还能搜索到MV.QQ音乐也能找到.电影里是Korn组合的版本,QQ音乐也可以找到的.这首歌挺不错的,XBOX的舞蹈音乐游戏里也选中过.

鱼琬庭1448谁可以帮我打出5个字母C开头的英文单词?要有翻译的越多越好 10 -
莫包清17386362418 ______[答案] cabin bin] n.小木屋;机舱,船舱 cable keib?l] n.缆绳;电缆;(海底)电报 vt.给…发电报 cache [k?] v.贮藏,隐藏 n.藏物处... i] a.谨慎的,机灵的 Cairo kai?u] n.开罗[埃及首都] camel l] n.骆驼 cameo mi-?u] n.硬石、贝壳上刻有不同颜色的浮雕 canal ...

鱼琬庭1448红色警戒2尤里复仇做好图标后怎么办? -
莫包清17386362418 ______ 看看art里现成的代码不就清楚了? 如果你做的图标没有问题,那么应该有两个图标(想省事一个也行),命名规则是名字后面加icon和uico,分别是不带星和带星的,假设是aaaicon.shp和aaauico.shp.这两个图标文件放到游戏根目录就行,压进ecache里太费事,另外你看的教程是红警2的,如果你想压进压缩包,在尤里复仇里就不是ecache了,而是ecachemd.mix了. 不带星的图标在art里按照规则要写在Cameo=后面,不带后缀而且要大写,完整的应该是Cameo=AAAICON. 带星的图标在art里按照规则要写在AltCameo=后面,不带后缀而且要大写,完整的应该是AltCameo=AAAUICO.

鱼琬庭1448有没有calmeo这个英语 什么意思
莫包清17386362418 ______ calmeo 没有 cameo 倒是有 浮雕宝石 的意思

鱼琬庭1448Zanussi 中国代理 -
莫包清17386362418 ______ 并在武汉地区代理:“ZANUSSI”(世界最大的厨房设备制造商)、“Manitowoc”(世界产销量最大制冰机)、“MEIKO”(德国最大洗碗机制造商)、“Cameo”(中国历史最悠久的强化瓷器)、“ATHENA”(英国最新款不锈钢餐具)、“HYPERLUX”(美国首选宴会...

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024