首页 > 实用技巧 > 干货教程 > AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!

AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!

发布时间:2024-06-19 22:58:06来源: 15210273549

Runway前脚刚发布Gen-3 Alpha,Google后脚就跟了个王炸。

 

北京时间6月18日凌晨,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐逼真的音效,甚至是人物之间的对话

 

V2A技术支持为AI生成视频“配乐”,Google还特别强调了官网发布的Demo视频都是由自家在五月份发布的生成视频模型“Veo”和V2A技术合作打造

 

有不少网友表示,这下终于可以给用Luma生成的meme视频配上声音了!

 

从Google Deepmind官网发布的Blog上看,V2A技术会采用视频像素文本提示来生成与底层视频同步的音频波形。

 

首先,V2A会对视频和文本提示进行编码,并通过扩散模型迭代运行,将随机噪声细化为与视频和所提供的文本提示相匹配的真实音频,最后再对音频进行解码并与视频数据相结合。

 

X网友纷纷表示太赞了,但就是有一个小小小小的问题,和同样是凌晨发布的Runway的视频生成模型Gen-3 Alpha一样,这

又是一个大家都用不上的超赞模型,到底啥时候开源让咱们试试水!

干货教程更多>>

吉利2025新车曝光:9款重磅产品,旗舰SUV、轿车都来了 2025首周,吉利给比亚迪一个下马威 高阶智驾≠高价,丰田开始进场!15万级激光雷达智驾SUV来了 领航穿越美国“死亡公路” 魏牌全新蓝山为何如此勇? “以旧换新”新政落地,这回轮到国四车主换新车了 蜂巢能源第五届电池日大招不断!越野、蜂行电池等重磅新品发布 又一明星“入坑”:问界M9圈走多少高净值用户 龙头车企交出亮眼成绩单 20万元以上“重庆造”占比超两成 央企造车铸就“新实力”,岚图汽车2024年“八连涨” 澳洲超万辆Kia汽车紧急召回!涉及两款热门车型 电动狂飙!年度销量之争与市场新贵的诞生 同比实现翻番,“车谷造”汽车出海突破12万辆 四维图新:当“躺赚”的图商开始下场和智驾Tier1卷生死 2024年国产品牌销量榜,谁满面春风,谁步履艰难 进口车销量连续3年负增长,BBA在中国的“黄金时代”正式落幕 不愿搬迁者赔N+7!曝某合资车企总部搬迁,多款车型或合并 门槛更低了?宁德时代发布磐石底盘,车企“换个壳就能造车” 性价比低是个性小车魔咒?iCAR V23真好看 但配置有遗憾 极越难逃5折贬值和高售后成本?倒闭至今解决了哪些问题? 既生瑜何生亮 萤火虫是挺好 但架不住领克Z20实在太卷! GMC YUKON育空登陆中国,动感外观+卓越性能,引领豪华SUV新潮流 关于乐道和萤火虫、ET9、销量、盈利等,李斌3小时的回应 新合资时代里,东风本田发起了电动化反击 2024年海南儋州市教育局招聘中学教师44人公告 2024年海南三亚市天涯区教育系统招聘幼儿园编制教师16人公告 2024年湖南怀化市卫生健康委招聘6人公告 2024年中国医科大学招聘高层次和急需紧缺人才公告 2024年辽宁鞍山市公立医院招聘15人公告 2024年内蒙古鄂尔多斯市党校系统引进人才34人公告 2024年山西长治市沁源县招聘专职社区工作者54人公告