一键合成视频,这个AI工具不容错过
5G让短片再次流行。除了图形编辑和排版,视频制作已经成为工作场所俱乐部的一项新的必要技能,需要学习的知识和技能也有所增加。还在死记硬背教学视频“如何在三小时内从一个白人小新手变成编辑一个伟大的上帝”?不需要!遗憾的是,我知道得太晚了,那些拥有数百万播放级别和对好看视频的高度互动赞扬的新闻视频,最初是由百度人工智能自动合成的。例如,娱乐八卦视频、互联网科技视频和其他各类热门新闻视频可以快速、自动地合成为视频,只需点击新闻链接就能点击观众的g点。新媒体可以用小手立即发布,也可以不费吹灰之力地追逐热点,从而避免KPI过于冷静。
下面的视频更“可爱”。百度研究所推出黑色技术。人工智能实际上切下了视频,并报告说他学会了制作视频新闻。
凭借强大的人工智能技术和海量数据资源的优势,百度研究院已经孵化出行业首个智能视频合成平台VidPress,支持通用和大规模生产。用户只需用一个键输入新闻图文内容的链接,其余工作由平台自动完成。智能视频素材聚合、评论生成、语音合成、音视频对齐和渲染输出的整个制作过程可在9分钟内高效完成。生产效率和质量都得到了很大的提高,很好地解决了视频生产过程中的许多难题,如人工成本、技术难度、材料有限、无法大规模生产等。,帮助5G时代的数字内容制作创作和视频升级,实现更具包容性的信息。
智能视频合成平台VidPress的高效率和高质量已经在实践中得到验证,并且已经在各种视频平台上“遍地开花”。百度开发了一个分布式视频生成系统和面向外部服务的REST API,为大规模制作好看的视频提供服务。根据好看的视频使用数据,当前生成持续时间约为2分钟的720p视频,所需的中值持续时间仅为2.5分钟;该平台每天可以生成500到1000个视频,从热点发现到最终视频生成的整个过程完全是无人操作和自动化的。此外,VidPress的视频播放完成率比大市场的好看视频高出15个百分点。一些受欢迎的视频已经有85万的回放量,这表明人工智能新闻视频深受观众喜爱。
一键输入即可完成新闻和视频制作。编辑中的“黑魔法”是如何实现的?
用户输入图形内容后,如新闻事件的链接,平台将基于自然语言处理模型进行语义理解,通过主题模型聚合相关新闻素材,从同一主题的相关新闻中提取更多的素材和语义表示,充分保证素材内容的丰富性和关联性。
然后,评论语音生成和素材深度挖掘同步开始。一方面,该平台基于多种语言模型对原文进行处理,自动生成符合要求且适合视频展示的评论,并通过百度文本到音频服务(TTS)合成评论语音,效果相当于播音员。同时,平台将根据对原文的理解,通过自己的视频库和百度搜索引擎,智能聚合最新最适合展示的内容,并基于人脸识别、对象识别、视频内容理解等计算机视觉服务进行进一步的分析和理解,自动剪切和选择视频素材。
完成上述两个步骤后,平台将根据评论音轨的时间线和聚合的媒体片段进入音频和视频对齐编辑过程。百度升级后的第二代时间轴对齐算法的关键是在文本中选择兴趣点,然后对媒体片段和兴趣点之间的相关性进行评分,并首先将高质量的媒体片段放入时间轴中,以保证视频的整体视觉感知和用户兴趣的持续激发。时间轴生成后,数据被传输到渲染器以生成完整的视频。集成过程需要不到9分钟的时间,非常高效。
人工智能新闻视频仍在探索更多的可能性,如针对不同垂直类别或传送渠道的定制合成,针对用户特征的定制视频生成,以满足个性化需求等。如需简短视频合作,请联系vidpress.support@baidu.com。不仅如此,百度并不满足于提供一个内容制作平台,而是希望凭借其丰富的数据资源,从多个角度观察和报道热点新闻,让受众更客观地理解一个事件,在促进互联网内容的信息中立性方面发挥更大的作用。
目前,VidPress平台可以申请试用。