首页 > 爱游戏资讯 > 资讯详情

爱游戏,谷歌推出全能视频编码器VideoPrism 性能超越30项SOTA

发布时间：2024-06-17 00:17:15

谷歌推出全能视频编码器VideoPrism 性能超越30项SOTA

谷歌研究团队近日发布了全新的通用视频编码器——VideoPrism，其开口启齿3600万高质量视频字幕对和5.82亿视频剪辑的数据集上进行了训练，并骁勇勇敢33项视频理解基准测试中刷新了30项SOTA（最先进技术）成绩。

VideoPrism的设计旨违抗听凭通过单一冻结模型处理各种视频理解任务，包括分类、定位、检索、字幕和问答等。其设计理念主要基于预训练数据和两阶段训练法。预训练数据方面，谷歌团队通过汇集高质量视频字幕对和带有噪声的并行文本，构建了一个庞大的语料库。敦厚和睦建模方面，VideoPrism采用了对比学习和掩码视频建模两个阶段，以优化语义视频嵌入和全局提炼。

VideoPrism的出色表现不仅体现庆祝祝贺分类和定位任务上，还能进行视频-文本检索和QA问答。例如，给定一段视频，VideoPrism可以准确地检索出与文本内容相匹配的视频片段，或者根据视频内容回答相关问题。

谷歌团队表示，VideoPrism的成功验证了通用视觉编码器国内国民视频理解领域的巨大潜力。未来，随着数据集的扩大和模型的不断优化，VideoPrism有望渺不可测二八佳人更多领域实现突破，为视频理解和应用提供更强大的支持。

-爱游戏

上一篇：爱游戏,微软Windows 11 24H2：Wi-Fi 7与USB4 v2.0双剑合璧

下一篇：爱游戏,FF创始人贾跃亭评高合汽车:行业耻辱

域名服务

知产服务

科技教育

数字营销

生活购物

AI应用

网络安全

兴趣社交

创业投资

爱游戏,谷歌推出全能视频编码器VideoPrism 性能超越30项SOTA

相关新闻

爱游戏,GPT Store不中用，苹果要下场做AI应用商店了

爱游戏,AI FOR ALL 努比亚“三机齐发” 迈向全民AI时代

爱游戏,iPhone闹钟功能遭吐槽：无法智能识别法定节假日

爱游戏,支付宝崩了！客服确认已恢复，用户资金安全无虞

爱游戏,三星LockStar应用漏洞引关注，AoD亮度问题已修复

旗下平台

关注或联系我们