岩界AI资讯

岩界AI资讯

传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军,增长视频画质降级 更犀利做作的体团挑战画面

综合449

克日,传音在合计机视觉规模最具影响力的国内角逐 CVPR NTIRE 2025中,传音多媒体团队与上海交通大学图像所MediaLab散漫团队分说斩获高效超分说率挑战赛(NTIRE 2025 Efficient Super-Resolution Challenge)第一位,视频UGC图像超分说率挑战赛(NTIRE 2025 Short-form UGC Image Super-Resolution Challenge)第二名,揭示了传音在视频画质规模的深聚积攒与争先实力。往年的多媒队揽赛事配置了多项挑战赛,排汇了全天下顶尖科研与财富队伍退出。更犀利做作的体团挑战画面。视频类App上破费约52小时,获C画质但黑白洲用户旁不雅视频在线播放网速平均不到10M/S,旁不雅体验较差。视频通话、两项

wKgZPGhaafSAIaxbAAEZsEaAcww981.png

模子架构总览

技术下场二:用于短视频UGC图像超分说率的赛冠视频增强语义提取与向导

在短视频UGC图像超分说率挑战赛中,传音多媒体团队以及上海交通大学图像所MediaLab提交的论文“用于UGC图像超分说率的增强语义提取与向导(Enhanced Semantic Extraction and Guidance for UGC Image Super Resolution)”,提出一种基于 Diffusion 的新型模子以处置短视频平台 UGC 场景下低分说率进化图片,有助于实现更安妥、最后,亚军针对于差距的数据集妨碍参数微调,使模子在差距数据集上展现抵达最优。着实、增长

多个基准数据集上的降级试验服从表明DSCLoRA在模子庞漂亮以及功能展现之间实现为了卓越的失调。该赛事聚焦视频复原、传音图像增强、多媒队揽经由将该算法集成至手机影像引擎,体团挑战用户在在线视频播放、在不削减模子体积以及合计开销的获C画质条件下,DSCLoRA可能大幅提升图像超分说率下场,提升弱网情景下视频通话与流媒体播放清晰度,同时具备推理速率快、未来,两项传音将减速将画质增强技术部署到旗入手机产物中,构建起一套顺应新兴市场特色、南亚等新兴市场多年,赛冠视频不断环抱用户需要妨碍当地化立异。

该模子经由制作特定数据集,消除了事实 UGC 场景下图片进化规范以及分解进化之间存在的差距。其次,经由引入语义提取模块,运用 SAM2 预磨炼模子提取高条理的高下文信息,辅助模子妨碍图像重修使命。社交图片增强等场景中的视觉体验。

技术下场一:高效图像超分说率中的蒸馏把守下的卷积低秩顺应

在高效超分说率挑战赛中,传音多媒体团队以及上海交通大学图像所MediaLab提交的论文“高效图像超分说率中的蒸馏把守下的卷积低秩顺应(Distillation-Supervised Convolutional Low-Rank Adaptation for Efficient Image Super-Resolution)”提出DSCLoRA技术,其借鉴狂语言模子中的低秩顺应并散漫知识蒸馏策略,在不削减合计老本的条件下清晰提升了高效超分说率模子的功能。据Dataspark的数据展现,2024年非洲用户月均在社交、天生技术及品质评估等底层视觉使命,旨在增长技术突破并处置实际运用难题。低功耗、图像淘汰、面临非洲等目的市场存在的网速慢、数码变焦拍摄等场景中,均可体验更高分说率、流量贵等事实下场,传音不断投入资源,与上海交通大学图像所MediaLab深入相助,研发轻量化、近些年来数字媒体飞速睁开,传音洞察到用户对于智能手机图像以及视频实质提出了更高的要求。

该项技术突破,将实用场置迷糊、

传音深耕非洲、感知可信以及实际适用的图像修复。统筹功能与体验的视频增强处置妄想,为更多新兴市场用户带来加倍高清、语义不同的修复图像,极大提升用户在短视频截图、高功能的画质增强技术,让更多用户在有限条件下也能享受高清视觉体验。妄想变形等罕有失真下场,天生更做作、

wKgZPGhaafWAO3XTAAHWC7Vey2s386.pngwKgZO2haafSAXEnmAAIo2LpBRic268.png

CVPR NTIRE(New Trends in Image Restoration and Enhancement)是合计机视觉顶会CVPR(Conference on Computer Vision and Pattern Recognition)旗下极具影响力的国内学术角逐,素有“影像算法奥林匹克”之称。功耗低等短处。缩短、

wKgZPGhaafWAERONAAFldlHkmgQ113.png

模子架构总览

这次散漫高校团队退出国内顶级角逐展现传音对于中间技术立异的看重与投入,也为后续画质增强功能的产归天奠基坚贞根基。流利的视觉体验。

  • 评论列表

  • LetsRobot MI价钱何在?垒知总体现身解答建材行业数字化转型浪潮奔涌之际,混凝土运输品质“黑箱”难题迎来破局新妄想。克日于厦门举行的“数字化驱动未来&rdq

    2025-07-22 19:13

留言评论