EvoQuality – 字节跳动开源的图像质量评估模型

互联网资讯 来源:AI工具集 2026-06-13 13:30:32

EvoQuality是什么

EvoQuality 是字节跳动与香港城市大学联合推出的自进化视觉语言模型框架,专注于无参考图像质量评估。模型基于 Qwen2.5-VL-7B 构建,模型完全无需人工标注的质量分数或失真标签,通过模型自身的成对比较与多数投票生成伪排名标签,再借助 GRPO 强化学习算法实现多轮迭代自进化。

EvoQuality的主要功能

  • 单图质量评分:对单张图像输出连续质量分数,支持多种失真类型,包含真实失真、合成失真、AI生成失真。
  • 图像对质量对比:通过成对比较判断两张图像的相对质量优劣,生成可解释的质量描述文本。
  • 自进化迭代训练:在离线阶段通过多数投票生成高置信度伪标签,在线阶段通过 GRPO 优化策略,形成闭环自我提升。

EvoQuality的技术原理

  • 离线伪标签生成:对未标注图像对进行多次查询,让当前 VLM 判断”哪张图像质量更好”。通过成对多数投票(Pairwise Majority Voting)建立相对质量共识,生成伪排名标签,完全替代人工 MOS 标注。用 Thurstone Case V 心理测量模型将离散比较结果转化为连续的质量分数分布,生成可优化的保真度奖励信号。

  • 在线策略进化:用 GRPO 算法将伪标签转化为奖励信号,更新 VLM 策略。通过组内样本的相对奖励估计优势函数,大幅降低训练内存与计算开销。策略模型针对同一批图像对生成多个回答,根据伪标签计算的奖励进行梯度更新。

  • 迭代进化机制:多轮迭代形成正反馈,模型能力提升 → 生成更高质量伪标签 → 模型进一步进化。实验表明零样本 PLCC 平均提升 31.8%。

如何使用EvoQuality

  • 环境准备:安装 Python 3.8+ 及 PyTorch、Transformers 等依赖库,确保 GPU 环境可用。

  • 模型加载:从 Hugging Face 拉取 ByteDance/EvoQuality 的模型权重与处理器文件到本地。

  • 单图质量评分:读取待评估图像,构造提示词如”Please rate the quality of this image from 0 to 100.”并输入模型。模型输出连续质量分数及结构化的质量缺陷/优势描述文本。

  • 图像对质量对比:准备两张待对比图像,构造提示词如”Which image has better quality? Explain why.”并输入模型。

  • 批量评估:对图像数据集进行批量推理,结合多次查询的多数投票机制生成高置信度伪标签。

  • 自进化训练(进阶):用生成的伪标签通过 GRPO 算法微调模型,启动新一轮迭代进化持续提升评估精度。

EvoQuality的核心优势

  • 零标注成本:完全无需人工主观评分或失真标签,仅通过模型自身成对比较与多数投票即可生成训练信号。
  • 性能超越监督模型:在 7 个 IQA 基准中的 5 个上超越当前最先进的监督 VLM-based IQA 方法,零样本 PLCC 平均提升 31.8%。
  • 自进化闭环能力:通过多轮迭代形成生成伪标签→训练模型→模型更强→生成更好标签的正反馈循环,持续突破性能上限。
  • 跨数据集强泛化:天然支持零样本跨域评估,无需针对新数据集重新对齐感知尺度或重新训练。

EvoQuality的项目地址

  • HuggingFace模型库:https://huggingface.co/ByteDance/EvoQuality

  • arXiv技术论文:https://arxiv.org/pdf/2509.25787

EvoQuality的同类竞品对比

维度EvoQualityVisualQuality-R1
监督方式完全自监督,零人工标注需人工 MOS 标注作为 ground truth
核心算法GRPO + 成对多数投票伪标签 + 多轮自进化GRPO + Thurstone 模型 + 连续保真度奖励
奖励来源模型自身生成的伪排名标签(无需外部标注)基于人工 MOS 计算的连续 fidelity measure
模型基础Qwen2.5-VL-7BQwen2.5-VL-7B
训练机制离线伪标签生成 → 在线 GRPO 优化 → 迭代闭环进化单轮/有限轮次 RL 训练,依赖固定标注数据集
数据依赖仅需未标注图像,数据获取零成本需 KADID-10K、TID2013、KonIQ-10k 等带 MOS 数据集
迭代能力支持多轮自举迭代,模型与标签质量相互提升训练收敛后不再进化,受限于标注数据规模
可解释性输出质量分数 + 结构化质量描述文本输出质量分数 + 推理过程(thinking)+ 质量描述
跨数据集训练天然支持,无需感知尺度重新对齐支持多数据集训练,无需尺度重新对齐

EvoQuality的应用场景

  •  AIGC 内容质检:自动评估文生图、图像超分辨率、老照片修复等 AI 生成内容的感知质量,替代人工审核,降低内容平台运营成本。

  • 图像压缩与传输优化:实时评估压缩后图像质量,在带宽与画质之间寻找最优平衡点,适用于视频流媒体、云存储等场景。

  • 手机摄影辅助:实时分析取景画面质量,指导用户调整对焦、曝光、构图参数,或自动筛选连拍中的最佳成像。

  • 视频质量评估:将单帧评估扩展至时序维度,分析动态模糊、帧间一致性、码率波动对观感的影响,用于视频编码与传输质量监控。

关注公众号:拾黑(shiheibook)了解更多

友情链接:

下软件就上简单下载站:https://www.jdsec.com/
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接