Seed2.0是什么Seed2.0是字节跳动Seed团队推出的最新大模型系列,包含Pro(doubao-seed-2-0-pro-260215)、Lite(doubao-seed-2-0-lite-2
Xiaomi-Robotics-0是什么Xiaomi-Robotics-0是小米开源的首代机器人VLA(视觉-语言-动作)大模型,拥有47亿参数,采用MoT混合架构,Qwen3-VL多模态模型作为”大
JoyAI-LLM-Flash是什么JoyAI-LLM-Flash 是京东开源的中型指令大模型,采用混合专家(MoE)架构,总参数量 48B,激活参数量仅 3B,支持 128K 超长上下文。模型创新性
FireRed-Image-Edit是什么FireRed-Image-Edit是小红书Super Intelligence团队开源的通用图像编辑模型,基于扩散架构,支持文本引导的图像编辑、老照片修复、
Seedance 2.0是什么Seedance 2.0是字节跳动旗下即梦推出的新一代AI视频生成模型,主打多模态参考与高效创作能力。模型支持首尾帧、视频片段及音频综合参考,能精准复刻运镜逻辑、动作细节
Nanobot是什么Nanobot 是香港大学数据智能实验室开源的超轻量级个人 AI 助手,仅约 4000 行代码完整复刻了OpenClaw 智能体的核心功能。Nanobot具备网页搜索、文件操作、定
lingbot-VA 是什么LingBot-VA 是蚂蚁灵波科技开源的全球首个面向通用机器人控制的因果视频-动作世界模型。模型将视频世界建模与策略学习统一为自回归框架,使机器人能同时预测未来状态,执行
LingBot-World是什么LingBot-World 是蚂蚁灵波科技开源的交互式世界模型。模型通过可扩展数据引擎从大规模游戏环境学习物理规律与因果关系,实现动作驱动的精准生成。模型支持近10分钟
SkyReels-V3是什么SkyReels-V3是昆仑万维开源的多模态视频生成模型,用单一架构实现专业级视频创作。模型能将静态图像转化为动态影像,支持智能延长视频时长和电影级转场,让数字人音视频精准
Qwen3-ASR是什么Qwen3-ASR 是阿里云通义千问团队开源的系列语音识别模型,包含 1.7B 高精度版、0.6B 高效版两个 ASR 模型,以及专用的 Qwen3-ForcedAligner
MOVA是什么MOVA(MOSS Video and Audio)是上海创智学院OpenMOSS团队与模思智能(MOSI)联合推出的,中国首个高性能开源音视频端到端生成模型。模型突破传统视频”静音”局
SenseNova-MARS是什么SenseNova-MARS是商汤科技开源的多模态自主推理模型,提供8B和32B两种参数规模。作为首个支持动态视觉推理与图文搜索深度融合的Agentic VLM,模型