本周排名前 10 的模型为: Claude Fable 5 GPT-5.5 GPT-5.4 GLM-5.2 Claude Opus 4.8 GPT-5.3 (codex) Gemini 3.5 Flash Claude Opus 4.7 GPT-5.2 (include codex) Gemini 3.1 Pro 简介: 本表格汇总了常用大语言模型在主流评测排行榜上的表现。评测范围涵盖: 人类偏好、知识与推理、代码能力、指令遵循、多模态能力和智能体能力等。 在整合各项评测结果的基础上,计算出综合排名。 更新: Claude Fable 5 荣登榜首! GLM-5.2 进入综合第 4,是本期排名最高的国内模型。也是本榜单迄今位置排名最高的开源模型。 总结: 综合实力最强:Claude Fable 5 国内最强模型:GLM-5.2 最强开源模型:GLM-5.2 最强代码模型:Claude Fable 5 如有疏漏(模型名称、排序、是否开源等),欢迎评论区讨论订正 本项目仓库: https://github.com/Tennisatw/LLM-Leaderboard 如果觉得本图有帮助,欢迎点个⭐ #多模态人工智能 #数据分析 #数据可视化 #Chatgpt #LLM #openai #anthropic #GLM #llm #claude