2026年6月。16款旗舰大模型在我们跨境电商公司业务里的真实生产环境八维雷达记录。 分数来自创意、财务、决策、供应链、分析、代码、法律等日常 Agent 工作流,想到哪记哪,主观记录仅供参考。 ━━━━━━━━━━━━━━━━ 八个维度 上下文衰减|文字推理|编码|工具调用|多模态|速度|经济性|智力稳定性 ━━━━━━━━━━━━━━━━ 本期 16 款(按视频出场顺序) Kimi 2.6|MiniMAX M3|Mimo 2.5 Pro|Gemini Pro 3.1|Gemini Flash 3.5 DeepSeek V4 Pro|GLM 5.1|Claude Sonnet 4.6|Qwen 3.7 MAX Claude Opus 4.6(4.7 推出后)|Composer 2.5|Opus 4.7 Claude Opus 4.6|Codex 5.5|Claude Opus 4.8|5.5 Pro ━━━━━━━━━━━━━━━━ 数据来源 团队内部网关近 30 天实际调用见置顶评论。