国内7大主流大模型RAG能力实测

作者:国内7大主流大模型RAG能力实测

今天来聊聊大语言模型超火的RAG技术,也就是Retrieval-Augmented Generation检索增强生成。简单说,它把大语言模型的生成和搜索引擎的检索能力融合,现在主流大模型基本都有这个“标配”。 最近有一个比较官方的rag能力测评,测评了7款国内主流大模型的RAG能力,从4个维度打分 📊【评测维度】 1️⃣ 基础质量:内容准不准、语法对不对、逻辑连不连贯 2️⃣ 丰富度/专业性:知识全不全、专业问题回答够不够深入 3️⃣ 有态度:能不能根据问题和需求,给出合适的情感和观点 4️⃣ 结构化:内容条理是否清晰,好不好懂 👉🏻文心一言:综合排名第一,在基础质量维度,生成内容的准确性极高,语法和逻辑方面近乎完美;丰富度/专业性上也表现出色,知识储备丰富,专业问题解答深入。 👉🏻Deepseek:位居第二,在专业性上表现突出,面对专业领域问题,能给出全面且深入的解答;结构化表达上也较为出色,输出内容条理清晰。 👉🏻豆包:排名第三,在有态度维度表现亮眼,回答能根据不同提问情境和用户需求,展现出恰当的情感倾向和观点,不生硬、很自然 综合下来看文心一言还算是比较不错的!可以去试试😋 #职场#干货分享 #AI#人工智能#AI工具#大模型#提示词#智能助手 #文心一言

📰 返回新闻列表