注册要海外手机号,网络要求很稳定,付费要境外信用卡,容易封号,大概因为这些,身边用过 Claude 的人真的不多。 但最近用下来,总会给我一些像人的惊喜: 比如我问它一个问题,回答里会带上一些我没问但其实正在想的东西,是我下一步要考虑的。有点像它在想:这个人问这个,大概是要去做什么,那顺带把那个也说了,问得越模糊,这个感觉越明显。 写作场景里也是这样。让它写一段话,不是给你一个开头铺垫、中间展开、结尾升华的很AI 的结构,而是直接把最核心的判断放在最前面,后面的内容是在支撑这个判断,语言是口语化的精简的,不是在填八股文。 编程也有类似的感觉。让它写一段功能,它给的代码通常会把一些你当时没想到、但之后大概率会踩的坑也处理掉,不是每次都这样,但出现的频率足够让人注意到。 还有一个细节是它的态度。它不太会在回答里反复确认"我理解你的意思是……"或者"以下是我的建议",就是直接说,少了很多包装,读起来反而更有信任感。 查了一下一些可能的原因,不确保真是因为这些: 1、Anthropic 在训练 Claude 时有一个核心理念叫"Constitutional AI",目标是让模型具备更深层的理解和推理,而不只是快速匹配答案,所以在处理模糊指令时会主动补全用户意图,而不是机械地字面执行。 2、Anthropic 训练时对高质量长文本有更强的偏重,比如书籍/论文/文学作品, GPT 的训练数据更广泛嘈杂,比如SEO文章和产品说明这些格式化的内容, 所以模型学到的不只是"说什么",还有"怎么说才有说服力"。 3、写作本质上是在传递某种感受或认知,而不只是组织信息,Claude 更倾向于先判断你写这段文字是要让读者产生什么感受,然后从这个目标反推用词、节奏和结构,GPT 更多是从输入的关键词和格式要求出发正向生成,这两种路径在短文本里差异不大,但在需要情感弧度的长文本里,前者明显更像人在写。 4、Anthropic 的核心团队里有大量哲学、认知科学背景的人,他们对"语言是什么"有更深的思考,会渗透到对模型能力的定义和评估标准里,"像人"本身就是一个重要维度,而不只是"准确"或"有用"。 当然这些都是个人感受,不同的使用场景可能差别很大,也可能是我用的任务类型刚好适合它。 有条件的话或许可以去试试,写作、复杂问题分析、编程这几个场景感觉最明显。 #大模型 #AI生成 #ai #人工智能发展