本月在Claude 花上1000块后的几个思考

作者：本月在Claude 花上1000块后的几个思考

注：本文章为作者口述、AI 辅助撰写 1. 关闭"数据用于训练" 进入任何 AI 工具，第一件事就是找到设置里"数据用于改进 AI"的选项，关掉。法律文件、客户信息、内部备忘录不能让 AI 公司拿去训练模型。 2. 不同 AI 应对不同场景不要期待一个 AI 或者模型是全能。我现在的组合是： Claude 用于构思、讨论方案、执行。我会把问题丢给它，来回对话，通常能理清思路。腾讯元宝用于搜索实务信息。尤其是微信文章、实操细节这种东西，可以在元宝里找到某个问题的实操信息，然后把整理好的内容输给 Claude 继续分析。 Gemini Pro 用于逐字翻译。前提是指令要足够清楚。比如我需要把英文合同条款翻成中文，保留法律术语的准确性，Gemini 的表现就很稳定。 3. 不同模型应对不同复杂度开始重度使用 AI 以后，成本成了一个绕不开的问题。思考探索性任务用更强的模型。比如分析一个问题的多个角度、设计一个研究方案，我用 Claude Opus。简单的学习任务用 Haiku。查个词、总结一段文章、问一些格式问题，Haiku 足够了，速度还快。 4. Fact check 不能完全信任 AI 解决方案：（1）小步多次，而不是一次性要求不要要求 AI 一次帮你 fact check 50 个信息点。分成 5 次，每次 10 个。（2）可以用于归纳，但必须逐个验证 AI 可以整理思路、总结大方向。但如果结论涉及具体数据或法律细节，必须自己过一遍或者用其他来源验证。我在做 FAFSA 州政策研究时，AI 的总结很有用，但每一个州的具体规定我都要查各州政府网站确认。（3）ai 做完检索，先让他自己 fact check 一遍。有时候能发现一些错误。 5. 智力变得不那么重要用不同的 AI做同一个任务，输出质量可能差一倍。这意味着工具的能力差距可能超过人的能力差距。以前的逻辑是：你的智力水平决定你的工作质量。现在变成了：选的工具决定你的工作质量。还在想的问题：每个AI 的能力边界在哪里，更适合什么样的任务？什么样的指令可能节省 token（大量使用以后？多工具编排有没有更高效的方式？怎么在看起来很对的答案里发现隐藏的错误？有没有什么规律？ AI 增加了我的工作要求（以前只要 80 分，现在要花更多时间做到 100 分）和工作时长。不可避免带来了对于算力的更高要求。对于算力增长的需求可能是无止境的。

⚡ 技术纵深 · 洞见未来

本月在Claude 花上1000块后的几个思考

深度推荐 · 延伸阅读