注:本文章为作者口述、AI 辅助撰写 1. 关闭"数据用于训练" 进入任何 AI 工具,第一件事就是找到设置里"数据用于改进 AI"的选项,关掉。法律文件、客户信息、内部备忘录不能让 AI 公司拿去训练模型。 2. 不同 AI 应对不同场景 不要期待一个 AI 或者模型是全能。 我现在的组合是: Claude 用于构思、讨论方案、执行。我会把问题丢给它,来回对话,通常能理清思路。 腾讯元宝用于搜索实务信息。尤其是微信文章、实操细节这种东西,可以在元宝里找到某个问题的实操信息,然后把整理好的内容输给 Claude 继续分析。 Gemini Pro 用于逐字翻译。前提是指令要足够清楚。比如我需要把英文合同条款翻成中文,保留法律术语的准确性,Gemini 的表现就很稳定。 3. 不同模型应对不同复杂度 开始重度使用 AI 以后,成本成了一个绕不开的问题。 思考探索性任务用更强的模型。比如分析一个问题的多个角度、设计一个研究方案,我用 Claude Opus。简单的学习任务用 Haiku。查个词、总结一段文章、问一些格式问题,Haiku 足够了,速度还快。 4. Fact check 不能完全信任 AI 解决方案: (1)小步多次,而不是一次性要求 不要要求 AI 一次帮你 fact check 50 个信息点。分成 5 次,每次 10 个。 (2)可以用于归纳,但必须逐个验证 AI 可以整理思路、总结大方向。但如果结论涉及具体数据或法律细节,必须自己过一遍或者用其他来源验证。我在做 FAFSA 州政策研究时,AI 的总结很有用,但每一个州的具体规定我都要查各州政府网站确认。 (3)ai 做完检索,先让他自己 fact check 一遍。有时候能发现一些错误。 5. 智力变得不那么重要 用不同的 AI做同一个任务,输出质量可能差一倍。这意味着工具的能力差距可能超过人的能力差距。以前的逻辑是:你的智力水平决定你的工作质量。现在变成了:选的工具决定你的工作质量。 还在想的问题: 每个AI 的能力边界在哪里,更适合什么样的任务? 什么样的指令可能节省 token(大量使用以后? 多工具编排有没有更高效的方式? 怎么在看起来很对的答案里发现隐藏的错误?有没有什么规律? AI 增加了我的工作要求(以前只要 80 分,现在要花更多时间做到 100 分)和工作时长。不可避免带来了对于算力的更高要求。对于算力增长的需求可能是无止境的。