❓为什么你的 Codex + DeepSeek 读不了图? DeepSeek 本质上只能处理文字,你扔给它一张合同照片、一份 PDF 扫描件,它是无法处理的。 所以我们需要给 DeepSeek 配一个工具把画面里的文字提取出来。 我的思路是:每次遇到图片或 PDF,先在本机把文字提取出来,再把这段文字发给 DeepSeek。整个过程完全在本地完成,文件不会上传到任何地方。 整个过程都是让 Codex 自己把这些事情做完。一句代码都不需要写。 🖥️Mac 用户 如果你是 Mac,好消息来了,Mac 系统自带了一个叫 Vision 的识别引擎,不需要安装任何额外软件。 打开 Codex 对话框,直接输入: 帮我配置一个图片文字识别工具,用 macOS 自带的 Vision 框架,不需要联网,不需要安装额外软件。要求:能识别中英文,支持 PNG、JPG、HEIC 这些常见格式。 Codex 会自己写代码、自己编译、自己测试。 然后接着输入第二句: 我经常需要分析 PDF 和 Word 文档。帮我在本地配置好,让我拖进文件就能自动提取文字。所有处理都在本机完成,不上传文件。 两句话,图片和 PDF 的识别能力就都有了。 🖥️Windows 用户 如果你是 Windows,系统不自带识别引擎。但没关系——让 Codex 直接帮你装一个就行。 打开 Codex 对话框,输入: 帮我在本地安装一个 OCR 文字识别工具,用来识别图片里的文字。用 Tesseract,免费开源的,所有处理在本地完成,不要联网的方案。装好之后帮我把 PDF 和 Word 的文字提取也一起搞定。 Codex 会自动下载、安装、配置好 Tesseract 和相关依赖。你需要做的只是等它跑完,然后问一句「测试一下是否能运行」。 ❓为什么你的文件不会泄露? 这是很多法律人最关心的问题,我单独说清楚。 以上所有步骤,不管是 Mac 自带的识别引擎,还是 Windows 上装的 Tesseract,还是 PDF 的文字提取都在你自己的电脑上运行。你的文件从来没有被上传到任何一个云服务器。DeepSeek 收到的,是已经提取出来的纯文字,跟你手动打字发过去没有区别。 等于说,你在自己电脑上先把文件读了一遍,然后把文字描述转述给 DeepSeek 听。文件原件一直躺在你的硬盘里。 但是,如果文件里有当事人姓名、身份证号、合同金额这些隐私信息,直接发给 DeepSeek 还是有风险的。下一期我会讲怎么让 Codex 自动帮你脱敏,以及如何搭建一条「文件拖进去 → 自动脱敏 → 自动分析」的完整流水线。 法律科技 #Codex #律师日常 #AI工具配置 #PDF处理 #法律人AI工具 #howto用好AI