文心一言一次可以输入多少字

作者:文心一言一次可以输入多少字

100 万 tokens(token),不是 100 万字。 关键在于:token ≠ 字。中文、英文、代码占用 token 不一样。 内容 1M token 大概能放多少 中文 50万–100万汉字 英文 70万–150万单词 中英混合 60万–120万字符 代码 30万–80万行(视复杂度) 中文 vs token 的关系 中文通常: 1 个汉字 ≈ 1–2 token 经验上: * 普通中文文章:1 token ≈ 0.8–1.5 个汉字 * 带标点、英文、emoji、链接会更耗 token 所以: 1M token ≈ 60万~100万中文字 保守估计可按: 70万汉字左右 来理解。 ⸻ 英文 vs token 的关系 英文一般: 1 token ≈ 0.75 个英文单词 所以: 1M token ≈ 75万单词左右 相当于: * 7–10 本长篇英文小说 * 或大量技术文档 举例: * 一本《三体》≈ 30万字 → 能放 2–3 本 * 一本网文 100 万字 → 基本接近上限 * 小红书账号 500–1000 篇内容 → 可以整体喂进去分析风格 模型 最大上下文 中文大概容量 大概相当于 ✨OpenAI GPT-5.5 ~1M tokens(部分场景) 60–100 万汉字 600–1000 篇小红书 ✨OpenAI GPT-4.1 / 4o 系列 128K–1M(版本不同) 8–80 万汉字 几本书到整个知识库 ✨Google Gemini 2.5 Pro 1M–10M tokens(实验级) 70 万–700 万汉字 整个公司文档库 ✨Anthropic Claude 4 / Claude 3.x 系列 200K–500K+ 15–40 万汉字 多本书/大型代码仓 ✨Meta Llama 4 / Llama 3.x 128K–10M(部分架构) 8–700 万汉字 取决于部署 ✨DeepSeek 系列 64K–128K+ 4–10 万汉字 大项目文档 ✨Qwen(通义千问)系列 32K–1M 2–80 万汉字 ✨国内长上下文代表之一 Kimi(月之暗面) 200K–2M(长文本强项) 15–150 万汉字 长文总结、论文、合同

📰 返回新闻列表