gemma系列小yellow文写出来能读下去 gemma4 31b,30token/s gemma4 26b a4b,110token/s gemma不爱写长一些,爱偷懒 qwen3.6 35b a3b,15token/s,优化后可以更高 小说质量ok,但是thinking部分太长太占时间,小说发散性不强,qwen别的模型表现都更差一些。 综合下来,gemma4 26b a4b性价比最高。 #本地部署 #本地部署ai #ai小说
gemma系列小yellow文写出来能读下去 gemma4 31b,30token/s gemma4 26b a4b,110token/s gemma不爱写长一些,爱偷懒 qwen3.6 35b a3b,15token/s,优化后可以更高 小说质量ok,但是thinking部分太长太占时间,小说发散性不强,qwen别的模型表现都更差一些。 综合下来,gemma4 26b a4b性价比最高。 #本地部署 #本地部署ai #ai小说