ai语音输入法本身技术难度不高,大部分也就是套了个whisper的壳,有一些还按照订阅收费 真是欺负老实人 这半年多,我下载了很多ai语音输入法,包括你在这个平台上能看到的所有软件,大部分用了两天就卸载了 后面看到voiceink这个项目,除了常规的whisper,还加入了剪贴板上下文和屏幕上下文增强,并可以接入llm的api去进行增强转录 这两个功能可以极大增强语音转录的准确性,比如我的页面上有“docs”“logs”“agents”的文件夹,就可以把它们精准转录出来(不会变成dogs,因为有屏幕上下文感知),而无需手动二次修改——二次修改很影响语音输入法的体验 另外更重要的是,原项目还是开源的,你可以自己编译成pro版本的app 不过可惜的是只有英文版,而且ui的内容也都是写死在代码里没有做映射,两个月前我花掉了cursor一个月的pro额度,vibe的一个中文pro版(如图所示) 目前已经高频使用2个多月 需要的指路:cat-xierluo/Voicelnk-CN star多的话,我会及时更新上游特性 #ai #语音输入法