编辑
2024-07-20
未分类
00
请注意,本文编写于 90 天前,最后修改于 90 天前,其中某些信息可能已经过时。

目录

弃坑搜狗!将搜狗个人词库和所有官方词库导入微软输入法详细教程,附工具及已整理词库
参考资料

弃坑搜狗!将搜狗个人词库和所有官方词库导入微软输入法详细教程,附工具及已整理词库

本帖用到的所有工具:搜狗输入法智慧版+深蓝词库转换+ReNamer+系统Powershell。

1.备份搜狗个人词库 ①.最新版的搜狗输入法备份个人词库的加密方式跟老版本应该不一样,我测试了好几个版本的搜狗,备份后都没法用深蓝转换,最后发现用搜狗输入法智慧版可行,下载地址 http://pinyin.sogou.com/windows/,网页最右下方下载。

②.搜狗智慧版安装完成后先同步个人词库,然后再导出备份: 1.png

③.将导出的备份用深蓝词库转换工具转换成搜狗拼音txt格式备用。

2.下载搜狗官方词库 ①.用工具批量下载搜狗推荐词库或全部词库,下载需要时间,完成后工具自动退出,工具下载于https://www.qqtn.com/down/666848.html: 2.png

②.打开ReNamer,将下载的所有文件夹全选后拖入rename中,rename中全选所有文件后右键-扩展外壳-从剪切板复制文件,然后新建个文件夹,粘贴即可,这样就能把所有词库文件集中在一个文件夹里,方便后续操作。 4.png

③.用深蓝词库将搜狗词库转换成txt。只下载搜狗推荐词库的话,总共400多个词库文件,可以全选后一起拖入深蓝中,选择搜狗细胞词库scel → 搜狗拼音txt,然后点转换,会自动合并成一个txt。下载所有词库的话,总共接近1900个词库,文件太多深蓝无法一次性合并,我是分三次转换的,中途有个词库报错(217教育局股室.scel),把报错词库删除后再来,然后把分批转换的txt合并到一起。

20231016220632.png

3.词库文本去重排序 ①.快捷键Win+R输入powershell打开(没有powershell的在windows可选功能中添加),使用Powershell命令去重排序,命令格式(在文本中把路径都改好后再复制到powershell窗口,回车执行后等新命令行出来后在关闭):

sh
Get-Content 原TXT路径 | Sort-Object | Get-Unique | Set-Content 新TXT路径

3.png

②.搜狗个人词库和官方词库可以合并到一个文本中一起导入,也可以自己设置词条位置(参照下一步)后分开导入,分开导入的话,切记先导入个人词条!(个人词条数据一般不太多,不会造成设置界面卡死)

4.导入微软拼音 ①.用深蓝将去重后的txt转换Win10微软拼音(自定义短语) 编码全拼(不用微软拼音的,转换成自用的输入法对应的格式也可以),转换时可根距个人习惯调整词条在候选项中的位置(深蓝词库转换-高级设置-词频生成设置),比如搜狗个人词库设置位置1,其它词库设置位置3等,个人词库不多的可以不用管,默认设置即可,视个人情况自行调整。

20231017152234.png

②.转换完成后在微软拼音设置-词库和自学习-用户定义的短语中导入。

20231017002946.png

③.微软拼音自定义短语导入后,因数据过多设置界面会卡死,留意下个人词库目录,只要目录下多出个ChsPinyinEUDPv1.lex的大文件就说明导入成功了,直接关闭设置界面即可!个人词库目录:

sh
C:\Users\用户名\AppData\Roaming\Microsoft\InputMethod\Chs

④.导入自定义短语后,再打开自定义短语设置界面会卡死(还是数据太多的锅),把个人词库目录下的ChsPinyinEUDPv1.lex文件删除就可以了,删除后之前导入的都会清空,要重新导入。

之前导入过网上的SuperRime拓展词库 for Win10拼音版(600万词-含BetterRime)-v20.3,结果发现打字很多时候出现一堆乱七八糟的候选项,反而不太方便,就自己整词库了,不喜勿喷~~

所有工具及自己下载搜狗词库数据制作的词库已上传度盘,链接:

sh
https://pan.baidu.com/s/161AkqAYEs8JJG0XsgtqFhQ?pwd=beta

PS:不推荐导入过多的词库,词库并不是说越大越好,词库越大,打字出现的词越多,很难保证都是自己需要的,适合自己的才是最好的!

强烈建议除了搜狗的个人词库外,其它词库按个人需求找搜狗对应的词库打包导入。

参考资料

本文作者:任浪漫

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC-ND 4.0 许可协议。转载请注明出处!