月度归档: 2021 年 6 月

2 篇文章

搜狗scel细胞词库文件详解
搜狗的细胞词库文件是搜狗自创的一种二进制格式。其中所有字符都使用unicode编码,固定2字节。几乎所有的数字都使用16位无符号整数。字符和数字都使用小端模式存储。 词库信息 Scel格式中包含的信息包含词库名,词库类型,词库信息,词库示例。这些信息都使用unicode编码,每个字符占用两个字节。实际读取的时候,以python为例,只需读取2个字节…
thumbnail
Rime使用体验
在上个世纪,计算机刚被引入中国的时候,人们都被这灵巧而又强大的机器所震撼了。最基础的算数功能就不用说了,甚至还可以处理文本,打表格。即使是在几十年后的今天,计算机的底层架构也和最初的计算机无异。但是这神奇的机器在中国的推广遇到了极大的阻力,而这阻力不在计算机身上,这阻力竟深深地源自咱几千年的中华文明。 这个问题就是汉字的输入。 计算机的输入方法普遍…