写字与打字的融合 林兵 北京神州林码电子中心
【摘 要】作者从1986年进入中文信息处理领域,90年前后进行了图像识别、手写识别、印刷汉字识别、语音识别、键盘输入、词法分析等方面的研究开发。本文主要介绍专利94117506.5的理论基础,供专家参考指导。 林码汉字输入方法是通过对纸、键盘、汉字等事物的结构和属性进行深入全面的类比研究, 提出的针对汉字键盘输入和联机手写输入的发明。发明把纸上的字格应用到键盘和手写输入板上, 对输入设备的人工操作区域进行划分, 与汉字的拆分呼应, 并归纳出它们之间在时空属性上的对应关系, 由此形成的编码体系缩小了手写与敲键的差异, 具备易学性和高效性, 可以解决计算机汉字输入的难题。 作者从 1986年进入中文信息处理领域,90年前后进行了图像识别、手写识别、印刷汉字识别`、语音识别、键盘输入、词法分析等方面的研究开发。本文介绍发明专利94117506.5的理论基础,请有关专家参考指导。目前,伴随手持移动产品的普及,笔输入产品和技术的需求正在逐渐增大;如果笔输入效率能够和键盘输入效率基本持平,则手写笔有望成为真正实用的输入工具,否则其使用范围将受限制。本文主要内容完成于约十年以前,对于字形输入技术的展望依然存在:跨平台、跨设备、微内核、动态码长、动态组码、写打合一等。 林码汉字输入方法是针对汉字键盘输入和联机手写输入的发明。 本发明的任务是 :1. 解决汉字编码中普遍存在的易学, 易用与高效之间的矛盾, 找到一种同时具备笔画码的易学性, 又具备字根码的高效性的编码方案;2. 缩小手写与敲键之间的差异;3. 使编码过程符合人的思维习惯;4. 使编码符合文字规范;5. 使编码符合人机工程的研究结果;6. 建立一套统一, 完备的文字特征描述体系, 以适应大字符集中各种的文字符号的需要。为了实现这个任务 , 本发明对纸, 笔, 键, 字诸事物各自内在的特征属性, 以及各事物相互之间的关系做了深入全面的类比性研究, 由此总结出了它们之间在组成结构, 时间属性, 空间属性等方面存在的微妙而客观的对应关系。利用这种对应关系便形成了一个新的汉字编码体系。为了写好汉字 , 前人总结了很多方法, 其中之一是在学写汉字的初期使用字格。使用字格可以帮助初学者更好地掌握汉字的间架结构, 合理调整汉字部件的布局。字格的种类不少, 常见的有田字格, 井字格, 米字格等。字格在其它领域的应用也比较广泛, 如英文书法使用的四线格; 音乐曲谱使用的五线谱, 六线谱; 等等。汉字是二维平面上的图形 , 每个字根, 每个笔画都不是完全独立的, 而是相互关联的, 这体现在它们之间的相对位置关系上。使用字格的目的就是为了确定这种位置关系。举一个简单的例子, 可以说明字根之间, 笔画之间的位置关系及其重要性。"王", "木", "林" 三个字的第一笔画都是横, 孤立地看它们是相同的, 但是从字的整体来看, 它们之间存在差别。如果在字格中书写三字之一, 只需写完第一笔, 旁人就可以判断出要写的字是哪一个, 其中的道理不言自明。现有的各种方案对汉字内字根 , 笔画间的二维特征应用得都不充分, 五笔字型的末笔字型识别码是针对汉字二维特征设计的, 但是效果不理想,不易掌握。在上面的例子中 , 为什么根据一笔能够做出判断? 除了汉字结构的背景知识, 字格在其中发挥了很大作用, 它对一个笔画的空间位置做了一种限定, 任意的一笔都与其上下左右的其它笔画相互配合, 共同组合成一个整字。如果没有字格, 在白纸上就很难判断。同样的道理, 一个圆圈只有在五线格中才能代表一个确定的音高。写字过程是在纸面上一笔一笔 , 一根一根地书写; 敲字过程是在键盘盘面上一键一键地敲击。纸面上可以画出字格, 键盘盘面上是否也能画出"字格", 使得 "写字" 能够在键盘上进行?本发明的思路就是把纸面上的字格搬到键盘盘面上来。 纸面上的字格把一个写字空间分为若干个小的区域 , 每个区域和区域之间有特定的空间位置以及位置关系, 这种位置关系可以和汉字的组件及组件之间存在的空间位置关系相互对应。键盘上也应该有 "字格" 和汉字建立类似的对应关系。通过研究 , 本发明对汉字和键盘在三方面做了类比:1. 在结构上, 根据客观事物可分割原理, 汉字和键盘都可以划分成更低一级的组成单位;2. 在空间上, 汉字是平面图形, 具有平面特征; 键盘是在平面上排列布局的, 也具有平面特征;3. 在时间上, 汉字的组成部件书写时有时间顺序, 键盘的键位在操作时也有时间上的次序。综上所述 , 本发明的总体构思是: 既然汉字是可以拆分的, 而且纸面上的书写区域也可以划分成字格, 那么键盘的盘面也应该加以划分; 汉字可以多级拆分, 字格可以多级划分, 键盘也可以多级划分; 汉字组成单位在时间和空间上的特征属性可以由键盘组成分区在时间和空间上的特征属性来反映, 从而达到汉字键盘编码输入的目的。键盘分区以后 , 汉字部件的间隔就非常简单自然, 这同时也为汉字特征码表提供了更大的自由度。对于单体字, 码表中可以存储该字的笔画特征或者其它特征; 对于合体字, 就可以只存储字根序列信息和字根位置信息, 合体字输入时可以是所有组成部件的全特征之和, 也可以是部分部件的部分特征之和。动态组合式编码使汉字编码的灵活性很大。字格的概念同样可以引入手写输入设备中。将手写面板上一个整字的手写输入区域划分成若干个子区域 , 每个区域对应一种汉字组件的空间位置, 书写时根据笔画的位置写入相应的子区域中。字格的引入可以简化书写过程, 不必严格一笔不缺, 可以允许笔画的取舍。本发明经过研究认为纸张 , 普通键盘和手写输入板, 以及屏幕键盘, 软键盘, 触摸屏, 数字化仪等计算机外设有一个共性, 它们都是一种记录或感知空间位置的工具, 通过不同的位置或位置的变化表现信息或转化信息。其区别是对位置感知的精度不同, 以适应不同应用场合的需要。键盘的精度较低, 但易于定位; 手写输入板精度较高, 书写时不易精确定位。纸张上的字格可以直接应用到手写输入板上, 应用到键盘上时要做一些变通, 下文将有详述。输入时, 键盘上表示相同位置但不同笔向的一组键位在手写输入板上缩为一个区域, 这个区域内可以表现不同的笔画方向。在其它方面, 比如计算机内部的码表查找转换处理都是类似的。所以本发明从本质上统一了汉字手写和击键的操作。本发明也可以用来输入其它文字符号, 比如日文假名; 英文字母也可以拆分成笔画段, 使用本发明输入。 本方案的优点和效果 :1. 使用键盘字格自然区分各字根的编码, 并反映字根之间的位置关系, 既全面使用了字根特征又不增加编码难度, 也保留字根了类编码的高效性; 2.可以使用键盘字格描述汉字笔画, 充分利用笔画之间的平面特征, 克服传统笔画类编码低效的缺点, 保留笔画类编码的易学性;3. 使用键盘字格缩小了手写和敲键的差异, 符合人的思维习惯, 符合文字规范, 也符合人机工程学的研究结果;4. 手写输入板使用字格可以减少笔画书写个数, 提高输入效率和识别率;5. 使用动态组合码表, 使编码灵活性大, 冗余性大, 码长组合变化多;6. 特征描述和分类能力强, 可以用于大字符集中各种文字符号的编码输入。图 1 为输入设备人工操作区域, 可以是键盘盘面, 手写输入板等;图 2 为对人工操作区域上下分区;图 3 为对人工操作区域左右分区;图 4 为对人工操作区域上下左右两次分区;可以认为图 1 至 图 4 对操作区域的划分就是将纸面上的字格概念移植到计算机输入设备上来。输入举例: 汉:左上丶、右上乙 林:左中一、右中一 环:左上一、右上一 打:左中一、右上一 输入设备人工操作区域 (键盘盘面、手写输入板、触摸屏等) |
图 1 图 2 图 3图 4乙 | 丶 | 丿 | 丨 | 一 | 一 | 丨 | 丿 | 丶 | 乙 | 乙 | 丶 | 丿 | 丨 | 一 | 一 | 丨 | 丿 | 丶 | 乙 | 乙 | 丶 | 丿 | 丨 | 一 | 一 | 丨 | 丿 | 丶 | 乙 |
|