【汉字字型唯一拆分技术】(原创)
第二版
提要:唯一拆分是只有一个结果的拆分,是用几条规则去保证拆分
的唯一性。根据汉字的基本结构,把上下结构分为平行、斗笠、固定笔
群三个部分, 再增添“⺁”为包围笔群,就能唯一拆字了。
【一】【三个定义】
1)基本笔画
━(提) 丨 丿 丶(捺) 乙亅
横 竖 撇 点 折(折:带钩提折弯的所有笔画)
2)笔群:不少于两笔的笔画群体,叫笔群。
单笔字符:重叠满足两笔。
飞笔:游离于一个字中的单笔叫飞笔。笔群前面的飞笔及夹在两个笔群之间的飞笔,纳入靠后的那个笔群,如“旧、副、鲁、候”:笔群后面的飞笔,纳入靠前的那个笔群,如“鱼、旦、札、忆”。
3)笔群只看形,与音义无关
【二】【拆字规则】原则是“全笔不断(里≠田+土),相交不拆(里≠曰+土),相连相离用规则”。
【1】【左右型字=左笔群+右笔群】
例:很=彳+艮,
树=木+又+寸,
滩=氵+又+亻+★。
(隹2测3摊4雠5)
【2】【上下型字=上笔群+下笔群】
A】平行:上下两部分被两条平行线段隔开。
例:旱=日+干,
鼻=自+田+丌,
亮=亠+口+冖+几。
(是2贯2鼻3亮4膏5)
B】斗笠:有斗笠样笔群在上面。
【上下型字=斗笠样笔群+斗笠下笔群】
例:分=八+刀,
夯=大+力,
爸=八+乂+巴
(卷2春2杀2圣2灸2癸2祭3奇3)
c】固定笔群45个:
日(曰冒上) 月(青下) 宀 艹 木,
虫
口 钅 敖 鹿,
冖 山 ⺮ 心 米,
禾 田 止 白 女,
寸 皿 少 罒 贝,
小
龙 衣 火 雨,
⺈ 爫 彐 廾,
土
灬 果 犬 亦,
冉
业 匕 目 习。
例:男= 田 + 力,
裘= ★ + 衣,
异= 巳 + 廾,
裳= ⺌ + 冖 + 口 + 衣。
注:固定笔群在三种情况下成为另外的笔群。
a 前 面 有 一 个 飞 笔 :日(旧亘);
b 被 一 个 单 笔 画 连 接 :目少(自雀);
c 被 一 个 单 笔 画 穿 插 :土木小(耂本朩)。
【3】【包围型字=包围笔群+被围笔群】
A】围三只角。
围左上角 :【厂⺁尸户】雀鬼死虍鹤存在
围右上角 :【弋戈勹】岛尧可焉司虱氧
围左下角 :【通式=X点,或X拆】进建起旭毪
B】围四条边。
围右边 :【丑2】哥3
围下边 :【凵山】
围左边 :【匚】
围上边 :【冂门乃】风2向2用2
C】全包围 :【囗】国2囱2面2
D】夹两腋 :【巫3】亟3乖3乘3
【4】【立品型字 = 上 + 下左 + (下中) + 下右】
例:轰=车+又+又,
雍=亠+乡+亻+★
【倒品型字 = 上左 + (上中) + 上右 + 下】
例:努=女+又+力,
舆=★+车+彐+★
(夜3雍4彘5想3兜4舆4 坐3芈3鼎3).
【5】开口:处于包围笔群开口面以下的笔群,只与被围者相关。
【开口下型字 = 包围 + 被围 + 围下笔群】
例:辱=厂+★+寸,
奥=★+米+大,
尧=★+兀,
感=戈++口+心。
(辱3盛3奥3勇2尧2感4)
【三】【几点说明】
【1】:结构是从文字学和称说发展过来的。文字学把音形义作为结构的单位;称说把称呼和读音作为结构的单位;唯一拆分把笔群的形体(不是象形的形)作为结构的单位。为了避免误解,唯一拆分把汉字的结构叫做“字型”.
【2】什么叫包围型字?包围型字就是一个笔群围住另一个笔群的四只角之一,或四条边之一,或全部围住了一个笔群(按照人们的习惯,“家写春”之类不在包围之列)。规定被围者是两个或两个以上的“横”或“竖”或一个“十”者,不是包围型字,如“目直真皿田”
【3】规定包围者、被围者各是一个笔群,互不混淆。不管围者与被围者接触得多么紧密,都要分开。“戊”中的丿被戈包围着,一个笔画不能成为笔群,是飞笔,因此“戊”是单一笔群。“戌戍成戎戒”的被围者都有两笔,都是笔群,所以这五个字,都是包围、被包围两个笔群的字。“感臧”都是四个笔群的复合型字,“戚咸威”是三笔群的复合型字。有了这个规定,“用角甩甭痈甬左右局寿斤后斥卮”就不会被歧义拆分了。
“存在”也那么处理就非常严谨,但与习惯冲突太大,为此,专门设置了“横撇竖”为包围笔群。
【4】三定义中:A)“亅”是拆,不是竖。B)“笔群不得少于两笔”,说明笔群中没有单一笔画。而“部件”、“字根”、“部首”中都有单一笔画。C)“笔群只看形,与音义无关”,排除了用字义拆字、用读音拆字、用象形拆字。只用笔群的形体拆字,让唯一拆分前进了一大步。
【5】:本系统使用GB2312字符集,将汉字分为“左右型字”“上下型字”“包围型字”“复合型字”“单一型字”五种,前三种是基础型。复合型字是由几种基础型构成的(品字型字就是其中之一)。单一型字是指在本系统内无法再拆分的字。
【6】