这个是有可能改变汉字命运的。
完全信息化非常容易了呢
或者可以做中文操作系统底层技术突破口 好是好,有利也有弊。
假如汉字能够容易造,象输入英文字母构成单词那样简单,确实是解决了汉字构字问题。但是,那种如手随写汉字,异体字别体字泛滥成灾的年代也就到来了。汉字想言规范化,定量化,恐怕是不可能了。——这下可要苦恼了字典了,曾经的10字都收录不了,将来的百万、千万字该如何?——13亿人呀,一人一字(不为别的,就为自己的名字),就是……,哎,不敢去想。好在没有计算机及网络的年代,人再多,造字再多,都因无法流通而消失。网络时代,该如何控制流通?
[ 本帖最后由 星空一号 于 2011-5-5 23:31 编辑 ] 原帖由 mm123 于 2011-5-5 22:25 发表 http://www.pkucn.com/images/common/back.gif
是的。
这个是有可能改变汉字命运的。
完全信息化非常容易了呢
或者可以做中文操作系统底层技术突破口
这个恐怕改变不了汉字的命运。。。
对于汉字,还是偏旁部首更重要。汉字的未来,我个人比较倾向于把“形声字”进行到底。实际上会怎么样,还要我的儿孙烧纸告诉我。:D
拓扑编码,也就是一解眼下之需罢了。或者说,目前,研究汉字,还可以解决不少人的就业问题。
[ 本帖最后由 jr0jr 于 2011-5-6 00:07 编辑 ]
(五)第一套拓扑元集
这一点很受“井田汉字”的启发。
不太相同的地方是,这里的拓扑元除了横平竖直以外,还有斜笔。拓扑元除了结构以外,还有朝向。比如,
这些结构就具有相似的特性。可以通过给出一个旋转方位角来解决,比如,以45度为一个单位。所以,和井田字全部可能的64种笔划组合相比,拓扑元只有如下几种:
上图其实和井田字实际使用的20字元一一对应,如图:
[ 本帖最后由 jr0jr 于 2011-5-7 02:23 编辑 ]
关于“T”结点
原帖由 jr0jr 于 2011-5-6 00:41 发表 http://www.pkucn.com/images/common/back.gif
这一点很受“井田汉字”的启发。
不太相同的地方是,这里的拓扑元除了横平竖直以外,还有斜笔。拓扑元除了结构以外,还有朝向。比如,
这些结构就具有相似的特性。可以通过给出一个旋转方位角来解决 ...
关于“T”结点,你只准备谈“横竖组合”、“撇捺组合”吗?
你发现我把你其它的组合删掉了吧? 因为它们只是相似,而不是完全一致。当然,我们可以使用下标、细分类。比如这一累叫T,有从T0一直到T11,11个子拓扑。但是这样,拓扑元实际的个数就增加了。它们不再是通过旋转动态得到的,而是通过直接编码得到的。所以,我的想法是,比如单人旁,我可以先把“—”旋转45度,然后按上下结构的T进行组合。语法就是:
T(,#) 或者 T(,),这样,0°和终结符#等效。
===================================
函数又、又、又写错了~~~ 现已改正~~~
[ 本帖最后由 jr0jr 于 2011-5-7 21:12 编辑 ] 当然,上述的方法只是其中一种。
再者就是使用更加复杂的“米田”栅格,或者全交叉栅格。那基础拓扑元的个数就要大大增加了。。。
[ 本帖最后由 jr0jr 于 2011-5-6 04:03 编辑 ] 楼主在搞“汉字拓扑学”#^_^# 请问诸位坛友,谁能搞到这两篇2010年华南理工大学的博士论文啊?《基于拓扑学和统计学的无字库汉字智能造字研究》以及《认知模式识别理论及无字库智能造字研究》 小生拜谢!!
。。。
看来说培养个把硕士生还不算得什么。
[ 本帖最后由 jr0jr 于 2011-5-6 03:36 编辑 ] 原帖由 wangs 于 2011-5-6 03:16 发表 http://pkucn.com/images/common/back.gif
楼主在搞“汉字拓扑学”#^_^#
汉字拓扑学,是一门科学。拓扑码只是基于这门学问的其中一个应用技术而已,细枝末节,雕虫小技。 原帖由 jr0jr 于 2011-5-6 03:04 发表 http://www.pkucn.com/images/common/back.gif
你发现我把你其它的组合删掉了吧? 因为它们只是相似,而不是完全一致。当然,我们可以使用下标、细分类。比如这一类叫T,有从T0一直到T11,11个子拓扑。但是这样,拓扑元实际的个数就增加了。它们不再是通过旋转动态 ...
再想想,也许直接增加拓扑元的个数比增加旋转语法要好呢?如果增加一个旋转指令,那么对应360°/45°,分辨率就是8,对应每个粗操作,都要有多余3 bits。事实上,很多拓扑元没有那么多旋转的可能,而且对于很对称的,旋转90°和旋转180°、270°是一样。所以,如果可以针对每个基础拓扑元的有效角度分别编码,也许不是个坏主意呢?
对 20楼的插话
原帖由 jr0jr 于 2011-5-6 00:41 发表 第20楼http://www.pkucn.com/images/common/back.gif这一点很受“井田汉字”的启发。
不太相同的地方是,这里的拓扑元除了横平竖直以外,还有斜笔。拓扑元除了结构以外,还有朝向。比如,
(T 形字符的各种方向符号)
这些结构就具有相似的特性。可以通过给出一个旋转方位角来解决 ...
1,金岷氏力挺 jr0jr 先生 利用汉字的拓扑结构属性,和拓扑运算 来表示汉字字形的探索。并且关注网友们对各自的 汉字构字表达式、构字运算法的 论述,从中吸取学术营养。
2,就金岷氏曾经蹚水摸石头的经历(可惜还没有过河)所感,用形式语言可以把汉字的字形构字算式表示出来;但是自身能力所限,表达不完善——汉字是一个二维结构的字符,除了基础字元的“相(形)”信息之外,还有“位”信息;如何在形式语言表达式里,体现出“位”的算法,困扰了金岷氏很久(多年来并未再专门研究)。愿 jr0jr 先生在研究的起步阶段就开始考虑“位”算法。或许,金岷氏这段话是自个儿的井蛙之见,受到自己知识机构和思维方式的限制,没考虑好“位”算法;而别的研究者已经解决了。算是先蹚了一步的、未摸到石头的人,对青年一代学者的期望吧。 偶数学水平停留在中学阶段,不过,看懂这个拓朴文字好像还绰绰有余啊,嘿嘿,jj,你加油啊,等我看不懂了,我觉得真水平应该就来了
感谢金前辈的鼓励!
让我们大家把这个汉字游戏玩出滋味来!(六)第二套拓扑元集
下面是一个只有两元操作的拓扑元表,分别用不同的颜色区分开。这组拓扑元主要依据彼此的连接关系建立,不需要使用任何表示“旋转”的附加指令。唯一要说明的是,第一行第一个是空结构,凡是操作引用此拓扑元,相应的操作即为空。第二行反映的是横、竖为主的井田结构。第三行反映的是撇、捺笔划,以及半包围结构。这个表的用心在于,构造一个在微观和宏观下都有意义的拓扑关系图。比如第三行第一个,在微观下可以表示㇓或㇒,以及它们的组合,在宏观下可以表示⿸。再如,第二行第七个,在微观下可以表示十,在宏观下可以表示⿻。
这个表里拓扑元还有很多冗余性。比如,通过使用空结构,可以有11种不同的方式(第一行第二个到第十一个)去构造一个“一”结构。再如,可以有2种方式(第二行第七个和第三行第九个)去合并两个宏拓扑,等效于⿻操作。
这个表是一晚上时间拍拍脑袋得到的结果,想必有很多问题。希望得到大家的批评和指正!多谢多谢!
[ 本帖最后由 jr0jr 于 2011-5-7 03:19 编辑 ]