阅读文章

[转载]汉字拓扑码(兴趣组)【与输入法无关】

16-30楼

[日期:2013-01-18] 来源:北大中文论坛  作者: [字体: ]

mm123 发表于 2011-5-5 22:25:55

是的。
这个是有可能改变汉字命运的。
完全信息化非常容易了呢

或者可以做中文操作系统底层技术突破口

 

星空一号 发表于 2011-5-5 23:19:57

好是好,有利也有弊。
假如汉字能够容易造,象输入英文字母构成单词那样简单,确实是解决了汉字构字问题。但是,那种如手随写汉字,异体字别体字泛滥成灾的年代也就到来了。汉字想言规范化,定量化,恐怕是不可能了。——这下可要苦恼了字典了,曾经的10字都收录不了,将来的百万、千万字该如何?——13亿人呀,一人一字(不为别的,就为自己的名字),就是……,哎,不敢去想。好在没有计算机及网络的年代,人再多,造字再多,都因无法流通而消失。网络时代,该如何控制流通?

[ 本帖最后由 星空一号 于 2011-5-5 23:31 编辑 ]

 

jr0jr 发表于 2011-5-5 23:49:11

原帖由 mm123 于 2011-5-5 22:25 发表 http://www.pkucn.com/images/common/back.gif
是的。
这个是有可能改变汉字命运的。
完全信息化非常容易了呢

或者可以做中文操作系统底层技术突破口

这个恐怕改变不了汉字的命运。。。

对于汉字,还是偏旁部首更重要。汉字的未来,我个人比较倾向于把“形声字”进行到底。实际上会怎么样,还要我的儿孙烧纸告诉我。:D

拓扑编码,也就是一解眼下之需罢了。或者说,目前,研究汉字,还可以解决不少人的就业问题。

[ 本帖最后由 jr0jr 于 2011-5-6 00:07 编辑 ]

 

jr0jr 发表于 2011-5-6 00:41:19

(五)第一套拓扑元集

这一点很受“井田汉字”的启发。

不太相同的地方是,这里的拓扑元除了横平竖直以外,还有斜笔。拓扑元除了结构以外,还有朝向。比如,



这些结构就具有相似的特性。可以通过给出一个旋转方位角来解决,比如,以45度为一个单位。所以,和井田字全部可能的64种笔划组合相比,拓扑元只有如下几种:


上图其实和井田字实际使用的20字元一一对应,如图:



[ 本帖最后由 jr0jr 于 2011-5-7 02:23 编辑 ]

 

yywzw05 发表于 2011-5-6 03:00:25

关于“T”结点

原帖由 jr0jr 于 2011-5-6 00:41 发表 http://www.pkucn.com/images/common/back.gif
这一点很受“井田汉字”的启发。
不太相同的地方是,这里的拓扑元除了横平竖直以外,还有斜笔。拓扑元除了结构以外,还有朝向。比如,

这些结构就具有相似的特性。可以通过给出一个旋转方位角来解决 ...

关于“T”结点,你只准备谈“横竖组合”、“撇捺组合”吗?

 

jr0jr 发表于 2011-5-6 03:04:49

你发现我把你其它的组合删掉了吧? 因为它们只是相似,而不是完全一致。当然,我们可以使用下标、细分类。比如这一累叫T,有从T0一直到T11,11个子拓扑。但是这样,拓扑元实际的个数就增加了。它们不再是通过旋转动态得到的,而是通过直接编码得到的。

所以,我的想法是,比如单人旁,我可以先把“—”旋转45度,然后按上下结构的T进行组合。语法就是:

T(,#) 或者 T(,),这样,0°和终结符#等效。
===================================
函数又、又、又写错了~~~ 现已改正~~~

[ 本帖最后由 jr0jr 于 2011-5-7 21:12 编辑 ]

 

jr0jr 发表于 2011-5-6 03:15:06

当然,上述的方法只是其中一种。

再者就是使用更加复杂的“米田”栅格,或者全交叉栅格。那基础拓扑元的个数就要大大增加了。。。


[ 本帖最后由 jr0jr 于 2011-5-6 04:03 编辑 ]

 

wangs 发表于 2011-5-6 03:16:46

楼主在搞“汉字拓扑学”#^_^#

 

jr0jr 发表于 2011-5-6 03:20:34

请问诸位坛友,谁能搞到这两篇2010年华南理工大学的博士论文啊?《基于拓扑学和统计学的无字库汉字智能造字研究》以及《认知模式识别理论及无字库智能造字研究》 小生拜谢!!

。。。
看来说培养个把硕士生还不算得什么。

[ 本帖最后由 jr0jr 于 2011-5-6 03:36 编辑 ]

 

jr0jr 发表于 2011-5-6 03:32:12

原帖由 wangs 于 2011-5-6 03:16 发表 http://pkucn.com/images/common/back.gif
楼主在搞“汉字拓扑学”#^_^#

汉字拓扑学,是一门科学。拓扑码只是基于这门学问的其中一个应用技术而已,细枝末节,雕虫小技。

 

jr0jr 发表于 2011-5-6 05:00:32

原帖由 jr0jr 于 2011-5-6 03:04 发表 http://www.pkucn.com/images/common/back.gif
你发现我把你其它的组合删掉了吧? 因为它们只是相似,而不是完全一致。当然,我们可以使用下标、细分类。比如这一类叫T,有从T0一直到T11,11个子拓扑。但是这样,拓扑元实际的个数就增加了。它们不再是通过旋转动态 ...

再想想,也许直接增加拓扑元的个数比增加旋转语法要好呢?如果增加一个旋转指令,那么对应360°/45°,分辨率就是8,对应每个粗操作,都要有多余3 bits。事实上,很多拓扑元没有那么多旋转的可能,而且对于很对称的,旋转90°和旋转180°、270°是一样。所以,如果可以针对每个基础拓扑元的有效角度分别编码,也许不是个坏主意呢?

 

金岷彬 发表于 2011-5-6 06:31:44

对 20楼的插话

原帖由 jr0jr 于 2011-5-6 00:41 发表  第20楼http://www.pkucn.com/images/common/back.gif
这一点很受“井田汉字”的启发。

不太相同的地方是,这里的拓扑元除了横平竖直以外,还有斜笔。拓扑元除了结构以外,还有朝向。比如,


(T 形字符的各种方向符号)

这些结构就具有相似的特性。可以通过给出一个旋转方位角来解决 ...

1,金岷氏力挺 jr0jr 先生 利用汉字的拓扑结构属性,和拓扑运算 来表示汉字字形的探索。并且关注网友们对各自的 汉字构字表达式、构字运算法的 论述,从中吸取学术营养。

2,就金岷氏曾经蹚水摸石头的经历(可惜还没有过河)所感,用形式语言可以把汉字的字形构字算式表示出来;但是自身能力所限,表达不完善——汉字是一个二维结构的字符,除了基础字元的“相(形)”信息之外,还有“位”信息;如何在形式语言表达式里,体现出“位”的算法,困扰了金岷氏很久(多年来并未再专门研究)。愿 jr0jr 先生在研究的起步阶段就开始考虑“位”算法。或许,金岷氏这段话是自个儿的井蛙之见,受到自己知识机构和思维方式的限制,没考虑好“位”算法;而别的研究者已经解决了。算是先蹚了一步的、未摸到石头的人,对青年一代学者的期望吧。

 

莫蓝sarah 发表于 2011-5-6 07:23:12

偶数学水平停留在中学阶段,不过,看懂这个拓朴文字好像还绰绰有余啊,嘿嘿,jj,你加油啊,等我看不懂了,我觉得真水平应该就来了

 

jr0jr 发表于 2011-5-6 07:25:55

感谢金前辈的鼓励!

让我们大家把这个汉字游戏玩出滋味来!

 

jr0jr 发表于 2011-5-6 07:31:16

(六)第二套拓扑元集

下面是一个只有两元操作的拓扑元表,分别用不同的颜色区分开。这组拓扑元主要依据彼此的连接关系建立,不需要使用任何表示“旋转”的附加指令。唯一要说明的是,第一行第一个是空结构,凡是操作引用此拓扑元,相应的操作即为空。第二行反映的是横、竖为主的井田结构。第三行反映的是撇、捺笔划,以及半包围结构。



这个表的用心在于,构造一个在微观和宏观下都有意义的拓扑关系图。比如第三行第一个,在微观下可以表示㇓或㇒,以及它们的组合,在宏观下可以表示。再如,第二行第七个,在微观下可以表示十,在宏观下可以表示

这个表里拓扑元还有很多冗余性。比如,通过使用空结构,可以有11种不同的方式(第一行第二个到第十一个)去构造一个“一”结构。再如,可以有2种方式(第二行第七个和第三行第九个)去合并两个宏拓扑,等效于操作。

这个表是一晚上时间拍拍脑袋得到的结果,想必有很多问题。希望得到大家的批评和指正!多谢多谢!

[ 本帖最后由 jr0jr 于 2011-5-7 03:19 编辑 ]


上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9..] [14] 下一页   
【内容导航】
第1页:说明
第2页:1-15楼
第3页:16-30楼
第4页:31-45楼
第5页:46-60楼
第6页:61-75楼
第7页:76-90楼
第8页:91-105楼
第9页:106-120楼
第10页:121-135楼
第11页:136-150楼
第12页:151-165楼
第13页:166-190楼
第14页:191-205楼


阅读:
录入:湘里伢子

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:

下一篇:
相关文章      
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章