阅读文章

[转载]汉字拓扑码(兴趣组)【与输入法无关】

31-45楼

[日期:2013-01-18] 来源:北大中文论坛  作者: [字体: ]

yywzw05 发表于 2011-5-6 09:09:46

四面八方十六向

原帖由 jr0jr 于 2011-5-6 05:00 发表 http://www.pkucn.com/images/common/back.gif
再想想,也许直接增加拓扑元的个数比增加旋转语法要好呢?如果增加一个旋转指令,那么对应360°/45°,分辨率就是8,对应每个粗操作,都要有多余3 bits。事实上,很多拓扑元没有那么多旋转的可能,而且对于很对 ...

你看懂其中的IRPS了吗?

你不赞同我提八卦,反对俺说“拉丁字母与井田字元”的关系。
偶偏要说。

还记得吗?
http://www.pkucn.com/viewthread.php?tid=268011&extra=&page=1  
原帖由 班门斧 于 2011-4-20 10:59 发表 http://www.pkucn.com/images/common/back.gif
我们说汉字的构造是平面二维的,而英文(单词)的构造是一维线性的。前者用少数基本笔划在平面上四面八方十六向安置排布,构成汉字表示语义;后者用少数基本字母,在一个单方向上排成线性的一串以表达语义。

我还是东方的脑袋瓜儿,看一下咱们古代的割圆术:

四面八方十六向三十二隅.......

 

客串客串 发表于 2011-5-6 10:56:15

原帖由 jr0jr 于 2011-5-6 03:20 发表 http://www.pkucn.com/images/common/back.gif
请问诸位坛友,谁能搞到这两篇2010年华南理工大学的博士论文啊?《基于拓扑学和统计学的无字库汉字智能造字研究》以及《认知模式识别理论及无字库智能造字研究》 小生拜谢!!

知网有这两篇博士论文。前者作者是卢建平(2010),后者作者是梁添才(2008)。指导老师均为皮佑国。

 

jr0jr 发表于 2011-5-6 15:54:31

原帖由 客串客串 于 2011-5-6 10:56 发表 http://www.pkucn.com/images/common/back.gif

知网有这两篇博士论文。前者作者是卢建平(2010),后者作者是梁添才(2008)。指导老师均为皮佑国。


感谢客串先生援手!!

不过,我们说的不是一篇文章。《认知模式识别理论及无字库智能造字研究》,作者是是刘明友(2010)。
您友情贡献的是《基于认知机理的汉字智能造字研究》,作者是梁添才(2008)。

但是还是非常感谢之至!:loveliness:

 

jr0jr 发表于 2011-5-6 16:21:14

原帖由 yywzw05 于 2011-5-6 09:09 发表 http://www.pkucn.com/images/common/back.gif
你看懂其中的IRPS了吗?
你不赞同我提八卦,反对俺说“拉丁字母与井田字元”的关系。
偶偏要说。


IRPS就是90度为单位的旋转符号。当初没有选择使用45度为单位,果然是因为字母不够用了?那这26个英文字母也够害人的。:funk:

[ 本帖最后由 jr0jr 于 2011-5-6 16:27 编辑 ]

 

jr0jr 发表于 2011-5-6 16:47:43

重要特点

以前没有想到,拓扑码的和汉字还有个很重要的不同。汉字不能重笔,也就是同一个位置只能写一笔。拓扑码没有这个限制。也许显示的时候只能看到一条线,实际上可以是重合的若干条线。

 

jr0jr 发表于 2011-5-6 17:33:36

厚着脸皮说,要是能把《认知模式识别理论及无字库智能造字研究》发上来就更好了!:shy:

 

客串客串 发表于 2011-5-6 17:40:27

那个容量太大啦。16M多呢。论坛发不了。你给个邮箱吧。
何况在论坛上发,这涉及著作权问题。晚上我会把前面我的上传贴删除。

 

jr0jr 发表于 2011-5-6 18:59:40

感谢客串先生的友情贡献,论文现已收到!

本周末开始闭关学习!

 

yywzw05 发表于 2011-5-6 21:12:23

早点出关
给我们谈谈学习心得。

 

客串客串 发表于 2011-5-6 23:56:30

皮教授和他的几个徒弟好象都主张以字根为构字基元。

 

jr0jr 发表于 2011-5-7 00:01:29

其实以字根来设计是堂皇的“正途”啊。但是目前的字根实在是太多了,几百个,我们玩不起啊。除非大家开始使用义音字,那就是后话了。

使用这些简便的拓扑元的目的就是为了找出字根间的拓扑相似性,然后归并化简。放弃字根是权益之计,是用纯工程的方法析构汉字。也是不得已而为之。

[ 本帖最后由 jr0jr 于 2011-5-7 00:13 编辑 ]

 

jr0jr 发表于 2011-5-7 00:07:31

闭关前的话

析构汉字的,有三种观点。第一种是“有文义”的拆分。大多数创造字根输入法的,和包括皮教授在内的学者都是走的这条路。第二种是“按笔划”的拆分。部分形码,包括五笔的部分拆法都是这个方案。最后一种是“纯拓扑”的拆分。我想,胡敬禹先生的井田字和我正在策划的拓扑码走的都是这样的路子。包括幼师先生也有类似的设想

前两种,已经被无数次验证是可以成功析构汉字的,但是后者还没有完善地实现,所以,才有研究一下的意义。成了,就可以和原有的方案比较比较,大家取长补短。不成,也可以告诉后学晚辈,这种拆分的经验和教训。甚至有可能的话,向大家展示一下,在信息化的时代,旧汉字的一些桎梏。如果能起到一点警示的作用,也是好的。

[ 本帖最后由 jr0jr 于 2011-5-7 00:39 编辑 ]

 

yywzw05 发表于 2011-5-7 01:41:02

原帖由 jr0jr 于 2011-5-6 16:47 发表 http://www.pkucn.com/images/common/back.gif
以前没有想到,拓扑码的和汉字还有个很重要的不同。汉字不能重笔,也就是同一个位置只能写一笔。拓扑码没有这个限制。也许显示的时候只能看到一条线,实际上可以是重合的若干条线。

你的拓扑元“三”和汉字“三”是否需要区别开来?
拓扑元“三”的线条间不存在隔离沟
汉字“三”的线条间存在两条隔离沟
可以这样理解吗?

 

jr0jr 发表于 2011-5-7 02:28:33

回复 43楼 的帖子

有三横的那个是第一套拓扑元集,是学你的啊。你说有沟就有沟,你说没有就没有呗。:cry:

“拓扑码没有这个限制。也许显示的时候只能看到一条线,实际上可以是重合的若干条线。” ——这句话是说,比如,当时用第二套拓扑元集的时候,没有王这个结构。所以“王”字可以是两横加一横再加一竖,也可以是先构造两个“工”字,然后摞到一起,中间那一横是重叠的。

汉字析构的多样性对拓扑码来说是最大的优势!输入法跟咱一点关系都没有。:cry:

[ 本帖最后由 jr0jr 于 2011-5-7 02:39 编辑 ]

 

jr0jr 发表于 2011-5-7 02:54:27

我现在还在这两套拓扑元之间徘徊呢。第一套基本上就是你的井田字20个字元加上以45°为单位的旋转。我没有创造输入法的包袱,基本上可以不受限制地使用编码空间,也不用为了便于记忆而把拓扑元的形态往字母上扯。:cry:

第二套是受到幼老师的启发,把她的基本拓扑关系和我们那个融合字根和运算的思想结合在一起。尽量让每个拓扑元在微观、宏观不同的等级下都有能对应的实体。再有,就是约定所有的运算都是2元的。可能会浪费一些存储空间,但是解码时会比较简单一致。

我要先好好看看那两篇博士论文(再次感谢客串先生!)。这周末我就闭关了。好好琢磨琢磨,希望能把这两套融汇贯通起来。


上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9..] [14] 下一页   
【内容导航】
第1页:说明
第2页:1-15楼
第3页:16-30楼
第4页:31-45楼
第5页:46-60楼
第6页:61-75楼
第7页:76-90楼
第8页:91-105楼
第9页:106-120楼
第10页:121-135楼
第11页:136-150楼
第12页:151-165楼
第13页:166-190楼
第14页:191-205楼


阅读:
录入:湘里伢子

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:

下一篇:
相关文章      
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章