阅读文章

[转载]汉字拓扑码(兴趣组)【与输入法无关】

121-135楼

[日期:2013-01-18] 来源:北大中文论坛  作者: [字体: ]

谢振斌 发表于 2011-5-12 17:55:12

用易符编辑器,组字如下:

 

yywzw05 发表于 2011-5-12 17:56:34

例外

才、身、尺、木、未、末、本

才、身、尺、木、未、末、本

才、身、尺、木、未、末、本

才、身、尺、木、未、末、本

才、身、尺、木、未、末、本

这一类可以说是一个节点有三个以上方向的笔画段

 

yywzw05 发表于 2011-5-12 18:56:48




者老孝
者老孝 缩小就看不出了。

 

jr0jr 发表于 2011-5-12 20:12:35

原帖由 yywzw05 于 2011-5-12 17:50 发表 http://www.pkucn.com/images/common/back.gif
汉字的结构很特别,一个节点上不会出现三个方向上的笔画段(例外的情况极个别),JJ那个“女”字很别扭,问题出在这里。:cool:

换一个,但是仍然很丑。我说过的,拓扑元不是为了造字而是为了析字。逆用拓扑元一定弄出丑女。。。

客串客串 发表于 2011-5-12 20:26:35

组字虽然丑,但毕竟是在已经有了现成字样的前提下依样画葫芦,拼出来终归不难。
    析字嘛,就象是手中拿着刀想切生日蛋糕,但又不知道呆会到底会来几位客人,感觉真有点无从下刀。JJ能否对析字作点通俗的说明?你那基因编程法,我一个学文科的,实在不知道是咋会事。:shy:

 

客串客串 发表于 2011-5-12 20:29:24

原帖由 谢振斌 于 2011-5-12 17:55 发表 http://www.pkucn.com/images/common/back.gif
用易符编辑器,组字如下:

宋体字横平竖直,较易拼出端庄的字。楷书拼字,要拼得好看,估计难度更大。

 

jr0jr 发表于 2011-5-12 21:40:20

(九)一点基因编程

基因编程(genetic programming, GP)是一种受到演化论启发的计算机自动编程的人工智能技术。

在早期的GP中,程序的指令和数据的值使用树状结构的组织方式,举例来看:



早期的编程主要是建立在Lisp语言上的。这是一种函数式编程语言(Functional Programming),当年主要使用在人工智能上。它的语法和我们之前看到的构造汉字的那些形式语言是非常相似的。

举一个最简单的例子来描述它的计算过程:首先,我们随机产生n个语法树,表示为n个数据集(基因型),然后计算通过层次迭代运算分别得到它们的结果(表现型),选择和期望值(汉字原型)最接近的那个。这个最好的基因型被保留,其余基因型被删除。这一步体现了自然选择,物竞天择。这个被保留的作为母代,根据它生成若干子代,让子代和母代只有随机产生的微小差别。再次展开所有个体的基因型,评估它们的表现型和期望值的差距。再次自然选择,再次生儿育女。。。如此迭代,直到满足条件。可能是一个预设的差距值,也可能是迭代的次数,等等。

所有的这一切,都是自动的,不需要人工干预。所以,对于一个稍微复杂一点的汉字,它会被析构成什么样子,我完全不能预料。

[ 本帖最后由 jr0jr 于 2011-5-13 03:10 编辑 ]

 

yywzw05 发表于 2011-5-13 00:33:57

原帖由 客串客串 于 2011-5-11 22:08 发表 http://www.pkucn.com/images/common/back.gif
它有那个原则,但也不是每个部件都能贯彻到底的。换句话来说,这原则并不特别严谨。而且,560部件集的确定,也不止考虑字形方面的因素,它还考虑了字源,字理和习惯等因素。
由于遭不少人诟病,560部件规范并未得 ...

赞同。

客串老师对“部件”的认识很理性。

 

客串客串 发表于 2011-5-13 00:55:22

有点郁闷。

 

jr0jr 发表于 2011-5-13 02:41:14

回复 129楼 的帖子

位置,朝向,大小。

 

客串客串 发表于 2011-5-13 08:54:30

原帖由 jr0jr 于 2011-5-12 21:40 发表 http://www.pkucn.com/images/common/back.gif
基因编程(genetic programming, GP)是一种受到演化论启发的计算机自动编程的人工智能技术。

在早期的GP中,程序的指令和数据的值使用树状结构的组织方式,举例来看:

110774

早期的编程主要是建立在Lisp ...

谢谢讲解。

 

jr0jr 发表于 2011-5-13 09:34:35

回复 131楼 的帖子

不必客气。这是我是第一次使用汉语解释基因编程的主要内容,如有不清晰的之处,请您务必指出。

 

Luxgum 发表于 2011-5-13 11:07:54

无聊了,把浮云吹成神马   也好耍!

 

jr0jr 发表于 2011-5-13 21:34:48

原帖由 客串客串 于 2011-5-13 10:08 发表 http://pkucn.com/images/common/back.gif
对多数部件的内部结构来说,IDS的许多结构类型同样是适用的。对于那些结构复杂的交重性部件,IDS解决不好,YY的理论也不一定能解决好。如“斤,戈,我,及,氏,也,戊,犬,疋,女,攵”之类。

原帖由 客串客串 于 2011-5-13 11:03 发表 http://www.pkucn.com/images/common/back.gif
是的。如果你能成功析构这部分汉字或者部件,那么其他部件或者汉字的析构,就差不多是小菜一碟了。

看来实验对象已经有了。基础字根,也就五六百,比7千常用字少多了 :D

 

客串客串 发表于 2011-5-13 22:27:52

原帖由 jr0jr 于 2011-5-13 21:34 发表 http://www.pkucn.com/images/common/back.gif
看来实验对象已经有了。基础字根,也就五六百,比7千常用字少多了 :D

我在本主题的66楼就说:“何必要析构七八千汉字呢?山人全息输入法的300字根或者部颁560部件集能弄下来就不错了。字根集或者部件集能搞定,再大数目的汉字集也不在话下了。”



上一页 [1] [..8] [9] [10] [11] [12] [13] [14] 下一页   
【内容导航】
第1页:说明
第2页:1-15楼
第3页:16-30楼
第4页:31-45楼
第5页:46-60楼
第6页:61-75楼
第7页:76-90楼
第8页:91-105楼
第9页:106-120楼
第10页:121-135楼
第11页:136-150楼
第12页:151-165楼
第13页:166-190楼
第14页:191-205楼


阅读:
录入:湘里伢子

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:[转载]井田汉字,汉字形体结构演变的终点站(下)

下一篇:“井田汉字”走的是“拼形”路线
相关文章      
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章