121-135楼_[转载]汉字拓扑码（兴趣组）【与输入法无关】

谢振斌 发表于 2011-5-12 17:55:12

用易符编辑器，组字如下：

yywzw05 发表于 2011-5-12 17:56:34

例外

才、身、尺、木、未、末、本

才、身、尺、木、未、末、本

才、身、尺、木、未、末、本

才、身、尺、木、未、末、本

才、身、尺、木、未、末、本

这一类可以说是一个节点有三个以上方向的笔画段

yywzw05 发表于 2011-5-12 18:56:48

耂
耂
耂
者老孝
者老孝缩小就看不出了。

jr0jr 发表于 2011-5-12 20:12:35

原帖由 yywzw05 于 2011-5-12 17:50 发表 http://www.pkucn.com/images/common/back.gif
汉字的结构很特别，一个节点上不会出现三个方向上的笔画段（例外的情况极个别），JJ那个“女”字很别扭，问题出在这里。:cool:

换一个，但是仍然很丑。我说过的，拓扑元不是为了造字而是为了析字。逆用拓扑元一定弄出丑女。。。

客串客串 发表于 2011-5-12 20:26:35

组字虽然丑，但毕竟是在已经有了现成字样的前提下依样画葫芦，拼出来终归不难。
析字嘛，就象是手中拿着刀想切生日蛋糕，但又不知道呆会到底会来几位客人，感觉真有点无从下刀。JJ能否对析字作点通俗的说明？你那基因编程法，我一个学文科的，实在不知道是咋会事。:shy:

客串客串 发表于 2011-5-12 20:29:24

原帖由谢振斌于 2011-5-12 17:55 发表 http://www.pkucn.com/images/common/back.gif
用易符编辑器，组字如下：

宋体字横平竖直，较易拼出端庄的字。楷书拼字，要拼得好看，估计难度更大。

jr0jr 发表于 2011-5-12 21:40:20

（九）一点基因编程

基因编程（genetic programming， GP）是一种受到演化论启发的计算机自动编程的人工智能技术。

在早期的GP中，程序的指令和数据的值使用树状结构的组织方式，举例来看：

早期的编程主要是建立在Lisp语言上的。这是一种函数式编程语言（Functional Programming），当年主要使用在人工智能上。它的语法和我们之前看到的构造汉字的那些形式语言是非常相似的。

举一个最简单的例子来描述它的计算过程：首先，我们随机产生n个语法树，表示为n个数据集（基因型），然后计算通过层次迭代运算分别得到它们的结果（表现型），选择和期望值（汉字原型）最接近的那个。这个最好的基因型被保留，其余基因型被删除。这一步体现了自然选择，物竞天择。这个被保留的作为母代，根据它生成若干子代，让子代和母代只有随机产生的微小差别。再次展开所有个体的基因型，评估它们的表现型和期望值的差距。再次自然选择，再次生儿育女。。。如此迭代，直到满足条件。可能是一个预设的差距值，也可能是迭代的次数，等等。

所有的这一切，都是自动的，不需要人工干预。所以，对于一个稍微复杂一点的汉字，它会被析构成什么样子，我完全不能预料。

[ 本帖最后由 jr0jr 于 2011-5-13 03:10 编辑 ]

yywzw05 发表于 2011-5-13 00:33:57

原帖由客串客串于 2011-5-11 22:08 发表 http://www.pkucn.com/images/common/back.gif
它有那个原则，但也不是每个部件都能贯彻到底的。换句话来说，这原则并不特别严谨。而且，560部件集的确定，也不止考虑字形方面的因素，它还考虑了字源，字理和习惯等因素。
由于遭不少人诟病，560部件规范并未得 ...

赞同。

客串老师对“部件”的认识很理性。

客串客串 发表于 2011-5-13 00:55:22

有点郁闷。

jr0jr 发表于 2011-5-13 02:41:14

回复 129楼的帖子

位置，朝向，大小。

客串客串 发表于 2011-5-13 08:54:30

原帖由 jr0jr 于 2011-5-12 21:40 发表 http://www.pkucn.com/images/common/back.gif
基因编程（genetic programming， GP）是一种受到演化论启发的计算机自动编程的人工智能技术。

在早期的GP中，程序的指令和数据的值使用树状结构的组织方式，举例来看：

110774

早期的编程主要是建立在Lisp ...

谢谢讲解。

jr0jr 发表于 2011-5-13 09:34:35

回复 131楼的帖子

不必客气。这是我是第一次使用汉语解释基因编程的主要内容，如有不清晰的之处，请您务必指出。

Luxgum 发表于 2011-5-13 11:07:54

无聊了，把浮云吹成神马也好耍！

jr0jr 发表于 2011-5-13 21:34:48

原帖由客串客串于 2011-5-13 10:08 发表 http://pkucn.com/images/common/back.gif
对多数部件的内部结构来说，IDS的许多结构类型同样是适用的。对于那些结构复杂的交重性部件，IDS解决不好，YY的理论也不一定能解决好。如“斤，戈，我，及，氏，也，戊，犬，疋，女，攵”之类。

原帖由客串客串于 2011-5-13 11:03 发表 http://www.pkucn.com/images/common/back.gif
是的。如果你能成功析构这部分汉字或者部件，那么其他部件或者汉字的析构，就差不多是小菜一碟了。

看来实验对象已经有了。基础字根，也就五六百，比7千常用字少多了 :D

客串客串 发表于 2011-5-13 22:27:52

原帖由 jr0jr 于 2011-5-13 21:34 发表 http://www.pkucn.com/images/common/back.gif
看来实验对象已经有了。基础字根，也就五六百，比7千常用字少多了 :D

我在本主题的66楼就说：“何必要析构七八千汉字呢？山人全息输入法的300字根或者部颁560部件集能弄下来就不错了。字根集或者部件集能搞定，再大数目的汉字集也不在话下了。”

[转载]汉字拓扑码（兴趣组）【与输入法无关】

121-135楼

例外

（九）一点基因编程

回复 129楼 的帖子

回复 131楼 的帖子

回复 129楼的帖子

回复 131楼的帖子