用易符编辑器,组字如下:
例外
才、身、尺、木、未、末、本才、身、尺、木、未、末、本
才、身、尺、木、未、末、本
才、身、尺、木、未、末、本
才、身、尺、木、未、末、本
这一类可以说是一个节点有三个以上方向的笔画段 耂
耂
耂
者老孝
者老孝 缩小就看不出了。
原帖由 yywzw05 于 2011-5-12 17:50 发表 http://www.pkucn.com/images/common/back.gif
汉字的结构很特别,一个节点上不会出现三个方向上的笔画段(例外的情况极个别),JJ那个“女”字很别扭,问题出在这里。:cool:
换一个,但是仍然很丑。我说过的,拓扑元不是为了造字而是为了析字。逆用拓扑元一定弄出丑女。。。
析字嘛,就象是手中拿着刀想切生日蛋糕,但又不知道呆会到底会来几位客人,感觉真有点无从下刀。JJ能否对析字作点通俗的说明?你那基因编程法,我一个学文科的,实在不知道是咋会事。:shy:
原帖由 谢振斌 于 2011-5-12 17:55 发表 http://www.pkucn.com/images/common/back.gif
用易符编辑器,组字如下:
宋体字横平竖直,较易拼出端庄的字。楷书拼字,要拼得好看,估计难度更大。
(九)一点基因编程
基因编程(genetic programming, GP)是一种受到演化论启发的计算机自动编程的人工智能技术。在早期的GP中,程序的指令和数据的值使用树状结构的组织方式,举例来看:
早期的编程主要是建立在Lisp语言上的。这是一种函数式编程语言(Functional Programming),当年主要使用在人工智能上。它的语法和我们之前看到的构造汉字的那些形式语言是非常相似的。
举一个最简单的例子来描述它的计算过程:首先,我们随机产生n个语法树,表示为n个数据集(基因型),然后计算通过层次迭代运算分别得到它们的结果(表现型),选择和期望值(汉字原型)最接近的那个。这个最好的基因型被保留,其余基因型被删除。这一步体现了自然选择,物竞天择。这个被保留的作为母代,根据它生成若干子代,让子代和母代只有随机产生的微小差别。再次展开所有个体的基因型,评估它们的表现型和期望值的差距。再次自然选择,再次生儿育女。。。如此迭代,直到满足条件。可能是一个预设的差距值,也可能是迭代的次数,等等。
所有的这一切,都是自动的,不需要人工干预。所以,对于一个稍微复杂一点的汉字,它会被析构成什么样子,我完全不能预料。
[ 本帖最后由 jr0jr 于 2011-5-13 03:10 编辑 ] 原帖由 客串客串 于 2011-5-11 22:08 发表 http://www.pkucn.com/images/common/back.gif
它有那个原则,但也不是每个部件都能贯彻到底的。换句话来说,这原则并不特别严谨。而且,560部件集的确定,也不止考虑字形方面的因素,它还考虑了字源,字理和习惯等因素。
由于遭不少人诟病,560部件规范并未得 ...
赞同。
客串老师对“部件”的认识很理性。 有点郁闷。
回复 129楼 的帖子
位置,朝向,大小。原帖由 jr0jr 于 2011-5-12 21:40 发表 http://www.pkucn.com/images/common/back.gif
基因编程(genetic programming, GP)是一种受到演化论启发的计算机自动编程的人工智能技术。
在早期的GP中,程序的指令和数据的值使用树状结构的组织方式,举例来看:
110774
早期的编程主要是建立在Lisp ...
谢谢讲解。
回复 131楼 的帖子
不必客气。这是我是第一次使用汉语解释基因编程的主要内容,如有不清晰的之处,请您务必指出。 无聊了,把浮云吹成神马 也好耍! 原帖由 客串客串 于 2011-5-13 10:08 发表 http://pkucn.com/images/common/back.gif对多数部件的内部结构来说,IDS的许多结构类型同样是适用的。对于那些结构复杂的交重性部件,IDS解决不好,YY的理论也不一定能解决好。如“斤,戈,我,及,氏,也,戊,犬,疋,女,攵”之类。
原帖由 客串客串 于 2011-5-13 11:03 发表 http://www.pkucn.com/images/common/back.gif
是的。如果你能成功析构这部分汉字或者部件,那么其他部件或者汉字的析构,就差不多是小菜一碟了。
看来实验对象已经有了。基础字根,也就五六百,比7千常用字少多了 :D
原帖由 jr0jr 于 2011-5-13 21:34 发表 http://www.pkucn.com/images/common/back.gif
看来实验对象已经有了。基础字根,也就五六百,比7千常用字少多了 :D
我在本主题的66楼就说:“何必要析构七八千汉字呢?山人全息输入法的300字根或者部颁560部件集能弄下来就不错了。字根集或者部件集能搞定,再大数目的汉字集也不在话下了。”