46-60楼_[转载]汉字拓扑码（兴趣组）【与输入法无关】

莫蓝sarah 发表于 2011-5-7 08:06:41

好吧，等你忙完了，研究透彻了，我就开始我好好学习你的贴子。。。不懂的，你慢慢给我讲。。。这样应该就比较符合你的心意了吧。。。不至于那么欺负我了吧。。。我不信，你还能把我给变回学理的去。。。

Luxgum 发表于 2011-5-7 10:01:57

不要搞得那么冗长，请先给几个实例行吗?
如:日曰冒己已拓扑扎札枣，
它们的字形编码也就是你的拓扑码是啥?

jr0jr 发表于 2011-5-7 14:45:36

回复 47楼的帖子

原帖由希夷先生于 2011-5-5 19:43 发表 http://www.pkucn.com/images/common/back.gif
這麼囉里巴唆一大堆！先給個例子行不？

回您老的话，没例子。最多算是一个计划书（proposal）而已。放上来就是想听听初步的批评，看看这个东西值得不值得立项。

我现在连拓扑元集还都没有确定呢，如何析构？:funk: 要是已经什么都有了，还招学生干嘛？:cry:

非常感谢lux先生的提问。勉强回答一下也可以。如果用第一种拓扑元集合，那就和井田字类似（多了斜笔而已），您可以去问问胡先生。如果用第二种拓扑元集合的话，“冒拓扑扎札枣”到也不难，交给程序自动析构，区分“己已”略有难度，恐怕要人工辅助控制一下，但是区分“日曰”看来是比较棘手，以为拓扑关系太过于相似了。可能应该是需要建议改变一下目前汉字的字形。同理，再有结构特别相似的汉字出现了，一样要建议改变字形，拉大它们之间的相似度距离。

再次请坛友们看清：本帖不是为了推销某种输入法或者字库。提出这个想法，只是为了抛砖引玉、拓展思维，从汉字结构体上分析它的信息承载能力。我说了：

原帖由 jr0jr 于 2011-5-7 00:07 发表 http://www.pkucn.com/images/common/back.gif
成了，就可以和原有的方案比较比较，大家取长补短。不成，也可以告诉后学晚辈，这种拆分的经验和教训。甚至有可能的话，向大家展示一下，在信息化的时代，旧汉字的一些桎梏。如果能起到一点警示的作用，也是好的。

综上所述，拓扑码没有义务保证和现有汉字体形完全一致，没有、而且并不会向现有汉字体形做百分之百的妥协。

[ 本帖最后由 jr0jr 于 2011-5-7 15:31 编辑 ]

jr0jr 发表于 2011-5-7 15:20:25

原帖由 Luxgum 于 2011-5-7 10:01 发表 http://www.pkucn.com/images/common/back.gif
不要搞得那么冗长，请先给几个实例行吗?
如:日曰冒己已拓扑扎札枣，
它们的字形编码也就是你的拓扑码是啥?

回lux先生的话，拓扑码不是jr0jr的私货。在下只是一个积极的倡导者而已。凡是秉承着相似想法的人，都是我们这个兴趣组的一员。

拓扑码应该是一个框架，不该对实现细则有要求。形成软件实体以后，只要同意GPL（GNU General Public Licence）的要求，大家都可以复制传播。

[ 本帖最后由 jr0jr 于 2011-5-7 15:34 编辑 ]

Luxgum 发表于 2011-5-7 16:41:14

.......构，区分“己已”略有难度，恐怕要人工辅助控制一下，但是区分“日曰”看来是比较棘手，以为拓扑关系太过于相似了。可能应该是需要建议改变一下目前汉字的字形。同理，再有结构特别相似的汉字出现了，一样要建议改变字形，拉大它们之间的相似度距离。
--------------啰嗦那么多，只有这小点像话。

wangs 发表于 2011-5-7 16:58:24

怕是搞着搞着，搞出一套和汉语拼音一样的汉字编码来了。

jr0jr 发表于 2011-5-7 18:43:05

原帖由 Luxgum 于 2011-5-7 16:41 发表 http://www.pkucn.com/images/common/back.gif
啰嗦那么多，只有这小点像话。

有人嫌罗嗦，有人会嫌简略。众口难调，只好依着我自己讲话的习惯了。:D

只要问题说清楚了就好，善莫大焉。

[ 本帖最后由 jr0jr 于 2011-5-7 18:59 编辑 ]

jr0jr 发表于 2011-5-7 18:45:55

原帖由 wangs 于 2011-5-7 16:58 发表 http://www.pkucn.com/images/common/back.gif
怕是搞着搞着，搞出一套和汉语拼音一样的汉字编码来了。

搞出笔划码，或有可能:(
搞出字根码，也有可能:mad:
啥都搞不出来，最有可能:funk:
唯有搞出拼音码来，是绝无可能:loveliness:

wangs 发表于 2011-5-7 20:23:49

楼上，我是说：可能最后搞出的，是汉字的某种拓扑学编码，这种编码里面“曰”与“日”不分，和汉语拼音这种编码类似，不唯一——不是说会研究出什么拼音码来：哪跟哪啊。

yywzw05 发表于 2011-5-7 20:26:12

串的字元表达式：十（二（口口）丨（丨））
这玩意我曾命名为：多层次字元嵌套结构

怎样？

jr0jr 发表于 2011-5-7 20:32:56

原帖由 wangs 于 2011-5-7 20:23 发表 http://www.pkucn.com/images/common/back.gif
这种编码里面“曰”与“日”不分，和汉语拼音这种编码类似，不唯一

wangs先生，如果发现拓扑码的表现型不能区分某些汉字的时候，那就反映了，某些汉字需要进行修改。比如，曰就最好进行一点形体变化。

您提到和汉语拼音类似，那您想类比的点在哪里？我没有理解。我需要您再说的罗嗦一点 :loveliness:

jr0jr 发表于 2011-5-7 20:36:18

原帖由 yywzw05 于 2011-5-7 20:26 发表 http://www.pkucn.com/images/common/back.gif
串的字元表达式：十（二（口口）丨（丨））
这玩意我曾命名为：多层次字元嵌套结构
怎样？

挺好的啊！:D :D

但是丨（丨）没有必要吧。十（二（口，口），#）就可以了。#是终结符，说明需要直接使用“十”的那一竖。

在比如“卅”，可以用十（＃，|||），说明可以直接使用“十”的那一横。

＝＝＝＝＝＝＝＝＝＝＝
函数错了，现已改正！:P

[ 本帖最后由 jr0jr 于 2011-5-7 21:06 编辑 ]

jr0jr 发表于 2011-5-7 23:30:34

原帖由 yywzw05 于 2011-5-7 21:34 发表 http://www.pkucn.com/images/common/back.gif
“街”字构件多层次离析：街＝（彳（丿亻）圭（土土）亍（一丁））

“街”字的字元多层次嵌套结构分析： Ⅲ（二（┘┬）二（土土）二（一丅））

一阶分析（宏观）：“字型”
“街”是左中右 ...

其实这个“街”字有些意思，是左中右结构。让我陷入思考。。。

需要一个III 结构的拓扑元么？诚然，III＝II（II，I）＝II（I，II）＝…… 可是本来三个部分面积应该均等的，结果会变成一支独大。

如果要继续使用纯两元的拓扑元难道要在运算中加入两部分的面积权重不成？比如III = II ( II , I )。

还是说可以这么做 III＝├ （II，II）等等。其中，有两个竖线重叠。这样好么？

[ 本帖最后由 jr0jr 于 2011-5-7 23:32 编辑 ]

yywzw05 发表于 2011-5-7 23:48:13

拓扑，猜得到一点点意思了

不过，最好先开个启蒙班

jr0jr 发表于 2011-5-8 00:12:32

说句大白话，拓扑学研究就是对象之间的几何关系的。在汉字里面，就是用层次的方法研究小目标怎样组合的，或者倒过来，大目标是怎样析构的。重点还是在对象之间的平面关系。 ‖ ∧ ⊥ X 是关键！
[ 本帖最后由 jr0jr 于 2011-5-8 00:27 编辑 ]

[转载]汉字拓扑码（兴趣组）【与输入法无关】

46-60楼

回复 47楼 的帖子

回复 47楼的帖子