《汉字工程》核心─汉字解码器和导航图
已有几千年悠久历史的汉字,神秘莫测。对许多人来说如同天书一样难解。笔者认为,如果我们能找到汉字的解码器,那么汉字将变得容易认,容易记,容易写。当汉字易认、易写、易记时,汉字的字义也连带地变得容易记忆和理解了。以此为基础,汉字的广泛普遍推广和使用才有可能。由于绝大多数汉字是合体字,又因为独体字是不可分割或者不可分解的整体,破解汉字秘密,设计汉字导航图和拼写口诀主要是针对占汉字95%以上的楷书合体字。解决了汉字合体字的分解和拼写的难关,也就是解决了古老汉字的拼写的瓶颈,从而使这一具有古老悠久历史的文字获得新生和新的活力。
应该承认,看似形态各异、毫无规律的方块汉字一定存在着某种不为人知的隐蔽在数万汉字之中的内部密码。这些密码使这个字和那个字彼此互相区别又有其自身的规律性和共性。简单地说,我们需要找到与每一个汉字唯一对应的汉字识别码。或者说,汉字内部的身份证。发现和识别每个汉字的暗含的识别码后,再进一步解开汉字密码的排列规律即汉字编码的规则。根据这些密码的组合规律,编写出汉字组字成分的拼接口诀,做到依体分解,见字读码,依码写字,这就是汉字的分解、合成解码和拼写规则。
作为《汉字工程》的总策划人,笔者的推论是:汉字既然由其它汉字、汉字构成要素构成,那么我们不妨先找到作为汉字检索标志的偏旁部首目录表,把它转换成汉字字根表,这样,总数不到200个汉字的字根因某种关系和另外一些汉字组合,产生了一万余个通用汉字。再找到与字根相配合的所有汉字字干,分别列出清单,以便一一对应联系,这就是汉字的拼写图,也就是汉字的导航图。所依据的是经过加工整理的汉字偏旁部首表。
仔细分析和观察汉字,人们会发现汉字由笔画、字缀、字符、部首-字根、字干等这样不同级别的汉字要件组合而成。人们将以哪一级别的符号为基本单位来拼写组合汉字呢?很自然地,拼写的方法应该是简单,容易,高效,既科学合理,又便于操作。天下有没有这样的美好的事情?
先看汉字的24-30余种笔画:无论独体字还是合体字,构成汉字的最小最基本的构字要素就是笔画。笔画是最小的、单一的构成汉文字的书写符号。目前除了‘一’以及‘乙’(乙常常代表一串单笔笔画)之外,笔画不是汉字。笔画不适宜作为分解汉字的基本单元。笔画能帮助人正确书写汉字,临摹汉字,但是无助于使人明了构建汉字的整体。特别是汉字笔画大多数名称冗长,数量繁多,在组字过程中其空间位置和相互间的关系难以描述,因此无法作为汉字的识别码。
再看字符:字符是大部分汉字中最小的独立的、由笔画构成的形成文字的最小单位。(例如十、义、丁、卜、又、厂、工、匕等) 字 符 是 汉字,但是在合体汉字单字环境里,其本身的功能和字义字形远离所处汉字的决定性功能和中心字义。也远离该字的字义。如果把汉字分解为字符,会使汉字四分五裂,支离破碎。比如赣字,分别有六一日十夂工冂人八个字符。字符的字义和构字功能不能在汉字全息体系中明显地体现和界定。字符作为汉字识别标志可以用于某些汉字的计算机录入技术,但是不适宜帮助人们学习和掌握汉字。因此字符不能作为汉字的解码单位,主要因为相同字符在众多汉字里经常反复出现。脱离开字境孤立地看字符无法把握全局。
偏旁:
偏旁比笔画复杂,代表一定特定意义的字符,功能比字符明显的相对独立的组字单
位。偏旁作为组字成分有一个缺陷--并不是所有汉字都含有偏旁,大多数汉字有部首和其它构字成分而无偏旁。偏旁只是汉字部首中很少的一部分。也就是说,以偏旁组和出的汉字数量比较少,因此偏旁组字的功能是很有限的。经过技术处理,还原翻译过程,可以把所有汉字偏旁转换升格为汉字字根,于是偏旁也成为汉字解码的一部分。经过这样的处理,偏旁借助汉字板块的功能,可以按独立汉字使用,从而使现有的偏旁部首目录表被改造为清一色的汉字字根表。这就为汉字的有声有义有形拼写奠定了坚实全面的基础。
下面还有一个层次的汉字构成要素,即合成汉字的构成成分,最有希望成为汉字的解码要件。但是这些构字成分常常因为在不同汉字里,由于位置、功能的不同,同一个汉字的字形和笔画在其它构字场合其字形和笔画甚至结构会发生变化变形。因此原始的汉字构字成分还不足以成为汉字的密码显示器,需要进一步的技术处理。假如我们把汉字的字元、字根、字干、包括独体字、合体字的所有构件都当作独立的汉字板块,(偏旁是汉字板块的特殊变形),那么其常态字形就是这个汉字板块的基本型。变体、变笔的汉字就是该基本型板块的变形板/衍生板。但是它们仍然隶属于原来的基本板块。比如水字原形是‘水’,变体有笔画呈离散状态的类似小字的‘水’,(如黎字最下面的部分),和横写的水(如益字上部就是横写的水)。后两种虽然构型有所改变,但所隶属的板块未变,在汉字拼写时,仍然以汉字‘水’的基本板块名称作为其识别码。其它的字其变体可能使该字的笔画总数改变减少,但是字义不变,其隶属的板块也不变。比如良其变体会少一笔(撇)。(如在‘郎’字中)。
很明显,汉字构字的密码,汉字的有效识别证,一定是隐藏在上述从汉字笔画、字符、偏旁、汉字构成部分和汉字的最终整体之间的某个环节、某个层面上。找到这个恰当的层面,并且搜寻出这些识别证的组合规律,那么汉字的密码也就破解了。这个神秘隐晦的层面,原来就是楷化汉字的板块。
汉字的识别码即身份证就是分解开之后的构字成分-字根板块和字干板块。在大部分情况下,合体汉字由字根和字干两部分组成。少数情况下,字根和字根,字干和字干,或者字根、字干加上另一个字干,或某些字缀构几个部分组成一个合体字,也可以组成合体正楷字。所谓汉字拼写口诀,就是汉字的外部识别码加上它的组合方式符号,指示读者或学生完成汉字的拼写、书写过程。
首创性地建立起汉字板块概念,一个汉字是一个板块。板块是既可增容,又可以分割分解以及互相组合的可变的具有动态特征的文字信息集。一个板块有声形义多维信息标志。
简言之,汉字的内部密码就是汉字板块之间相互组合的十大法则,它揭示了近万汉字如何以区区180余个字根、几十个简单字符和字缀、几百余个汉字字干(一级字干即原始字干更少约150-200余个)之间组合排列的规律。这些组合方法涵盖大约95% 以上的通用汉字。其余一部分是独体字,按笔画和字符构成的情况来书写。另一部分几百个(约300-400之间)特异字、疑难字限于现有文字记录则暂时无法合理分解,因而无法编出拼写口诀,必须另类处理。大约占总体的4%左右。
在178个字根的基础上,归纳为八个主板型。这八个汉字板块群分别是一字形、方形、人字形、八字形、十字形、王字形、米字形、弯曲形(乙、之、么)。每一个板块群以一个有代表性的字根板块为中心,以罗盘形式安排各个字根板块,与四周各个子板块衔接。每个终端在字根下有两组数字:1。该字根在拼写表中的页码;2。本字典收入的该字根拼写出的汉字总数。所有的汉字相加就是字典的汉字总数。
在拼写目录中,排列出所有拼出汉字都附有汉语拼音以及在字典正文中的页码。
为什么说汉字的秘密由汉字解码器和导航图所破解?
因为找到了最适宜辨认汉字内部标识的成分---用汉字板块为基型的字根和字干,使绝大多数汉字(95%以上)可以分解为字根和字干两部分进行识别、确认。这是利用化难为易、化整为零、各个击破的原则技术来认识和理解汉字内部结构的基本方法。减少了记忆繁多的负担,加速了汉字信息处理和储存的速度。因为便于快速记忆,也便利了手书或计算机输出录入时快速回忆、快速反应。
汉字解码器和汉字导航图,就是在汉朝许慎的《说文解字》对汉字归纳为540个部首的基础上,利用现代汉语字典的180-220个偏旁部首再进行综合改进,设立新的汉字字根表和确立三级字干表体系,八个汉字板块群代表178个字根,汉字字干表总共约有800个字干,配合一些通用字缀,编写拼写口诀、规定组字的标志性符号、利用汉语拼音使每个句子成分都发音以利带着声音拼写,首先编制汉字拼写口诀手册试行,进而把拼写口诀汇入现行的汉语字典,从而历史性地实现现代楷化方块汉字的拼写化。