|
- 阅读:8896
- 回复:1
- 发表于:2011/4/4 3:36:04
- 来自:广东
- 楼主
- 倒序看帖
- 只看该作者
一、认识五笔字型 五笔字型是一种形码,它是按照汉字的字形(笔划、部首)进行编码的,在国内非常普及。下面,简单介绍一下五笔字型的拆分规则。 1. 汉字的笔画 一般从书写形态上认为汉字的笔形有:点、横、竖、撇、捺、挑(提)、钩、(左右)折等八种。 在五笔字型方法中,把汉字的笔划只归结为横、竖、撇、捺(点)、折五种。把“点”归结为“捺”类,是因为两者运笔方向基本一致;把挑(提)归结于“横”类;除竖能代替左钩以外,其他带转折的笔划都归结为“折”类。 2. 笔画的书写顺序 在书写汉字时,应该按照如下规则:先左后右,先上后下,先横后竖,先撇后捺,先内后外,先中间后两边,先进门后关门等。 3. 汉字的部件结构 在五笔字型编码输入方案中,选取了大约130个部件作为组字的基本单元,并把这此部件称为基本字根。众多的汉字全部由它们组合而成。如,明字由日月组成,吕字是由两个口组成;在这些基本字根中有些字根本身就是一个完整的汉字,例如:日月人火手等。 4. 汉字的部位结构 基本字根按一定的方式组成汉字,在组字时这些字根之间的位置关系就是汉字的部位结构。 (1)单体结构 由基本字根独立组成的汉字,例如:目、日、口、田、山等。 (2)左右结构 左右结构的字由左右两部分或左中右三部分构成,例如:朋、引、彻、喉等。 (3)上下结构 上下结构的字由上下两部分或自上往下几部分构成,例如:吕、旦、党、意等。 (4)内外结构 汉字由内外部分构成,例如:国、向、句、匠、达、库、厕、问等。 5.汉字的字型信息 在五笔字型输入法中,为获取的字型信息,把汉字信息分成三类: 1型: 左右部位结构的汉字,例如:肚、拥、咽、枫等。虽然“枫”的右边是两个基本字根按内外型组合成的,但整字仍属于左右型。 2型: 部位结构是上下型的字,例如:字、节、看、意、想、花等。 3型: 称为杂合型。包括部位结构的单字和内外型的汉字,即:没有明显的上下和左右结构的汉字。 在向计算机输入汉字时,只靠告诉计算机该字是由哪几个字根组成的,往往还不够,例如:“叭”和“只”字,都是由“口”和“八”两个字根组成的,为了区别究竟是哪一个字还必须把字型信息告诉计算机。
| | 二、五笔编码方法 1. 五笔的字根及排列 五笔字型输入法,选取了组字能力强、出现次数多的130个左右的部件作为基本字根,其余所有的字,包括那些虽然也能作为字根,但是在五笔字型中没有被选为基本字根的部件,在输入时都要经过拆分成基本字根的组合。
对选出的130多种基本字根,按照其起笔笔划,分成五个区。以横起笔的为第一区,以竖起笔的为第二区,以撇起笔的为第三区,以捺(点)起笔的为第四区,以折起笔的为第五区。
[img=502,275]mk:@MSITStore:C:\WINDOWS\HELP\jpwb.CHM::/2.files/ime10.gif[/img] 每一区内的基本字根又分成五个位置,也以1、2、3、4、5表示。这样130多个基本字根就被分成了25类,每类平均5-6个基本字根。这25类基本字根安排在除Z键以外的A-Y的25个英文字母键上。五笔字型字根总表以及五笔字型键盘字根排列如下图所示。
[img=300,184]mk:@MSITStore:C:\WINDOWS\HELP\jpwb.CHM::/2.files/ime07.gif[/img] | 在同一个键位上的几个基本字根中,选择一个具有代表性的字根,称为键名。 2. 字根键位的特征 五笔字型输入法把130多个字根分成五区五位,科学地排列在25个英文字母键上便于记忆,也便于操作,其特点如下: (1)每键平均2-6个基本字根,有一个代表性的字根成为键名,为便于记忆起见,关于键名有一首“键名谱”: 1)(横)区:王、土、大、木、工 2)(竖) 区:目、日、口、田、山 3)(撇) 区:禾、白、月、人、金 4)(捺) 区:言、立、水、火、之 5)(折) 区:已、子、女、又、纟 (2)每一个键上的字根其形态与键名相似。 例如:“王”字键上有一、五、戋、 、王等; “日”字键上有日、曰、早、虫等字根。 (3)单笔划基本字根的种类和数目与区位编码相对应。 例如一、二、三这三个单笔划字根,分别安排在1区的第一、二、三位置上; 丶、冫、氵、灬这四个单笔划字根,分别安排在4区的第一、二、三、四位上; 丨、刂、川这三个单笔划字根分别安排在2区的第一、二、三位上等。 3.Z键的用法 从五笔字型的字根键位图可见,26个英文字母键只用了A-Y共25个键,Z键用于辅助学习。 当对汉字的拆分一时难以确定用哪一个字根时,不管它是第几个字根都可以用Z键来代替。借助于软件,把符合条件的汉字都显示在提示行中,再键入相应的数字,则可把相应的汉字选择到当前光标位置处。在提示行中还显示了汉字的五笔字型编码,可以作为学习编码规则之用。
| | 三、提高输入速度的方法 五笔字型一般敲四键就能输入一个汉字。为了提高速度,设计了简码输入和词汇码输入方法。 1.简码输入 (1)一级简码字。 对一些常用的高频字,敲一键后再敲一空格键即能输入一个汉字。高频字共25个,如下图键左上角为键名字,键右下角为高频字即一级简码字。
[img=493,133]mk:@MSITStore:C:\WINDOWS\HELP\jpwb.CHM::/4.files/wb060.gif[/img] (2)二级简码字。 由单字全码的前两个字根代码接着一空格键组成,最多能输入25×25=625个汉字。 (3)***简码字。 由单字前三个字根接着一个空格键组成。凡前三个字根在编码中是唯一的,都选作***简码字,约4300多个。虽敲键次数未减少。但省去了最后一码的判别工作,仍有助于提高输入速度。 2.词汇输入 汉字以字作为基本单位,由字组成词。在句子中若把词作为输入的基本单位,则速度更快。五笔字型中的词和字一样,一词仍只需四码。用每个词中汉字的前一、二个字根组成一个新的字码,与单个汉字的代码一样,来代表一条词汇。词汇代码的取码规则如下: (1)双字词:分别取每个字的前两个字根构成词汇简码。 例如:“计算”取“言、十 、目”构成编码(YFIH); (2)三字词:前二个字各取一个字根,第三个取前二个字根作为编码。 例如:“操作员”取“扌、亻、口、贝”构成一个编码(RWKM);“解放军”取“刀、方、冖、车”作为编码(QYPL)等等。 (3)四字词:每字取第一个字根作为编码。 例如:“程序设计”取“禾、广、言、言”(TYYY)构成词汇编码。 (4)多字词:取一、二、三、末四个字的第一个字根作为构成编码。 例如:“中华人民共和国”取“口、人、人、口”(KWWL),“电子计算机”取“日、子、言、木”(JBYS)等。 五笔字型中的字和词都是四码。因此,词语占用了同一个编码空间。之所以词字能共同容纳于一体,是由于每个字四键,共有25×25×25×25种可能的字编码,约39万个,大量的码空闲着。 对词汇编码而言,由于词和字的字根组合分布规律不同,它们在汉字编码空间中各占据着基本上互不相交的一部分。因此词和字的输入完全一样。 3.重码与容错 如果一个编码对应着几个汉字,这几个称为重码字;几个编码对应一个汉字,这几个编码称为汉字的容错码。 在五笔字型中,当输入重码时,重码字显示在提示行中,较常用的字排在第一个位置上,并用数字指出重码字的序号,如果你要的就是第一个字,可继续输入下一个字,该字自动跳到当前光标位置。其他重码字要用数字键加以选择。 例如:“嘉”字和“喜”字,都分解(FKUK),因“喜”字较常用,它排在第一位,“嘉”字排在第二位。若你需要“嘉”字则要用数字键2来选择。 为了减少重码字,把不太常用的重码字设计成容错码字即把它的最后一码修改为L,例如:把“嘉”字的码定义为FKUL,这样用FKUL输入,则获得唯一的“嘉”字。 在汉字中有些字的书写顺序往往因人而异,为了能适应这种情况,允许一个字有多种输入码,这些字就称为容错字。在五笔字型编码输入方案中,容错字有500多种。
|
|
|
|
|