电脑辅助的汉字认知系统

 

吴大明

 

(英国利兹大学)

 

 

一、概要:

 

我这里所要介绍的这个电脑辅助汉字认知系统的主体是由汉字书写、词语认读和文本助读等三种电脑软件组成的,也就是说这三种软件是这个系统的基本部分,即供学生操作使用的部分。此外,我还将进而介绍在制作供这些软件运作的课件时所需用的各种编辑工具。大家会发现,我将提到的这些软件并不是什么技术上的新发明,其中的一些大家可能见到过类似的软件,而另外一些就是大家熟悉的软件,不过所利用的是其特别的功能而已。因此,我将解释我怎样把这些自制的和购进的软件转换成一套系列工具,用以支持一个相对完整的汉字认知系统。在通过技术方面评价各种工具的长处和短处的同时,试图对使用电脑进行语言教学的某些原理和原则作进一步的探讨。

 

 

二、汉字书写软件——电脑习字程序:

 

“写字课”在汉语教学研究中,面临着“存与亡”的争论。这一争论起因或多或少是来自电脑的普及应用。从前的中国人以写字为个人的“门面”,写得一手好字被认为是一种难得的技能,可以因此而得到一份好工作。而现在连中国人自己都发现,动手写汉字的机会越来越少了。尽管为了保存和发扬中华文化,我们还要不时地提倡写字和书法,但在工作和生活中,打字已经渐渐地比写字更重要了。那么,在我们教外国学生学习中文的时候,还要不要教他们写汉字呢?说起写字,我们想到的当然是初学者,因此往往拿他们和中国的小学生作类似的比较。如果小学生不动手写字,一定会影响他们识别汉字、认读词句的能力,俗话说:“眼过千遍不如手过一遍”,这种基础训练还是必不可少的。对外国学生来说,学习汉语首先要过汉字认知这一关,虽然认知的目的主要是取得阅读能力,其次是打写能力,最后才是书写能力,但是完全放弃书写能力的练习对打写和阅读都是不利的。既然在一年级初级阶段,我们练习写字的目的主要是为了促进和提高汉字认知水平,那么就有必要重新检审一下我们以往教“写字课”的经验,看看电脑的应用使它在内容、形式以及与其他技能训练的结构关系等方面发生了什么变化。

 

在使用电脑之前,“写字课”上常用的练习方法大体有三类。第一类是偏旁部首归类法;第二类可称为间架结构摹写法;第三类不妨叫作同声近形辨认法。先说第一类,这是中国人教汉字的传统方法,把含同类偏旁部首的字收集在一起,解说形旁、声旁的意义,以便学生能够以形会意,举一反三。例如:

 

氵(三点水旁):水海酒汽深浅洁济没汉法演

 

但是大家一定会注意到,上面这一行与水有关的字,越靠后的越难讲,有些字需要动用其不常使用的意思,有些甚至找不出适当的说法。实际上,汉字形和意之间的这种不可靠的联系,比欧洲拼音文字中的不规则拼法还要复杂得多,所以这种方法虽然在帮助学生整体理解汉字结构方面有一定的作用,但是在促进书写和认读方面却没有明显的效果。由于偏旁部首的这种不可靠性,中国人在口头描述某个汉字的时候也不能依赖它们,最多只用几个大家都熟悉的部首名称。而外国学生呢?在大学四年级毕业的时候,很少有人能对口头描述的部首名称作出及时的反应。通过这样地观察,我感到外国学生记住汉字的方法,不是偏旁部首归类法,而是随课生词形意一体的记忆法。例如,中级程度的学生在新闻广播上听到“以便”这个词,明白了意思之后,他问这两个字怎么写,如果告诉他是“可以的以,随便的便”,他就能从自己的已知词库中调出这两个字。有时候他还能记得这个词是在哪一篇文章里学的。反观中国人在口头描述单字的时候,也常常使用组词法。

 

根据上述假设,所以我们的电脑习字程序是按主课本的课文生词表的顺序排列的,使学生在练习写字的时候,避免孤立地用单字的结构去附会意思,而是在书写的同时,回忆生词在课文中的意思,使写的字和它的实际意义结合起来,而不是在写几个拼合在一起的部件。

 

有了练习写字的方法,不等于就能学好写字,成功的秘诀其实还是要下功夫练。传统的写字课上,往往由老师示范,学生摹仿,一笔一划地写上几遍,课后再由学生按书本练习。这就是第二类练习方法——间架结构摹写法。这种方法虽然行之有效,但其教学的过程却是最费时间、最枯燥的,老师会觉得没有什么可讲,学生因程度不同、练习的多寡而觉得浪费时间或理不出头绪。中国的小学生往往被要求每个字写好几遍,并要交给老师或家长过目,而这种中国传统式的写字练习不适合外国学生。如果他们在练习的时候能够随时得到辅导,一定会促进对汉字的认知。因此我们用电脑习字程序代替了写字课,将其纳入电脑技能课的一部分,只作一两次简要的介绍,其余的练习都由学生自己在课下使用习字程序的光盘进行。由于我们这个软件是按学生的主课本编排的,每一课的每个生词中的每个字都能进行书写演示,所以学生可以在无须他人辅导的情况下正确地练习写字。这样一来,既节省了老师的时间,又提高了学生的效率。

 

我们从制作和使用这个习字程序中总结的经验是,习字软件的内容必须与主教材的内容密切配合。如果两者的内容不一致,学生掌握汉字书写规律的过程就比较慢。而要想掌握这个规律,关键是要达到一定的练习量。如果习字软件的内容结构跟学生的主教材一致,我们就能在不用教师加时辅导的条件下,保证达到各个学生按自身能力所需要的练习量。类似我们的习字程序的软件现在无论在网路上和市场上都有很多种,用于不同的目的,有的结合一种教材,有的按拼音和笔划排列,有的甚至是一个完整的字典。从教学的角度看,这样一个习字程序只要与学生的第一本初级教材配套就够了。我们的习字程序中有851个汉字(发863个音),组成1105个词,大约与汉语水平考试中的800个甲级字和1033个甲级词相吻合。在学生通过一年的学习掌握了这个数量级的字词以后,就不需要这样专门练习写字了。所以我们认为,完整的字典从教学的实用性来说是太昂贵了,音笔顺排列的程序对外国学生来说不如与其主课本密切结合的程序更适用。我们目前的这个习字程序是按《初级汉语课本》编制的,那么如果课本再版或者我们要换课本,这个习字程序还能不能适应我们的新要求呢?

 

在该程序的设计之初,这个问题就已经想到了。从技术上讲,每个单字都被制作成一个微软的PowerPoint文件,其中包括整字、拼音、发音和笔顺动画。单字放在每课的文件夹中,由一个网页式的目录统一管理。如果今后要换教材,只要按新课本整理出一套文件夹,再生成一个新的网页式目录,就可以使用了。也就是说,如果其他大学想要按他们的课本编这样一套习字程序,大部分的单字都已经有了,只要一个分课的生词表就可以开始编目录。我们还编写了一套整理文件夹和生成目录的程序,其中包括字词表的资料,这些不包括在学生的光盘中,但可供教师使用。

 

有了电脑习字程序,学生可以自己练习写字了,但这还没有包括写字课的第三类练习方法,即教学生怎样识别错别字的同声近形辨认法。由于这种练习超越了电脑习字程序的功能,所以我们就通过打字工具来进行这方面的训练。中国学生在学作文的时候,老师常常要批改他们的错别字。在打写日益取代手写的时代,错字的问题将会渐渐小于别字的问题。我们教写字是因为它的认识价值,而我们教打字的时候,则需要进一步加强对别字的辨认和区分。手写别字和打写别字的错误性质有时候是不一样的,手写时可能是因为只想起了一个字,而打写时则可能是在好多字中选错了字。过去上写字课的时候,我们教学生辨认错别字的练习方法有下列几种。例如:

 

同音同调:             _____实、整__________车、冰_____淋(其齐骑淇);

                        jiào      ____________授、你______什么名字?(觉教叫);

 

同音异调:    bi         _____、人民__________较、_____业(笔币比毕);

                        shi       _____候、_____吗?、开_____、认_____、(时是始识)

                                    _____、电__________堂、阅览_____(师视食室)。

 

字形相近:般空、收音枕、中牛、老试、应孩、夏习、运近、再贝。

□□□□(航空、收音机、中午、考试、应该、复习、远近、再见)

 

字形相近是手写中的问题,现在我们教学生打字,替代它的是字音相近的问题。学生有时说找不到字,往往是拼音打得不对,所以用拼音打字可以促进对拼音的掌握。以前我们在中级阶段才开始教打字,因为那时感到这一技能到了中级阶段才有实用性。而现在我们从初级阶段就开始教打字,因为打字不但对初学者学习拼音有帮助,而且能使学生看到更多的汉字。通过与更多汉字的这种感性接触,进行比较挑选,对学生发展汉字认知能力有一定的促进作用。

 

此外我们还发现,如果让学生打写单字,他们选字的错误率就会比较高,例如:好马(吗),照想(相)机,卓(桌)子,在(再)见,油(邮)局,清(请)进,年铃(龄),气(汽)车,因(应)该,有//由。因此,在初学汉字的阶段,字音相近的问题的确有很大的干扰作用。除了在某些时候有意限定他们作单字加声调的拼音输入练习外,总体策略还是要教他们使用词组输入法,虽然这样还是有选词问题,如:名子(名字)、同义(同意)、练习/联系,但出错的机率则会大大下降,同时词组输入可以帮助学生逐步建立词的概念,以便今后在阅读中提高分词的能力。

 

 

三、词语认读软件——TriScripts

 

这个软件的作用与学生从前使用的生词卡片是一样的,不过它有三个面,比纸做的卡片多一个,故此得名TriScripts。这样一来,它就可以分别显示学生的母语、汉字和拼音,帮助学生复习已经学过的生词。在显示不同卡面的时候,学生可以自由选择展示那一面和不展示那一面,也可以展示两面复习另一面或展示一面复习另两面。与纸做的生词卡片相比,这个软件有更多的功能,概括地说有:一、翻卡复习功能,附带闪现法;二、多种选择练习功能;三、自写答案功能;四、增删修改功能;五、自组卡片功能。以下就这几项功能的特点进行介绍。

 

翻卡复习生词是这个软件的主要功能之一,其突出的特点是能帮助教师和学生有效地管理好生词卡片的套路。我们的生词卡片和习字程序一样,也是按学生的主课本制作的,并同样可以进行分割和重新组合。比如说,我们可以按课程进度确定卡片的范围。在学生学到第十五课的时候,我们向他们提供一至十五课的生词卡片,等学到了第二十课,我们再提供第十六至二十课的生词卡。在安排练习的时候,我们可以确定一个复习阶段,如:第十一至二十课,并提供一套相应的生词卡供学生复习。其实,学生也可以按电脑技能课上教的方法,自己任意组合卡片的套路,以适应个人的需求。任意组合的意义不仅仅在于可以重点复习某些单元课程的生词,它还可以打乱原有的套路,把不同单元课程的词汇融合起来,重新排列,以便有效地加强复习的效果。在这一方面,电脑工具体现出优越于纸制卡片的功能。按这个功能的设计,它在每次打开一套卡片的时候,都会重新调整该套生词卡片的排列顺序,使学生避免先入为主,而能够在新环境下进行词语认读。练习结束后,打乱了的词汇又按原来的单元复位还原,以供下次组合卡片时使用。这一点是纸制卡片很难作到的。

 

此外,翻卡复习还附带了一个闪现功能。在进行阅读训练的时候,眼睛的移动频率被认为是应该掌握的技巧之一。这一功能的设计虽然不是为了眼睛的快速移动,但也要求学生在自己设定的瞬间辨认出生词的音、形或意。有了时间的限制,学生能更集中精力,更投入地捕捉瞬间闪现的生词,积极地测试自己的反映速度和能力。当然,学生可以根据自己的学习阶段和练习程度确定是否需要启动或关闭这项功能,从而增加复习的灵活性和挑战性。

 

多种选择练习的设计目的是为了增加灵活多样的练习方法,并提高学习的趣味性。我们知道,翻卡复习需要启动一部分主动的记忆,学生在电脑给出一个词汇的时候,需要主动地回忆起自己学过的相对应的东西。与多种选择练习相比,主动记忆是一种较为吃力的活动,而在已知的答案中进行选择是一种被动的记忆活动。它使学生在自己头脑中搜索不到答案的时候,还可以面对几个可能的答案进行猜测,碰碰运气。这种方法可以避免测试中断,使游戏得以继续下去,并鼓励被试者的勇气。虽然说多种选择有其不足的地方,但是在我们的学习活动中,猜测本身就是一种智力训练,它能使我们把不确定的认识转变成确定的知识,并增强对其的记忆力。

 

多种选择功能也是按任意抽样排列的原则设计的。每次使用前先选好两种对应的文字,这时候不但生词索引是任意抽样排列的,而且选择的四个目标词语也是抽样排列的。如果选择正确,电脑上就出现一张笑脸,否则就出现一张丧气的脸。这时学生可以选择重作、放弃或跳过,如果选了重作,则索引词不变,而四个目标词语则会被部分替换和重新排列。重作可以根据学生自己的兴趣重复数次,如果还不能选中正确的答案,可以选择放弃,这时候正确的答案就会显示出来。在作多种选择练习的时候,每选一次,包括重作的练习,电脑都会记一次数。学生在完成了一段练习之后,可以查看自己的成绩,对和错的次数可一目了然。

 

自写答案的功能是词语认读中最难的练习,而且由于在程序设计方面的智能化还不够高,所以学生在练习前先要达到两个条件:学会中文打字;并选择一套已经通过前两种功能练习过的词卡。这种功能的局限性是,它要求百分之百的对应,连空格都不肯放过,这给学生的练习增加了不少困难,这是我们在今后制作新版的时候必须改革的地方。此外,在输入汉字的时候,要求使用南极星全球通或其他双位码输入软件,这是因为TriScripts初创于一九九九年,那时的中文还在使用双位码。这也是新版要解决的问题。另一个是拼音输入的问题,我们的解决办法是,制作了一套拼音字体,并配上一个拼音输入的软件盘。这样一来,我们基本上解决了拼音输入的问题,但与微软的系统不一致,给教师和学生在制作卡片时增加了一道转换手续。随着统一码的广泛应用,我们在新版时将对这些问题一并进行考虑。

 

增删修改词卡的功能同样涉及到输入的问题,也适用于上述各项对策。设计这项功能的目的是帮助学生优化自己的生词表。在一年级上半年,学生主要使用教师提供的统一词表,这些词表的释义部分都是从课本上抄来的,其中有些词的外文翻译其实不够准确,学生在学习中对词的意义有了新的体会,就可以根据自己的理解修改其外文释义。此外,在课堂练习的时候,教师往往会添加一些可供替换的词汇,有些学生发现这些词汇都很有用,就把它们记下来输入到词表中以便复习。所以,经过学生自己增删修改过的词卡就成为学生所学过的全部词汇的准确记录,不但便于他们平时练习和考试前全面复习,也给他们未来的汉语学习积累了资料。

 

到了一年级的下半年,我们仍向学生提供他们主课本的统一词表。这时,学生的生词表已经增加到一千多个,每次全部复习一遍需要很多时间而且效果不佳。因此我们教会他们使用自组卡片的功能。这一功能的操作有两种方法:一种是切割资料文件,另一种是抽取个别卡片。第一种方法所用的工具就是Word,学生要掌握如何按国标编码打开词表的文本文件,删去已经熟知的部分,拼接有待复习的部分,从而组成一套新卡片。第二种方法是我们在TriScripts中发明的。学生可以在练习时候,抽取一些内容记得不牢的卡片,把它们集成一组,转存为一套新卡片,再来进一步地复习。通过这些个人化的功能,学生就能按照自己的程度练习词汇了。

 

总体上讲,作为一个词汇练习的工具,TriScripts比其他同类软件有较多的灵活性。它现在配有两套生词表可供使用,是按照我们以前和现在的课本编定的,即:旧版的《实用汉语课本》和新版的《初级汉语课本》。但如上所述,这个工具是可以使用按任何课本编写的任何生词表,为了配合生词表的编写,我们在微软的Word中制作了一个宏指令模板,启动之后可以把南极星生成的拼音文本转化成卡片用的文本。这就是说,任何老师和学生都可以根据自己的教学和练习的需要,制作自己的生词表。制作的程序是,先通过南极星把中文文本转换成拼音,加上外文释义,就可以把它转换成卡片文本。所谓转换,就是通过电脑发指令,拼音部分是不用逐字打写的。当然为了准确还需要进行校对,对应的外文可以使用翻译软件先进行自动翻译,再用人工修改校订。

 

通过制作和使用上述两种写字和生词练习软件进行教学,我觉得有必要对我们的经验作一些总结,在鉴别、挑选、使用和整合电脑教学工具方面发现一些原则性或规律性的东西,这样作一方面可以使我们认识到哪一类型的工具对汉字认知是最有帮助的,另一方面我们也可以发现电脑工具已经在多大的程度上冲击着我们固有的一些课型。汉字认知是学习汉语一大难关,它涉及到从认字、积累词汇到阅读理解这样一个漫长的学习过程。在这个过程中,除了要研究怎么教之外,还要研究学生是怎么学的。比如上述的经验告诉我们,写字课的关键不在于怎么教,而在于怎么练,当我们发现用电脑练比跟老师练有更多的优势,特别是在时间的灵活性、个人的练习环境和内容的自选性等方面,人机对练比师生对练不但提高了效果,而且节约了人力和财力。同时我们也意识到,在这种工具制作的初期,其实要投入更多的人力和财力。但因为在工具设计的时候考虑到了内容可变性的这一重要功能,所以使这种先期投入能够取得长远的利益。那么在设计词语认读的软件时,我们除了意识到记生词不是课堂活动而是课后活动之外,还意识到记认生词的问题不是局限于某一级课本或某一个学习阶段的问题,而是各级学生都会遇到的问题。因此,软件的制作从技术上允许使用者运作自己的生词表,而且强调运作自己生词表的意义大于运作原有生词表的意义。我们在教学中所选的软件,一般都要有这样一种工具的性质。如果一个软件的资料结构是封闭型的,功能上是孤立的,内容上是专为一种课本服务的,我们就要慎重考虑其先期投入的价值和更新换代的困难。更重要的是,我们希望能教会学生使用几种电脑工具,这些工具不但是他们今天学习中不可缺少的,而且在他们未来的学习和工作中也能发挥作用,就像学会了查词典和检索资料一样,用电脑学习就是要学会一种学习的能力。我们不只是把电脑用作课堂教学的工具,而是要求学生在离开课堂之后,具备使用同类工具的能力。

 

 

四、文本助读软件:

 

以上两种软件仅仅通过字和词的层面解决了一些汉字认知方面的问题,为初级和中级程度的学生学习汉语打下了基础。但要使汉语成为学生的一种基本的工作语言,必须使他们达到能阅读文字的水平。至于怎样教好阅读课,要涉及到语法知识、背景知识和阅读技巧等许多方面的问题,不是本文准备讨论的范围。我这里想介绍的是如何通过电脑词典工具帮助学生及时查找阅读中的生词。

 

学生在阅读中的困难之一是经常遇到生词,其中的一部分难免要去查字典,如果也不知道一个词首字的发音,查起来就会比较慢。为了帮助他们较顺利地进行阅读练习,我们从网上下载了免费软件Dictionary Lookup。这个软件本身很小,但需要一个很大的中文字库,我们现在利用的是Paul Denisowski收集的中英文字库。这个字库分繁体字和简体字两个,分别用的是大五码和国标码,为了学生查找方便,我们把两个字库合成一体,只用一套英文释义,并把所有的汉字都转换成统一码。

 

这个词典工具的工作原理是,打开一个小窗,以最新抄入内存的文字为索引,显示字库中与该文字相应的信息。它的特点是,无论学生阅读的文字是在哪种文件格式中,都能及时查阅,只要选中一个词,抄入内存即可。这就是说,不论学生读的是网页上的文章或电子邮件,还是Word文件或Acrobat文件,都能查找其中的词语。经过我们改造的词库能够更全面地查找词语,无论原文是繁体还是简体,均可一并查到。

 

这个词典的特点是,不但体积小,而且不用安装,学生可以随身带在自己的USB闪盘里,要用的时候打开就行。他们无论走到哪里,只要有一台电脑,无须联结网络,就可以借助这个词典进行阅读。除此之外,他们还可以顺手把查到的词汇写进自己的生词文件中,以便过后复习。当然,这些生词还可以被制成生词卡片,用在词语认读软件中。目前所用的这个词典,共计收词约两万五千个,但这并不是它的极限。学生一旦掌握了词典的工作原理,就可以把自己找到的新词添加进去扩充词条。从本身的性质上讲,这个词典是一个汉英词典,但由于它的数据是电子化的,所以在一定的情况下,也可以作英汉方向的查找之用。例如,学生在打写中文的时候,找不到中文词表达自己的意思,他就可以输入一个英文词,让电脑去反找中文。学生有了这样一个简便、灵活、适用和个人化的词典,将为他们认读汉语字词创造了更便利的条件。

 

 

五、汉字认知系统的改进:

 

大家可以看到,我上面介绍的书写、认读和阅读这三个系列的软件本来之间并没有必然的联系,前两种因为都是我们自己设计编制的,又都用来运作我们自己的教材,好像属于一个系统。实际上,同类的软件在我们编制之前就有了。要使这三种原先是孤立的软件共同按部就班、灵活适宜地为汉字认知的任务服务,我们还需要围绕着这三种软件,综合利用其他软件的部分功能。所以说,我们的这个汉字认知系统,不是一个在工具设计的时候就形成的系统,而是一个按汉字认知的规律、步骤和方法来调集和组建电脑工具性能的系统。

 

正是由于这个系统编写时间的不同和目的的多样性,我们在使用时发现有很多值得改进的地方。汉字书写软件是最新编写的,目前需要改变的地方较少,可能在未来把单字文件重新整理,按音序排列一下,目前是按课序排列的,不利于不同教材生词组排的广泛应用。词语认读软件创制的时间较早,现在最理想的是能申请到一笔资金写出一个新版,全面使用统一码。这样可以在编写生词表的时候节省编码转换的手续,拼音的声调也不必另起炉灶,用标准的拉丁字母就成。如果能够同时编出一个有外文对应的8,00016,000词的自动翻译词库,将会大大减少词表编后的校对时间。此外还有提高智能化功能的任务,使用模糊的索引法搜索近似的词语。文本助读软件我们还没有自己的版本,将来的打算首先是改进版面和查阅技术,而真正重要的新功能则是利用双语语料库帮助学生进行阅读和翻译练习,也就是希望借鉴电脑辅助翻译的一些原理来开发语言学习的工具。作为更长远发展的设想,这三种工具可能还应该保持各自的独立性,而没有必要编成一个工具,兼具各种功能。只要它们之间的数据是可以并容易互相转换的,其练习的连续性就会得到保证。另外我们也注意到,一些便携式的电子产品,如:新一代的PDA和手机等,将成为学生随身携带的小电脑。所以我们的软件也应该考虑到能够在这一类产品上运作,使学生随时随地都能利用这些工具,解决他们学习、工作、旅行和日常生活中遇到的问题。

 

 

六、结论:

 

我们认识到,现在是电脑学习软件走出课堂的时代。所以通过综合利用自制软件、工具功能和网络资料,制作了适应于本校特定汉语教材的一套课外练习工具。这套工具的应用不仅符合学习汉字需要大量练习的规律,而且减少了教师的陪练时间,进而提高了学习的效率和学生的主动性。从技术上看,这套工具给学生提供的不仅是他们课内教材的课外练习工具,而且是一个可以长久使用的学习工具,即使在他们毕业之后,头两种工具可能渐渐淡出,而阅读工具将会有永久的使用价值。对教师来说,这套工具不仅局限于某种教材、某家学校,而只要掌握了数据加工的技能,它就可以为任何学校的任何教材服务。此外,这套工具的造价非常便宜,除了先期投资需要制作和培训费用以外,教师平时只要一般的备课投入就行了,而学生所要花费的不过是相当于课本的价钱。由此可见,这种组合工具的发展前景和潜力是值得关注的。随着它的推广和应用,我们有必要在这种工具普及程度的基础上,重新考虑我们在课程设置和教学方法上需要改进的地方。

 

二〇〇五年八月于德国