|
用BabylonBuilder制作汉德词典的方法
一. 用记事本制作汉德词条(以人民法院为例)
输入:
人民法院
n. Volksgericht
人民共和国
f. Volksrepublik
二. 汉语词汇
背景:如果词条是汉语,则从文本转换为gls文件时会出错
解决方案(在Excel程序下进行操作):
(1) 在汉语词条前面插入列,该列每个单元格都输入相同的字母或符号前缀(如[Maniok]等,最好不要在汉语输入法下输入“[]”,下同),此时人民法院被替换为[Maniok] 人民法院
(2) 在词条后面插入列,该列每个单元格都输入“|”,此时[Maniok]人民法院被替换为[Maniok]人民法院|
(3) 在“|”后插入原来的汉语词条(复制即可),此时[Maniok]人民法院|被替换为[Maniok]人民法院|人民法院。这样做的目的是,前缀加了[Maniok]之后,查词时直接输入人民法院,词典会告诉你没有这个词。因为它把[Maniok]人民法院看成一个整体了。添加了|之后,|后面的词也可以作为词条检索了。
(4) 如果是较长的词条,为了查找的方便,还可以在后面继续输入|法院等等。如果是批量制作,可以考虑将后两个字或者后三个字全部替换。这个稍微复杂一点,首先要将Excel文件转换为文本文件,然后用Word打开文本文件,利用Word的高级查找、替换功能,可以实现这个操作。
查找:^?^?^p ^$(^?=任意字符,^p=回车,^$=任意字母。由于Volksgericht 末尾的ht回车后是汉字不是字母,所以不会被替换)
替换为: ^&|^&(^&=查找内容)
此时将
[Maniok]人民法院|人民法院
n. Volksgericht
替换为
[Maniok]人民法院|人民法院
n|法院
n. Volksgericht
查找:^p^$|
替换为:|
此时将
[Maniok]人民法院|人民法院
n|法院
n. Volksgericht
替换为
[Maniok]人民法院|人民法院|法院
n. Volksgericht
用同样的方法可以替换最后三个字,其结果是[Maniok]人民法院|人民法院|民法院。先替换后三个字,再替换后两个字,这样就可以将大多数复杂词汇的词根也放在词条里面了。当然,这种方法还比较原始和初级,而且会多出很多莫名其妙的词(比如民法院)出来,但是这样可以抓出大量的词根出来。对于不是编程高手的我而言,这样就差不多了。
在完成了以上四个步骤之后,词条的问题就算是解决了。下面要解决的是释义的问题。
三. 释义
背景:将文本转换为gls时,德语变音无法正确转换。
解决方法:用乱码代替。我已经制作完成了全部德语乱码的对照表。制作的思路是,德语乱码并不是孤立的,ae对应一个乱码,oe对应一个乱码,而是这些变音字母与正常的字母(30个字母,包含变音字母;另外,还要区分大小写的)结合起来对应一个乱码。而且,在结合时,是两两结合的,所以我作了一个结合对照表,一共517个,把这些都替换掉,如果还剩下一些变音字母,那就是孤立的了,再将其替换为ae、oe、ue、ss等形式,德语变音字母的乱码改造就完成了。
四. 将文本文件转换为gls文件
这时候打开BabylonBuilder,用“文件-Import”,找到Txt文件,打开,输入适当的信息,build,就可以生成汉德词典了。
或者:
这样做
1、打开babylon builder ,填写完各个项目,选择源语言和目标语言。然后选择另存为,起名字保存就行了。
2、用windows 自带的写字板打开刚刚保存的文件,然后把自己的词库条目粘贴到最后面,保存。
3、再用babylon builder 打开这个文件,然后edit,build,add,就完成了。
需要注意的是,如果目标语言不是中文,那么在词库条目的解释部分中不能使用中文标点,否则在查找时,中文标点显示为乱码。 |
|