|
本帖最后由 tcp_2006 于 2010-9-9 10:05 编辑
《日本语文型辞典》(EPWING格式)勘误任务认领
报名请到:http://coffeejp.com/bbs/thread-311621-1-1.html
《日本语文型辞典》(EPWING格式)已经完成并发到各个参加者邮箱,请查收。
之前我提议将《日本语文型辞典》EPWING化,得到一些朋友的响应,非常感谢。这本词典一共656页,我想如果有20个人,每人分个30多页,应该没有问题,实际上我自己也做了一些,已经放到之前发布的那个“自己整理的日语句型辞典”里去了。报名的同学,发你的邮箱到到 tcp_2006@sina.com.cn ,标题就写 『日本語文型辞典』的文本化报名 即可。做好的辞典内部交流用。
请参加者加入 词典交流qq群(35578512)
统一格式:
采用word格式【这里是yindian制作的样本】
1,不加振假名。
2,大词条用一级标题,其下的小词条用二级标题,以此类推。保留原本内容的层级。一级标题,二级标题、正文等都用word里面的“样式表”实现。
3,完成后的稿件请命名为:
bunkei_(起始页码,3位数)_(结束页码,3位数)_(你的ID)
例如我完成的稿件命名为:bunkei_001_030_tcp_2006
4,分页后的pdf文档下载地址(感谢xvlei1126) http://www.brsbox.com/xvlei1126/
目前分工(争取9月1日前完工):
- tcp_2006 负责1-30page(已完成!)
- love_lihong1314 负责 31-60page(尚未交稿)
- Yin Dian 负责61-90page(已完成!)
- 大笨猪 负责91-120page (已完成!)
- xvlei1126 负责121-150page(已完成!)
- tarata 负责151-180page (已完成!)
- 自是词痴负责 181-210page(已完成!)
- li5jun1 负责 211-240page(已完成!)
- Yaguchi Yuki负责 241-270page(已完成!)
- han-1998负责271-300page(已完成!)
- rongdian 负责301-330page(已完成!)
- skywood 负责331-360page(已完成!)
- tatsuya23 负责361-390page(已完成!)
- icesunx 负责391-420page(已完成!)
- 囧囧猫 负责421-450page(已完成!)
- zhaos_2005 负责451-480page(已完成!)
- geatom 负责481-510page(已完成!)
- choushuushi负责 511-540page(已完成!)
- 屋上之鼠 负责 541-570page(已完成!)
- snowfoxbbs 负责 571-600page(已完成!)
- hirotubasa 负责601-630page(已完成!)
- Yin Dian 负责631-656page(已完成!感谢YinDian!)
etypist(文字识别软件)的下载(感谢xvlei1126)
etypist
http://www.rayfile.com/zh-cn/fil ... -ad2c-0015c55db73d/
破解文件
http://www.rayfile.com/zh-cn/fil ... -a475-0015c55db73d/
PDF版【日本語文型辞典】下载地址
http://coffeejp.com/bbs/thread-187255-1-1.html
使用etypist进行扫描的技巧(感谢 自是词痴)
1.用e-typist扫描时不要一下子选一整页。因为文件一页分成了四栏,要利用e-typist里的圈选工具把四栏沿周边圈好,一点要把每栏有文字内容的地方都圈进去,如果没有圈完整,周围的字就会识读不清楚。其实可以很放心地圈选,因为e-typist会自动地把圈选的边界缩到文字的周边。
2.扫描出来的结果ctrl+C ,ctrl+V全部粘贴到word文件内。这里也需要一栏一栏地复制。不要整个全部复制
3.觉得一口气把所有的任务页全部扫描出来再粘贴到word。这样做的效率要高于做一页,扫描一页,粘贴一页。
4.粘贴完后,就逐字认真地对照原PDF来校对了。因为原书全部是日文,e-typist的认读效率很高很高,文字几乎没有错误,我可以有把握地说准确率在99.5%以上。我校对下来,觉得就是日语的标点符号有时不太准确。比如? ,...等。
5,(tcp_2006)补充一点:识别的时候,可以设置为不识别振假名(ルビ)。
yindian做出来的EPWING的效果:
关于制作过程中的几个问题(讨论):
yindian提出了两个问题:
1,是否保留振假名的问题:
xvlei1126认为,不必保留。我完全同意。理由是:1,使用该辞典的人都有一定基础,2,在ebwin中随时可以查生词。
2,最终采取何种格式的问题:
主要是两种格式:EPWING和PDIC。我个人对制作EPWING格式有些了解,但是没有实际做过;对PDIC很了解。
xvlei1126和yindian倾向于EPWING格式,从yindian发给我的样本来看,确实非常好。
yindian的意见:
如果做成EPWING格式的话,就可以不用表格来填词条和释义,可以在doc里将每一大项【xxx】样式设成一级标题,小项设成二级标题等等,另存成html后把编码转成Shift_JIS就能直接用EBStudio编译了,会自动生成目录和词条索引,如果前面注了振假名的话也能显示。
尽管我认为PDIC格式有便于修改和添加词条、便于转换等其他好处,但是似乎没法实现分层目录和链接。因此。同意yidian的意见。 |
|