|
发表于 2008-3-31 08:51:58
|
显示全部楼层
freepwing加工的源文件(jawiki-latest-pages-articles.xml.bz2解压缩后的)是xml形式,UTF-8编码,
中文的源文件(zhwiki-latest-pages-articles.xml.bz2解压缩后的)也是UTF-8编码,
不过貌似到了EPWING被当作外字,目前还不知道freepwing如何对付外字。
偶编译中文的时候,不仅简体字,繁体字的部分也有乱码(?表示),见 http://coffeejp.com/bbs/viewthread.php?tid=194766
用Windows的EBStudio编译EPWING时,需要事先把外字写成十六进制以及制作外字map文件。
zhwiki-latest-pages-articles.xml.bz2(2008-Mar-11版)解压缩后的xml文件虽有216.6MB,
EBStudio编译时会用很多内存,不知道把其中的tag(尖括号<>括起来的)去掉还剩下多少MB,[貌似很多]。
如果内存允许的话,把xml文件除去tag、转成一般文本,再制作外字文件用EBStudio编译实属无奈之举。
好像Stardict或者Babylon可以编译中文文本。
在网页浏览器设定国外HTTP代理站点浏览wikipedia也不失为一个简单办法。 |
|