咖啡日语论坛

 找回密码
 注~册
搜索
查看: 3962|回复: 27

[软件分享] Chinese Writer8字典提取(更新中国語新語ビジネス用語辞典)

[复制链接]
发表于 2007-3-2 20:52:31 | 显示全部楼层 |阅读模式
程序已经写出来,并能够完美提取各本字典。
哈哈......,各位感谢我老哥吧。
这样一来,就让大修馆中日字典的提取成为可能。
(目前正在提取当中)
程序占资源的程度很少,几乎可以忽略不计。C++设计。
原理:Chinese Writer8左栏为word list格式,右边为HTML格式。
程序将两者分别提取出来,统一到ACCESS文件当中。
编辑之前之需要将ACCESS文件导出为EXCEL文件进行编辑即可。
格式跟软件内部格式一样,只需进行少量替换和排版就能用于EPWING生产!
提取速度:2词条/S 更新存在问题:
         带有"的词条不能提取
         
上述问题正在解决当中。
日中电脑用语词典下载(未编辑)
匿名提取文件连接 http://pickup.mofile.com/4414395299028038  
     或登录Mofile,使用提取码 4414395299028038 提取文件
更新:中国語新語ビジネス用語辞典(较完美版,重复词条不超过10条)
  匿名提取文件连接 http://pickup.mofile.com/4144120591826385  
     或登录Mofile,使用提取码 4144120591826385 提取文件


请大家帮忙看看有没有什么漏取的词条!


[ 本帖最后由 tony0827 于 2007-3-6 17:36 编辑 ]

评分

1

查看全部评分

回复

使用道具 举报

发表于 2007-3-2 20:56:24 | 显示全部楼层
原帖由 tony0827 于 2007-3-2 12:52 发表
程序已经写出来,并能够完美提取各本字典。
哈哈......,各位感谢我老哥吧。
这样一来,就让大修馆中日字典的提取成为可能。
(目前正在提取当中)
程序占资源的程度很少,几乎可以忽略不计。C++设计。
原 ...


回复 支持 反对

使用道具 举报

发表于 2007-3-2 21:03:00 | 显示全部楼层
谢谢你们的劳动!
回复 支持 反对

使用道具 举报

发表于 2007-3-2 23:00:33 | 显示全部楼层
原帖由 tony0827 于 2007-3-2 12:52 发表
由于按照字母顺序提取,可能导致重复提取同一词条。...
.....
格式跟软件内部格式一样,只需进行少量替换和排版就能用于EPWING生产

由于重复词条的出现,需要大量校对工作量的哦
我试 了2个小时也没排完这个文件的呢
回复 支持 反对

使用道具 举报

发表于 2007-3-2 23:01:33 | 显示全部楼层
世上无难事,只要肯登攀。
回复 支持 反对

使用道具 举报

发表于 2007-3-3 00:01:02 | 显示全部楼层
这个贴子应该加上大分数的哦.
回复 支持 反对

使用道具 举报

发表于 2007-3-3 00:31:32 | 显示全部楼层
原帖由 kouun 于 2007-3-2 15:00 发表

由于重复词条的出现,需要大量校对工作量的哦
我试 了2个小时也没排完这个文件的呢


是吗?重复到了什么地步啊?? 2个小时排了百分之多少呢?
回复 支持 反对

使用道具 举报

发表于 2007-3-3 00:35:46 | 显示全部楼层
先暂时加200吧,我回去看看,视情况考虑加精
回复 支持 反对

使用道具 举报

发表于 2007-3-3 01:34:24 | 显示全部楼层
原帖由 kouun 于 2007-3-2 15:00 发表

由于重复词条的出现,需要大量校对工作量的哦
我试 了2个小时也没排完这个文件的呢

重复词条可以用emeditor进行
回复 支持 反对

使用道具 举报

发表于 2007-3-3 01:35:25 | 显示全部楼层
原帖由 kokuto 于 2007-3-2 17:34 发表

重复词条可以用emeditor进行

或者ultraedit吧!
回复 支持 反对

使用道具 举报

发表于 2007-3-3 02:13:42 | 显示全部楼层
越来越强了,才一阵子没来,就有这些东东出现!
回复 支持 反对

使用道具 举报

发表于 2007-3-3 05:29:50 | 显示全部楼层
-->由于按照字母顺序提取,可能导致重复提取同一词条。

偶想问一下,既然按照字母顺序提取,为甚么会有重复?不太明白...

回复 支持 反对

使用道具 举报

 楼主| 发表于 2007-3-3 05:56:46 | 显示全部楼层
原帖由 ueki 于 2007-3-2 21:29 发表
-->由于按照字母顺序提取,可能导致重复提取同一词条。

偶想问一下,既然按照字母顺序提取,为甚么会有重复?不太明白...


你再等等,那是用之前的程序提取出来的!
我现在正在用修整过的程序重新提取!
回复 支持 反对

使用道具 举报

发表于 2007-3-3 06:22:51 | 显示全部楼层
那些日语汉字里没有的中文汉字不能检索... 都变成外字了...
只能使用拼音检索,是否没有解决办法?

...
回复 支持 反对

使用道具 举报

发表于 2007-3-3 06:41:53 | 显示全部楼层
是在中文系统下抽取的还是 在日文系统下抽取的?excel内是什么码啊,统一码吗?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注~册

本版积分规则

小黑屋|手机版|咖啡日语

GMT+8, 2024-5-27 04:57

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表