咖啡日语论坛

 找回密码
 注~册
搜索
查看: 2245|回复: 16

请教日文搜索引擎的问题!

[复制链接]
发表于 2004-8-10 21:36:20 | 显示全部楼层 |阅读模式
  请问一下,
有没有高人知道如何制作日文的搜索引擎呢???
搜索引擎是如何认识出一个日文词, 并正确找到, 而不是其它的组合呢?

问题应比较蠢。。。
连我自己也不明白问题到底是什么???
回复

使用道具 举报

发表于 2004-8-10 21:44:18 | 显示全部楼层
嗯~~~~~~~~~基本上是从数据库中搜索,每个字都有对应的编码,当收到搜索命令后程序就到数据库中按照编码查询,并将搜索结果列出来以供选择。
这是最简单的,咖啡论坛也有这个功能。
高级一点的就要包括词的意义的判断和筛选,搜索结果的排名等等,要是知道这些东东怎么制作了,估计也不会在这里开论坛陪大家灌水了,HOHOHO
回复 支持 反对

使用道具 举报

发表于 2004-8-11 00:31:10 | 显示全部楼层
  的确是书念的太少
HOHOHO

PS:跟中文搜索引擎是一样的...
回复 支持 反对

使用道具 举报

 楼主| 发表于 2004-8-11 03:33:39 | 显示全部楼层
因为没学过电脑啊, 网络啊,所以什么不不是很清楚。。。

自己制作一个搜索引擎,
如果, 是英文的, 德文的什么的,
都因为词跟词之间有空格,
所以可以识别是一个词。。。
而日文都没有空格的,
是如何辨别出一个词的组合的?
大概应该是这么个问题。。。

呵呵, mac啊, 那个中文的怎么回事, 我也搞不清呢。。。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2004-8-11 03:36:14 | 显示全部楼层
下面是引用Mashimaro于2004-08-10 10:44 PM发表的 :
嗯~~~~~~~~~基本上是从数据库中搜索,每个字都有对应的编码,当收到搜索命令后程序就到数据库中按照编码查询,并将搜索结果列出来以供选择。
这是最简单的,咖啡论坛也有这个功能。
高级一点的就要包括词的意义的判断和筛选,搜索结果的排名等等,要是知道这些东东怎么制作了,估计也不会在这里开论坛陪大家灌水了,HOHOHO


每个字都有一编码???
那么每几个字符的组合也对应一个编码???
而且组合是有限的吗。。。
是怎么制作出来的???
使用什么软件呢???
回复 支持 反对

使用道具 举报

发表于 2004-8-11 12:47:05 | 显示全部楼层
呵呵,现在许多搜索网站都链接到GOOGLE的搜索引擎,只不过自己做了一个简单页面,这样又省事,功能又强大.你也可以用一下呀!
回复 支持 反对

使用道具 举报

发表于 2004-8-11 13:00:46 | 显示全部楼层
下面是引用莎蓝于2004-08-11 4:36 AM发表的 :



每个字都有一编码???
那么每几个字符的组合也对应一个编码???
.......

ASCII是AmericanStandardCodeforInformationInterchange的缩写,用来制订计算机中每个符号对应的代码,也叫计算机内码。每个ASCII码以1个字节(Byte)储存,从0到数字127代表不同的常用符号,例如大写A的ASCII码是65,小写a则是97等.
而一般亚洲国家的语言如汉字,假名等,每一个字符都占2个字节.实现时都是采用自己的编码方式来完成的,现在一般程序都采用Unicode编码方式,这样就可以显示全世界的语言了.
而实际的实现方式你不用管,只要你以中文输入到数据库,再用一些查询语句,计算机就会完成这些功能,自动查出匹配的中文.
回复 支持 反对

使用道具 举报

发表于 2004-8-11 14:50:57 | 显示全部楼层
例:

数据库里有句话—  是如何辨别出一个词的组合的?

当你搜索关键词: 如何
数据库就会为你找出上面的语句
当你搜索关键词: 何辨
数据库也会为你找出上面的语句
当你搜索关键词: 是
数据库也会为你找出上面的语句

搞不懂你所说的空格跟搜索有什么关系?!
回复 支持 反对

使用道具 举报

 楼主| 发表于 2004-8-11 16:15:41 | 显示全部楼层
下面是引用ryukin于2004-08-11 1:47 PM发表的 :
呵呵,现在许多搜索网站都链接到GOOGLE的搜索引擎,只不过自己做了一个简单页面,这样又省事,功能又强大.你也可以用一下呀!

我们是做DVD, 不是网页,
所以不能链google吧。。。

你的意思是不是说,
制作时根本不需理会,
它自然会找出来呢?
我们在那奇怪,
电脑是否能认识一个日文词?
是怎么认出来的。。。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2004-8-11 16:22:20 | 显示全部楼层
下面是引用mac于2004-08-11 3:50 PM发表的 :
例:

数据库里有句话—  是如何辨别出一个词的组合的?

当你搜索关键词: 如何
.......

不懂阿。。。
如果是英文, 德文,法文,
每个词与词之间都有一个空格,
所以, 可以查出is, and
而不是i, sand。。。
问题是,日文字符间都没有空格,
是否能查正确的组合呢???
回复 支持 反对

使用道具 举报

发表于 2004-8-11 16:49:48 | 显示全部楼层
一个假名一个假名(或汉字)地判断,看看与下一个假名或汉字是否组合成单词。←这个过程要查字典啦。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2004-8-11 17:30:33 | 显示全部楼层
晕倒。。。
楼上说的跟我问的是两码事阿。。。
我问的是日文搜索引擎的制作问题,
怎么还让我去查字典了。。。
回复 支持 反对

使用道具 举报

发表于 2004-8-12 09:55:19 | 显示全部楼层
下面是引用莎蓝于2004-08-11 6:30 PM发表的 :
晕倒。。。
楼上说的跟我问的是两码事阿。。。
我问的是日文搜索引擎的制作问题,
怎么还让我去查字典了。。。

缓解一下气氛也是挺好的吗!:)
回复 支持 反对

使用道具 举报

发表于 2004-8-12 10:03:21 | 显示全部楼层
下面是引用莎蓝于2004-08-11 5:15 PM发表的 :
  

我们是做DVD, 不是网页,
所以不能链google吧。。。

.......


不是做网页呀,那就不能用链接GOOGLE的方法了,不好意思呀!:)

只要你装的数据库支持日文,系统就会自动识别的.这个你不用管它.
例如:用 select * from table_name where field like '%わ%'的话,就会把field字段中所有包括わ的内容找出来了.
回复 支持 反对

使用道具 举报

发表于 2004-8-12 10:13:05 | 显示全部楼层
下面是引用莎蓝于2004-08-11 5:15 PM发表的 :
  

我们是做DVD, 不是网页,
所以不能链google吧。。。

.......

又看了一下你的问题,我刚才说的有些跑题了,不好意思!
你是想问它是怎么识别这些日文等字符的,是吧?
对于数据库本身的运行机制(当然有好几种数据库),偶也说不清,不过我觉得你可以到程序员大本营的论坛去问一下,那里高人很多的!!:)
网址是www.csdn.net
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注~册

本版积分规则

小黑屋|手机版|咖啡日语

GMT+8, 2024-10-2 18:15

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表