我們就一些搜索案例的比較來給大家展示一些網(wǎng)絡(luò)文檔搜索的技巧,并對(duì)主要提供文檔搜索的搜索引擎百度和google做一比較,這些比較和方法也許會(huì)對(duì)你進(jìn)一步準(zhǔn)確獲得你想要的信息有幫助!主要比較文檔數(shù)量,語法使用的靈活性,準(zhǔn)確性,多語法混合使用等等
多語法混用
一般的邏輯搜索:+ - | 均能很好的支持
filetype:doc 演講稿 吳敬璉
filetype:doc 演講稿 - 教師
filetype:doc 演講稿 | 演講
其他專業(yè)
搜索指令:
吳敬璉 filetype:doc site:pku.edu.cn
歷史 filetype:doc inurl:org
經(jīng)濟(jì) filetype:doc inurl:title 目前網(wǎng)絡(luò)上很少有中文文件夾所以這樣的檢索也是沒有意義的。
其他支持
1 支持對(duì)擁有
文檔類型的搜索,filetype:all
2 支持把原來文檔轉(zhuǎn)換成html格式文檔瀏覽
3 不支持對(duì)更多文檔類型的擴(kuò)展,但是可以在mp3搜索中選擇flash類型搜索,但是百度支持在網(wǎng)頁搜索中輸入“mp3:劉德華”“flash:小兵”來搜索歌曲
1 不支持對(duì)擁有
文檔類型的搜索,
2 支持把原來文檔轉(zhuǎn)換成html格式文檔瀏覽
3支持對(duì)更多文檔類型的擴(kuò)展,如swf/xml 目前google還不支持更多
表2其他參數(shù)比較
一搜也提供文檔搜索,目前支持的文件類型不多,文檔的數(shù)量也不夠(或者可檢出的數(shù)量不夠),而且使用習(xí)慣與其他的不同(google,altavista,alltheweb等)所以不列入比較范圍??傮w評(píng)價(jià),百度多文檔搜索無論從搜索的質(zhì)量和數(shù)量都是要與google相當(dāng),甚至超出google,說明,中文搜索引擎在應(yīng)用的深層次挖掘上已經(jīng)不再落后于外來服務(wù)商。
我們有理由相信百度會(huì)提供更多更好的功能!www.jsfengchao.com 原創(chuàng)
數(shù)據(jù)
Query
參比引擎
百度
Google
filetype:doc 搜索引擎
1050
743
filetype:doc 計(jì)算語言學(xué)
546
214
filetype:doc 計(jì)算機(jī)檢索
17700
6080
filetype:ppt課件
13900
1480
filetype:ppt 軟件開發(fā)模型
filetype:ppt 軟件 模型
560
697
919000
697
filetype:pdf xml專業(yè)
編程
55
116但是匹配的質(zhì)量很差,由各自不同的分次特點(diǎn)決定的。
filetype:pdf 服務(wù)器安全
17800
6240
filetype:xls 報(bào)名
9940
1890
filetype:xls 名單
32300
3000
表1 文檔數(shù)量比較
性能
功能
參比引擎
百度
Google
靈活性
支持三種方式查詢
1 filetype:格式 關(guān)鍵詞
2 關(guān)鍵詞filetype:格式
3 在專業(yè)
搜索里選擇
支持三種方式查詢
1 filetype:格式 關(guān)鍵詞
2關(guān)鍵詞 filetype:格式
3 在專業(yè)
搜索里選擇
準(zhǔn)確性 整體上講跟網(wǎng)頁搜索的效果差不多 ,由于各自分詞的特點(diǎn)不同,所以對(duì)中文語義的理解上就會(huì)出現(xiàn)差異,所以在結(jié)果的數(shù)量并不是大部
,但是對(duì)大多數(shù)關(guān)鍵詞來說,百度的結(jié)果還是比較符合搜索目標(biāo)的,而個(gè)別google的搜索結(jié)果就不太能令人滿意。這也是由于google的強(qiáng)行前臺(tái)分詞造成的,結(jié)果數(shù)量多,并不精準(zhǔn)。對(duì)于文檔搜索來說準(zhǔn)確恰當(dāng)才是更
重要的,數(shù)量只是其次。
