Trend Watching-Social

Monday, January 16, 2006

學術搜索 不學有術

學術搜索 不學有術


小桐╱北京特稿

對於中文使用者而言,下面的報導無疑是個好消息:

在1月11日和12日這兩天,全球互聯網第一搜索引擎Google和第一中文搜索引擎百度,幾乎是不約而同地把焦點瞄準了中文:Google發佈了其學術搜索的中文版(scholar.google.com),百度則發佈了其國學搜索(guoxue.baidu.com)。

Google Scholar已發佈中文版。
(本畫面擷取自http://scholar.google.com)

Google學術搜索可以幫助使用者準確搜索到某一領域的學術文獻。據Google全球副總裁、中國區總裁李開復稱,目前全球互聯網上的中文學術文獻的數量僅次於英文,中文已經成為互聯網第二大語言,這也是Google積極推出中文學術搜索的主要動力。

目前,Google 學術捜索可搜索到用西歐語言、中文和巴西葡萄牙語撰寫的文獻。百度國學則主要專注於中國傳統歷史文化領域的資料搜索。目前兩者均免費。

沒有上網,也能找到

記者最近正在研讀《隋書》(中華書局版),就隨便在Google學術搜索上查了一下該書的主編“魏徵”,結果第一條就是唐朝魏徵主編的《隋書》。同一時刻(1月12日9:30),在百度國學上沒有找到任何結果。

百度的「國學搜索」。
(本畫面擷取自http://guoxue.baidu.com)

不過,Google學術搜索這第一條結果無法點擊進去,該條目最左邊的方括號中寫著“引用”兩字。

據Google資深工程師趙羽可介紹,Google學術搜索除了能否檢索到大部分已經上網的學術文獻外,還可以通過對這些在線文獻進行邏輯分析,找出那些沒有上網的、但也許更加重要的文獻,魏征主編的《隋書》就是一例。

原來,有許多在線的學術文章中都引用了該書的內容,版本也多為中華書局版,於是,該版就成為“魏征”詞條下最重要的一條結果。當然,該書是否在線並不是研究者的最大障礙,重要的是,研究者知道了確實還有這麼一本書可以參考。

Google學術搜索涵蓋了各方面文獻(百度目前僅限於國學等幾個領域),包括沒有上網的文獻,比如,愛因斯坦的很多著作並未在線發佈,但卻被眾多學者所引用,通過Google學術搜索,一樣能找到這些被引用文獻的名稱、版本、作者、出版日期、出版社、內容摘要等資訊。通過提供這些引用資訊,使研究者瞭解到許多重要的未上線文獻。

Google傑出工程師Anurag Acharya說:“我們不知道下一個重要的突破會來自哪裡,但我們相信,通過使各地研究者更輕鬆地瞭解在全球範圍內已取得的研究成果,我們可以對他們有所幫助。”

搜索結果的排名順序對研究者而言,可能比普通用戶更為重要。

趙羽可介紹,Google學術搜索的文獻排名是嚴格按照文章的學術價值來進行的,參考因素包括文獻、作者、出版者的權威性,被引用的次數等,與普通 Google網頁排名大有不同。

例如,查詢“Human Genome”(人類基因組),普通 Google搜索結果超過700萬個,排名在前面的都是機構首頁,包括美國能源部、美國國家衛生研究院等,到了20名前後才出現刊登於《自然》、《科學》的相關文章。而Google學術搜索只命中39萬個結果,排名前10位的都是在《自然》、《科學》等著名學術媒體上發表的文章。至於學術搜索的結果排名是否與Pagerank排名相似,趙羽可認為,有類似地方,但也有大不同。

【文稿來源:ChinaByte授權,武陵客代理】

0 Comments:

Post a Comment

<< Home