星期二, 12月 27, 2011

在impct factor之外 -- 談Google Scholer Citation 及 Microsoft Academic Search 服務

http://k-review.com.tw/2011/11/01/1049/之前在我的文章 -- 學術界的遊戲:impact factor -- 中,就有提到,由於impact factor的提出和採集方式怪怪的,還有不少的疑點和邏輯上的瑕疵。

在左邊這一篇 -- 撤稿論文不死 --,就是談到我其中的論點,只要刊出來,就會有人"錯誤"的引用"錯誤"的內容,寫出"錯誤"的文章。一整顆樹都壞了(可以說是學術界的"毒樹"理論嗎?)。

所以,有人考量是不是以page rank來表示一篇文章的價值。這個計量值是google用在計算網頁的實用度和熱門度的一個值,只要安裝google toolbar就會看到。不過,為了不讓湯普生公司專美於前,兩大搜尋引擎在自己搜尋的演算法之外又加上這個附加價值,開始了另一個競爭了。他們紛紛在這兩年中推出了他們定義的定量值。而且,他們的運作和參考用途是"免費"的喔!
http://k-review.com.tw/2011/09/01/1031/詳細的新聞內容,請看左側的 -- 谷歌和微軟的學術量表 -- 一篇文章。只是,由於他們的演算法不斷在加強中,誰知道這樣的結果,是不是符合科學上"可以被重覆"的研究。而且,他們的特色是使用電腦"演算法"來處理。因此是不是很容易出現電腦常常會搞錯的事,像說是spelling error,卻當作是兩篇不同的文章。

Google在這一方面蠻有技巧的。現在的Google Scholer Citation服務之外,即推出了個人化的量表服務。它引用了兩個指數:h-index及i10-index。h-index表示最近5年內,你的文章被引用的次數/你文章的總數量。而i10-index表示最近5年內,你被引用超過10次的文章數量。這只能表示,好文章和好作者都是不寂寞的。

不過,Google Scholer Citation服務比較重視個人,至少我還沒玩到可以看到institude的功能。而且如果你沒有上去編輯你的citation,而且沒設定開放,原則上我是沒辦法查出你的index的。


這一方面,微軟的 Microsoft Academic Search(MAS)相對強悍多了,但是也相對缺乏隱私和正確性(因為經常是沒有作者的conformation,只有運算式及搜尋引擎的結果)。我把兩個工具的結果截圖,po在下面給大家看看。


看得出來吧,這是Google Scholer Citation的結果:
( 我有edit過我寫過和參與過的paper )
http://scholar.google.com/citations?user=wjNO1-oAAAAJ

而這是Microsoft Academic Search(MAS)的結果:
( 我並沒有edit過 )
http://academic.research.microsoft.com/Author/24608873/heng-sheng-chao
可以看到幾個問題:
  1. 他們把一般學術會議的poster也當作是一篇文章計算
  2. 兩家都一樣,沒有SCI的華文雜誌可能無法收錄(又回到那間老公司訂的規則了)
  3. 如果可以 edit,把沒被引用的踼除,可以人為的增加h-index(因為分母變小了)
  4. 兩家找到的篇數是不同的(沒編輯的狀況下,Google找到6篇,Microsoft找到5篇)
以下這個則是全院的結果,明顯看到Microsoft Academic Search 整合了圖片搜尋結果,把某些大頭們的照片也抓出來了(或是他們的msn也用同一個名字??)
http://academic.research.microsoft.com/Organization/1404/taipei-veterans-general-hospital

Microsoft Academic Search則是引用了h-index之外的g-index。

不過,想要把複雜的研究環境、研究生態和研究心理,用幾個簡單的index就混過去,就來評斷,也只能說,這樣下來還是遊戲

沒有留言:

//for syntaxhighlighter 3 //看一下載入的JS模組有哪些,不要的就刪掉 //end syntaxhighlighter 3