Histcite是一款科研文獻引文分析利器,通過數據分析,可以快速繪製出某個研究領域的發展脈絡圖,讓你找到重要文獻和學術大牛。是一款受眾非常小的強大工具。
首先需要從 WOS 下載某個領域的文獻,導出後使用 HistCite 分析,製作出脈絡圖,在這個過程中由於到處文本格式問題,需要折騰。於是作者就用 Python 寫了一個更好用的增強版本,稱為 HistCite Pro,比原版更加好用一些。
如果你選修過中國科學技術大學羅昭鋒老師的MOOC課程《文獻管理與信息分析》,那麼你一定不會對HistCite這款軟件陌生。這是一款非常強大的引文分析工具,可以快速繪製出某個研究領域的發展脈絡,快速鎖定某個研究方向的重要文獻和學術大牛,還可以找到某些具有開創性成果的無指定關鍵詞的論文。
以前,我們在 Web of Science (以下簡稱WOS)上搜索某個研究領域的文章,通常都是按照被引次數倒序排列,想當然地認為前麵幾篇文章肯定是最重要的了,其實不然,往往有幾篇更重要的文章並沒有上榜。如果說引用你的文章表示給你的文章投一票的話,全球引用你文章的人太多了,但並不都是有效引用,隻有相同領域的人引用的才能真正表示你在這個領域中的實力。另外還有一種可能,你是某個研究方向的開創者,比如你發明了某種材料,但是後來這種材料的名字變了,所以之後的文章用的關鍵詞都是新名字,你搜新名字關鍵詞是搜不到你的開創性文章的,而這個研究方向的論文全部引用了你的文章,可見你的文章非常重要。
好了,話不多說,下麵開始使用這個工具。首先要了解一點,HistCite這款軟件是Thomson Reuters公司開發的,對,和WOS是一家公司,所以HistCite隻支持WOS數據庫。
打開WOS,注意數據庫要選擇核心合集(Core Collection)!
由於我的研究方向是鋰離子電池,所以簡單檢索了一下“lithium ion batter*”,注意要帶雙引號表示嚴格匹配,而且此處的星號不是被和諧的,而是通配符,表示最後一個單詞可以是battery或者batteries。
檢索了一下,發現結果有29000多條,看來這個研究方向真的很熱啊!
麵對這個龐大的數字,我果斷選定了其中的一個小方向——石墨烯在鋰離子電池負極中的應用。檢索詞如下:
嗯哼,結果不錯,隻有2819條,然後按照被引頻次(降序)排序。
下麵開始導出文獻信息,由於文獻總數不是太多,可以全部導出,如果文獻太多的話,隻導出前2000篇就差不多了。點擊頁麵上的【保存至 Endnote Online】按鈕右邊的下拉按鈕,選擇【保存為其他文件格式】。
在彈出的菜單中,記錄數填寫1到500,因為每次最多隻能導出500篇文獻,所以上麵的2819篇文獻需要分成6次導出,後麵導出的時候依次填寫501到1000、1001到1500等等。。。記錄內容選擇【全記錄與引用的參考文獻】,文件格式選擇【純文本】,然後點擊發送即可得到導出的txt文件,類似可以導出其他5個。
有了6個TXT格式的文獻引文數據文件,那就開始用HistCite來分析吧。好像目前這款軟件好多年沒有更新了,所以現在出現了各種Bug,比如我雙擊打開HistCite,然後彈出一個IE瀏覽器窗口,我點擊File菜單下麵的Add File加載txt文件,然後就報錯了:No such file or directory
難道必須在C盤下麵創建一個fakepath文件夾,然後每次都要把全部的txt文件拷貝進去再一個一個加載進來嗎?太繁瑣了吧。
然後羅老師就說了,其實可以直接把全部的txt文件拖放到HistCite的啟動圖標上,然後就可以自動加載了,好的,關掉剛才打開的HistCite,我來試試這個方法。選中所有的txt文件,然後拖到HistCite的圖標上,放開鼠標,果然自動打開了軟件。
但是,事情好像並沒有那麼簡單,不一會兒,又出現了一個報錯:Format Unknown。
這TMD是怎麼了,難道就不能好好的成功一次給我看看嗎?
最後,在羅老師的指引下,我將每個txt文件的第一行中的Science改成了Knowledge。然後再將txt文件拖放到HistCite圖標上麵打開,終於成功加載了!
可以看到2819篇文獻信息全部加載進來了。
在受到這麼多的折磨之後,我不得不吐槽HistCite軟件用起來怎麼這麼不爽,於是就想著能不能用Python開發一個方便使用的腳步,很快,用了30行代碼就完成了,真得再一次給Python點個讚!為了方便更多的人使用,用py2exe轉成了exe程序,於是一個以HistCite為核心的精簡易用免安裝版本問世了,暫時就叫HistCite Pro吧,嘻嘻~
這款軟件用起來非常方便,隻要你是Windows係統,下載了就可以直接用,不用安裝,而且去掉了很多沒有用的文件,大大縮小了軟件體積。對於從WOS上導出的txt文件,不用做任何修改,隻要把全部的txt放到TXT文件夾裏麵,然後雙擊main.exe即可一鍵完成加載,非常方便。當時把這個軟件推薦給羅老師,他還同時轉發到了東區和西區的課程QQ群裏,真是感動~
HistCite Pro 下載鏈接:http://pan.baidu.com/s/1hsIwJzQ
好了,數據加載完畢,下麵開始分析數據吧,點擊Tools菜單下的Graph Maker。
在彈出的頁麵上點擊 Make Graph 即可得到一張引文關係圖,看上去好像很亂,實際上卻包含了最有價值的前30篇文章的完整引文關係。當然了,我的這張圖沒有太多分塊的聚集區域,圖還是非常好的。
這張圖看起來不是很清楚,於是在左邊的Size選項中選擇了Full模式,重新繪製了一張,果然清晰多了,然後右擊圖片“另存為”一張圖片即可。
圖上有30個圓圈,每個圓圈表示一篇文獻,中間的數字是這篇文獻在數據庫中的序號。圓圈越大,表示被引用次數越多,受到關注越多。不同圓圈之間有箭頭相連,箭頭表示文獻之間的引用關係。多數情況下,你會看到最上麵有一個圓圈較大,並有很多箭頭指向這篇文章。那麼這篇文章很可能就是這個領域的開山之作。
通過我繪製出的這張關係圖,我們發現標號為29、49、56、60的四個大圓圈非常顯眼,可見這四篇文獻的被引次數都是非常高的,我們對全部文獻進行按照LCS排序,發現前四位剛好就是這4篇文獻。
再回到那張圓圈箭頭關係圖,可見石墨烯在鋰離子電池負極材料中的應用研究主要起源於2008年(29號文獻),其通訊作者Honma來自日本,看來日本在石墨烯電池方麵的研究開展得相當早。之後,在2010年,很多原創性的成功迸發而出,具有代表性的就是49、56、60、48號文獻,非常有趣的是,2010年諾貝爾物理學獎的獲獎項目剛好是石墨烯,其中的關聯顯而易見。之後的幾年,石墨烯在鋰離子電池負極方麵的研究越來越多,方向約越來越細。
好了,前麵提到HistCite可以找到某些具有開創性成果的無指定關鍵詞的論文,我們來看看是怎麼辦到的。點擊頁麵上的【Cited References】,然後就可以看到本地庫中文獻參考的全部文獻信息,後麵帶有加號的表示本地txt庫中沒有包含,這些往往就是被遺漏的重要文獻。
同樣的,我們點擊上麵的【Authors】按鈕,可以找到本領域的一些大牛,具體的讀者可以自己去摸索。最後附上HistCite裏麵幾個重要的英文縮寫(感謝Dingledodies知友):
GCS(global citation score), 某一文獻在WOS數據庫中的總被引用次數。有些引用這篇參考文獻的文章可能和你的研究方向毫無關係,但GCS還是會把這個引用數據記錄下來。
LCS(local citation score),某一文獻在本地數據集中的被引用次數。因為你導入Histcite的文章都是和你檢索詞有關係的,可以認為這些文章是你的研究同行,因此如果某一篇文獻的LCS值很高,就意味著它是你研究領域內的重要文獻,很有可能是你領域內的開創性文章,注意LCS高的文獻和GCS高的文獻不一定是同一篇!
LCR(local cited references), 某一文獻引用本地數據集中參考文獻的數目。根據LCR值的排序,可以快速定位近期關注該領域的重要文獻,因為某一篇文獻引用當前數據集中的文獻數越多,說明它非常關注你檢索的這個研究方向的文獻,和你的研究肯定有相似或者可參考之處,可以從該文章中發現新動向。
CR(cited references), 某一文獻引用WOS數據庫中參考文獻的數目。這個值越高,說明這篇文獻很可能是綜述性文獻,可根據該值的排序,也可快速定位綜述文獻。
76.4M / 03-25
立即下載55M / 06-05
立即下載237.9M / 04-13
立即下載140.5M / 03-06
立即下載900.9M / 03-02
立即下載96.2M / 07-06
立即下載311.2M / 07-06
立即下載335M / 07-06
立即下載200M / 07-06
立即下載413.8M / 07-06
立即下載353.9M / 06-05
立即下載131.8M / 04-13
立即下載230.8M / 03-03
立即下載195.6M / 03-03
立即下載165.4M / 03-03
立即下載45.6M / 09-08
立即下載665.2M / 07-06
立即下載2.84G / 07-06
立即下載93M / 07-06
立即下載338.3M / 07-06
立即下載1.38G / 07-26
立即下載488.3M / 07-16
立即下載109.8M / 06-03
立即下載142M / 01-08
立即下載1.2M / 11-23
立即下載548.8M / 04-13
立即下載1.6M / 04-13
立即下載1.48G / 03-18
立即下載646.6M / 03-03
立即下載133.7M / 03-03
立即下載325.8M / 06-07
立即下載60M / 04-29
立即下載254M / 04-25
立即下載659M / 04-23
立即下載1M / 12-26
立即下載253.4M / 12-08
立即下載253M / 12-08
立即下載1.19G / 11-16
立即下載110.5M / 04-23
立即下載26.7M / 03-16
立即下載488.3M / 07-16
立即下載248.9M / 12-08
立即下載248.9M / 12-08
立即下載201.2M / 04-13
立即下載100.6M / 03-06
立即下載148.9M / 03-06
立即下載1.12G / 07-06
立即下載1.25G / 07-06
立即下載9.48G / 07-06
立即下載50KB / 07-06
立即下載116.2M / 04-10
立即下載1.92G / 04-17
立即下載201.5M / 04-13
立即下載7.31G / 07-01
立即下載94.3M / 07-06
立即下載2.48G / 07-06
立即下載7.63G / 07-06
立即下載1M / 07-06
立即下載778.1M / 07-06
立即下載509.7M / 07-06
立即下載561.8M / 07-11
立即下載1.32G / 01-19
立即下載72M / 07-06
立即下載548.7M / 07-06
立即下載1.00G / 07-06
立即下載9.13G / 07-06
立即下載126.2M / 07-06
立即下載72M / 07-06
立即下載105.1M / 07-06
立即下載132M / 07-06
立即下載