2017年12月7日 星期四

Nichols, L. G. (2014). A topic model approach to measuring interdisciplinarity at the National Science Foundation. Scientometrics, 100(3), 741-754.

Nichols, L. G. (2014). A topic model approach to measuring interdisciplinarity at the National Science Foundation. Scientometrics100(3), 741-754.

跨學科研究(IDR)是指由整合多個學科的理論、技術、資料與工具來解決單一學科無法解決的問題。在IDR的測量時,一般假定所有科學之間是一個連貫的學科結構(a coherent disciplinary structure),並且IDR的表現正是本質上模糊了學科之間的界限(Wagner et al., 2011)識別和測量IDR需要在一個研究計畫中評估多個學科的存在和整合,並且包括評估科學的投入,產出和過程(Wagner et al., 2011)。

測量跨學科性(interdisciplinary)的主要挑戰來自確定和界定構成IDR的不同學科。識別、理解和測量IDR需要對引導出研究方法、理論和結論的知識基礎(intellectual bases)進行解析和特徵化。研究人員已經嘗試了多種方法,但測量跨學科性及其隨著時間的動態仍然是一項艱鉅的工作。質性方法通常利用參與觀察、訪談和調查來描述多學科研究人員團隊中的過程和關係,並評估學科整合的程度(參見Masse et al, 2008; Stokols et al, 2003)。量化方法則通常仰賴於文獻計量學和網路分析技術(參見Porter和Rafols 2009; Rafols和Meyer 2008; Leydesdorff 2007),檢驗論文參考文獻列表中出現學科的引用分析是最常用的方法之一(Wagner et al., 2011)。許多有關測量IDR的文獻計量學文獻都側重於研究科學或出版物的產出(Wagner et al., 2011)。

本研究則是使用美國國家科學基金會(National Science Foundation, NSF)獎勵資料庫(award databse)的給獎建議與獎勵,從範圍更廣泛的人力、投入和過程等方面來測量IDR,描述IDR的互動與整合。

Gerrish和Blei(2010)有關測量學術影響(scholarly impact)的研究,比較了傳統的引文分析和基於語言的主題模型方法。他們發現,雖然這兩種方法在整體學術影響方面有一致的結果,但是基於語言的方法通常能確認在質量上有不同的有影響力的文章。Wang等(2011)結合LDA主題模型與網絡分析技術,開發幫助研究人員評估龐大且迅速增長的生物醫學文獻,以確定化學物質、基因和對藥物發現重要的疾病之間的顯著關聯的工具

本文利用NSF主題模型和NSF的體制結構(institutional structure),探討測量NSF獎勵組合中IDR的新方法。NSF主題模型(Newman et al., 2011)幫助NSF的工作人員與科學界更加了解NSF基金組合的內涵與脈絡,同時也提供文件學科內容(disciplinary content )的新評估方式2000年到2011年間由NSF頒發的獎項約170,000利用這些文件訓練NSF主題模型,共1000個主題,在扣除一些僅包含語言中常用的停字詞所組成的主題之後,共923個,並且依據主題對文件上的關連性,對每個獎項指定一到四個主題,主題的次序代表它們的關連性高低。

本研究利用前述運用主題模型方法產出的獎勵的指定主題,評估SBE(Social, Behavioral, and Economic Sciences)部門管理獎項跨學科

本研究利用NSF所屬的各部門代表學科,MPS (Mathematics and Physical Science) 因為包含多個彼此分離的學科,所以再細分第一步先對923個主題,利用所有170,000個獎項的指定結果以及獎項所屬NSF部門歸類。計算每個部門管理的獎項中每個主題出現的頻率,將主題指定給出現頻率最高的學科。如果有某一個主題高頻率地出現在多個部門或是被分配到非研究或是跨學科的部門,此時則進行個別檢視,根據主題描述將其指定給一個學科或是標示為「非學科特定」。非學科特定的主題例如,t3的假設(Hypothesis)、t60的儀器(Instrumentation)、t738的創業(Entrepreneurship)和t889的研究生(Graduate Students)。根據獎勵和主題在所有部門的分布統計,除了生物學(Biology)和地球科學(Geosciences)以外,其他部門兩者間的分布相當類似。生物學擁有10%的獎勵,但卻有18%的主題被指定給生物學,其原因可能是因為生物學包含多個次學科,而且各自使用相當專殊化的語言來描述他們的科學。反之,地球科學主管NSF23%的獎勵,卻只有6%的主題,其原因可能包括地球科學具有比較狹小的學科範圍、比較仰賴共同語言或者較強的跨學科連結。

本研究針SBE(Social, Behavioral, and Economic Sciences)部門管理的獎項進行跨學科性評估,因此在指定主題對應的主要部門後,再進一步針對SBE在2000到2011年間共有14,225個獎項,通過它們上面出現的主題所屬的學科數量以及主題在獎項上的出現排序,計算它們的跨學科性。如果獎勵包含主題的學科有一個被指定為SBE上其他的學科,則將該獎勵視為「內部跨學科性」(internal interdisciplinarity);若是該獎勵中只要有一個主題屬於其他部門或MPS的學科,則視為「外部跨學科性」(external interdisciplinarity),否則便是無跨學科性。除了上述簡單的三元化數量分析外,本研究也利用Stirling’s (2007)的多樣性指標(diversity index)評估每個獎項的跨學科性

此外,為了比較不同組合的科際整合性,本研究特別挑選6個核心計畫(core programs)進行分析: 社會學(Sociology)、政治學(Political Science)、經濟學(Economics)、地理空間學(Geography and Spatial Sciences, GSS)、決策、風險與管理科學(Decision Risk and Management Science, DRMS)和知覺、行動和認知科學(Perception, Action, Cognition, PAC),分析每個計畫內獎項組合的跨學科與Stirling多樣性指標,並且利用Sci2 Team (2009)的Science of Science Toolkit製作每個計畫的共現網路圖(co-occurrence network diagrams),對於從跨學科的各面向(數量、平衡與差異性)解釋和描述了不同類型的跨學科互動情形

研究結果發現,根據簡單的三元化數量分析,89%的SBE獎項是屬於跨學科研究,外部跨學科性和內部跨學科性分別占55%與34%,如果加上獎項的金額做為加權的話,有93%是跨學科研究,其中外部跨學科性高達74%,而內部跨學科性則是19%。其原因是獲得高額的獎勵大多是外部跨學科研究(約占79%),因為這些研究通常是需要較大成本與跨部門研究團隊的大型計畫



研究結果也顯示每年各類型(內部性、外部性)的跨學科研究數量和學科組合相當穩定,雖然各年之間主題分布有差異。而各年Stirling多樣性指標的平均值則是穩定而小幅成長,其原因可能是由於這些計畫大多為多年性的延續計畫。


六個核心計畫的跨學科研究獎勵比例與它們的平均Stirling多樣性指標有很大的差異,以結果來看,GSS、DRMS和PAC在獎勵比例較Economics和Political Science為大,平均Stirling多樣性指標也有同樣的結果,然而Sociology雖然跨學科研究的獎勵比例較大,然而它的Stirling多樣性指標卻較小。根據Stirling多樣性指標的計算方式,推斷造成Sociology在這項指標上較小的原因可能是在Sociology計畫內雖然許多學科都有跨學科研究的關係,但這些學科大多是SBE內的學科,只有少數SBE外的學科。此外,令一個可能的原因是Sociology內獎勵上使用的語言較一般,許多術語也常出現在其他學科中,所以僅僅只有兩個主題被歸類在這個學科,大部分相關的主題都被指定為非特定的SBE,因此在計算上獎勵在Sociology本身上的比例較小,而非特定的SBE的比例較大
以計畫的主題共現網路圖來分析,網路圖上節點代表該計畫內出現的各學科,節點大小表示相對應學科所占獎勵數量比例,節點間的連接線則代表兩個學科曾至少共同出現在一個獎勵,亦即它們之間曾有科際整合的記錄,線的粗細代表它們共同的獎勵數量比例。圖形上節點的數量表示對應計畫內學科的種類數量(variety),平均相連程度和網路密度則可以用來測量學科間的互動程度。例如,DRMS和Economics的網路上各有23個不同的學科,但是DRMS的平均相連程度和網路密度都比Economics來得大,分別是0.345 vs. 0.252和9.74 vs. 7.13,其原因是DRMS計畫內的獎勵大多由3到4個學科組成,而Economics的獎勵則只有2個學科。