文獻可分為一次文獻、二次文獻、三次文獻。一次文獻是作者本人以自己的實踐經驗、科學觀察為依據而創作的原始文獻,如期刊論文、會議論文、學位論文、研究報告、專利文獻、技術標準等。二次文獻是對一次文獻進行加工整理后產生的一種文獻,如書目、題錄、字典、文摘等檢索工具。三次文獻是在一次文獻和二次文獻的基礎上,經過綜合分析而編寫出來的文獻,常把這類文獻稱為“情報研究”的成果,如綜述、年鑒、百科全書、數據手冊等。下面重點介紹學術文獻檢索方法,論文數據庫查找論文資料大全,具體如下:
?。ㄒ唬W術文獻檢索方法
按照文獻的材質,文獻檢索可以分為紙質實體文獻檢索與電子網絡文獻檢索。當前,我們主要通過互聯網絡、電子數據庫獲取文獻信息。所以,下面重點介紹互聯網、電子數據庫常見檢索方法。
1.互聯網檢索。
互聯網檢索通常借助網絡搜索引擎展開。作為互聯網中的信息檢索系統,搜索引擎按其工作方式,可以分為全文搜索引擎、目錄搜索引擎和元搜索引擎。全文搜索引擎是目前廣泛應用的主流搜索引擎,著名的谷歌(Google)、百度(Baidu)搜索等部屬于全文搜索引擎,可以直接輸入檢索詞,系統會自動在抓取到的網頁中展開全文搜索;目錄搜索引擎常見的有雅虎(Yahoo)、新浪(Sina)搜索等,主要通過瀏覽目錄的方式檢索;元搜索引擎則是在檢索框中輸入檢索詞,選取要調動的搜索引擎,同時使用多個搜索引擎進行檢索,系統再根據相關度進行排序。
2.電子數據庫檢索。
各種專業數據庫是開展學術研究時必須借助的權威數據庫和學術文獻獲取來源。每個數據庫有自己的檢索規則,但是,通常都支持以下幾種檢索方式。
A.布爾邏輯檢索法。
布爾邏輯檢索法是指利用布爾邏輯運算符連接前后檢索詞,然后由計算機進行相應的邏輯運算,以找出所需信息的方法。它是最常使用的檢索方法。布爾邏輯運算符主要包括“AND”“OR”“NOT”三個,分別代表邏輯且、或、非,在具體操作中,也經常表達為“*”“+”“-”,優先級別是NOT>AND>OR.其具體含義見表1.1.
B . 截詞檢索法。
截詞檢索法是一種利用檢索詞的詞干或者不完整的詞性查找信息的檢索方法,它一般只適用于外文檢索。主要分為限制式截斷、非限制式截斷與嵌入式截斷。限制式截斷是指對詞干后可以出現的字母數量進行限定,比如,inform??(兩個問號代表檢索含有inform和inform后只能有兩個字母的檢索詞的文獻信息),brows* (*代表可以把數據庫中存儲的前5個字符為“brows”對應的文獻記錄都檢索出來)。非限制式截斷是指對詞干前后出現的字母數量不做限定,一切能與輸入的詞干相匹配的字串,無論詞干后或詞干前是什么字母、多少字母都屬于命中范圍,它是在單詞或詞頭后加“?”表示。嵌入式截斷是指檢索詞中間嵌入截斷符號(有的系統用“?”,有的用“*”),檢索式嵌入的字母數與截斷符號數相同。
C. 字段檢索法。
字段檢索法是一種對檢索詞在數據記錄中出現的字段范圍進行限定的檢索方法。寧段是數據庫記錄中的基本單位。它包括反映文獻內容特征的基本字段(如題名字段、文摘字段、主題詞字段、敘詞字段等)和反映文獻外在特征的輔助字段(如著者字段、語種字段、時間字段等)。
每個字段都有一個用兩個字母表示的字段代碼,如題名一TI、文摘一AB、著者一AU、語言一LA、出版者一PN、敘詞一DE等。在具體檢索時,基本字段常以后綴符形式出現,格式為:[檢索詞]/[寧段代碼];輔助字段常以前綴符形式出現,格式為:[字段代碼]=[檢索詞].
(二)學術研究中常用電子數據庫
圖書館的電子數據庫資源是開展學術研究時查找文獻的主要工具。各種電子文獻數據庫在資源類型、數量、使用方法上不盡相同,下面重點介紹開展學術研究時經常使用到的幾種電子數據庫的資源分布類型與檢索方法。
1.CNKI數據庫。
CNKI即中國知識基礎設施工程(China NationalKnowledge lnfrastructure),其網站即數據庫稱為中國知網。CNKI工程是以實現全社會知識資源傳播共享與增值利用為目標的信息化建設項目,由清華大學、清華同方發起,始建于1999年6月。CNKI數據庫是該工程的核心,CNKI資源總庫包括眾多數據子庫,主要有中國學術期刊網絡出版總庫、中國優秀博(碩)士論文全文數據庫、中國重要報紙全文數據庫、中國重要會議論文全文數據庫、中國圖書全文數據庫、中國年鑒網絡出版總庫、中國經濟社會發展統計數據庫、中國經濟信息文獻數據庫、中國法律知識資源總庫法律法規庫、中國標準數據庫、中國專利數據庫、國家科技成果數據庫、國外標準數據庫等。
下面主要以中國學術期刊網絡出版總庫(又稱CNKI期刊全文數據庫)為例,介紹CNKI數據庫檢索方法。中國學術期刊網絡出版總庫檢索方法主要分為快速檢索、標準檢索和專業檢索。
A.快速檢索。
在圖書館主頁點擊進入馴KI期刊全文數據庫后,在檢索框上方點擊“快速檢索”,進入快速檢索頁面,如圖1.1所示??焖贆z索只有一個檢索框,不限定寧段、詞位及詞頻,系統將在全文中進行檢索匹配。在快速檢索框中輸入檢索詞,點擊“快速檢索”即可。
B.標準檢索。
標準檢索即我們常說的高級檢索,它可以限定各類檢索字段、規定詞頻等,進行有效地布爾邏輯組合檢索,減少檢索冗余,提高檢索效率。因此,我們一般提倡使用標準檢索進行文獻查詢。標準檢索的一般步驟為:點擊頁面上的“標準檢索”進入標準檢索頁面,如圖L 2所示;輸入檢索控制條件,一般限定期刊年期、來源期刊類別(全部期刊、肋來源期刊、殿來源期刊、核心期刊)等字段;輸入內容檢索條件,通過限定主題、題名、關鍵詞、摘要、全文、參考文獻等內容字段,對文獻進行篩選,這里需要指出的是,當同一字段需要包含多個檢索詞的時候,可以點擊檢索框右邊的十字形“顯示以輸入詞為中心詞的擴展詞”,進行檢索詞補充;點擊“檢索文獻”按鈕,對檢索結果進行評價,并可進行二次檢索。
C. 專業檢索。
專業檢索可以提供一個按照用戶實際需要組合邏輯表達式的檢索方式,這種方式可以有效提高檢準率。具體步驟是;點擊頁面上方的“專業檢索”進入專業檢索頁面,如圖l 3所示;在頁面右上方選擇所要檢素數據庫的范圍;在檢索框中輸入組配檢索式,點擊“檢索”,查看檢索結果。針對檢索式的編寫,CNKI在檢索框下方有明確說明,檢索表達式的語法規則也在“檢索文獻”按鈕上方有具體鏈接說明,用戶可參照指南具體操作。需要說明的是,檢索式中檢索詞的引號都是半角輸入環境下的。
2.維普數據庫。
維普數據庫是由科學技術部西南信息中心下屬的一家大型專業化數據公司--重慶維普資訊有限公司開發研制的。維普數據庫又稱“中文科技期刊數據庫”,源于該公司于1989年創建的“中文科技期刊篇名數據庫”,現已成為國內各高校文獻保障和檢索系統的重要組成都分。維普數據庫包含了1989年至今的8000余種期刊刊載的830余萬篇文獻,并以每年150萬篇的速度遞增,涵蓋自然科學、工程技術、農業、醫藥衛生、經濟、教育和圖書情報等學科的8000余種中文期刊數據資源。按照《中國圖書館分類法》進行分類,所有文獻被分為7個專輯,即自然科學、丁程技術、農業科學、醫藥衛生、經濟管理、教育科學和圖書情報。維普數據庫由專業質檢人員對題錄文摘數據進行質檢,確保原始文本數據的質量,數據完整率達到99%以上。其具有檢索人口多、輔助手段豐富、查全查準率高和人工標引準確的傳統特點。
維普數據庫提供三種檢索方式,即基本檢索、傳統檢索和高級檢索。下面重點介紹常用的基本檢索與高級檢索方式。
A.基本檢索。
在圖書館主頁點擊進入維普數據庫,并點擊進入維普期刊資源整合平臺后,選擇基本檢索,進人基本檢索頁面,如圖L 4所示,可以進行多字段檢索??蛇x字段主要包括題名、關鍵字、文摘、作者、第一作者、機構、刊名、分類號、參考文獻、作者簡介、基金信息等。另外,基本檢索還可以對發表時間、期刊范圍、學科范圍進行限定。
B.高級檢索。
在維普首頁點擊高級檢索,進入高級檢索頁面。高級檢索又分為向導式高級檢索與宜接輸入檢索式檢索,
●向導式高級檢索。
向導式高級檢索方式為用戶提供分欄式檢索詞輸入方式,除了可以進行布爾邏輯運算、檢索字段入口、匹配度等選擇外,還可以進行相應字段的擴展信息限定,極大地提高了查準率。
●直接輸入檢索式檢索。
用戶可以在檢索框中直接輸入由布爾邏輯運算符、字段標示符組成的檢索式進行檢索。其中,“女”表示邏輯且,“十”表示邏輯或,“一”表示邏輯非;M代表題名或關鍵詞字段,T代表題名字段,K代表關鍵詞字段,R代表文摘字段,A代表作者字段,S代表機構字段,J代表刊名字段,U代表任意字段。
3.萬方數據庫。
萬方數據庫是由萬方數據股份公司開發的,涵蓋期刊、會議紀要、論文、學術成果、學術會議論文的大型網絡數據庫。萬方數據庫主要包括學術期刊數據庫、學位論文數據庫、會議論文數據庫、專利技術數據庫、中外標準數據庫、科技成果數據庫等多個子庫。其中,萬方期刊全文數據庫集納了文、理、工、農、醫五大類70多個類目共4500余種科技類期刊全文。其中,萬方會議論文數據庫是國內唯一的學術會議文獻全文數據庫,主要收錄1998年以來國家級學會、協會、研究會組織召開的全國性學術會議論文,數據范圍覆蓋自然科學、工程技術、農林、醫學等領域,是了解國內學術動態必不可少的幫手。
萬方數據庫提供四種檢索方式,分別是簡單檢索、高級檢索、經典檢索與專業檢索。
A. 簡單檢索。
在圖書館主頁點擊萬方數據庫,進入萬方數據平臺,頁面上半部分直接展現的就是簡單檢索的檢索頁面,如圖L 9所示。只要將檢索詞直接輸入檢索框即可,需要說明的是,萬方數據庫在知識服務平臺首頁、檢索結果等頁面的檢索輸入框默認接受的檢索語言為PairQuery,也就是PQ表達式。每個PQ表達式由多個空格分隔的部分組成,每個部分稱為一個Pair,每個Pair由冒號分隔符“:”分隔為左右兩部分,“:”左側為限定的檢索字段,右側為要檢索的詞或短語。例如,輸入“題名;信息”就表示將要檢索的是在題名中出現“信息”一詞的文獻。在檢索詞部分使用引號“”或書名號洲括起來,表示精確匹配。例如,加了引號或者書名號的“信息檢索”或者《信息檢索》就表示信息檢索必須連在一起成為一個詞組進行匹配。當需要多個檢索詞的時候,用空格隔開表示邏輯且,用“十”相連表示邏輯或。
B.高級檢索。
在萬方數據庫首頁檢索按鈕旁邊點擊“高級檢索”,進入高級檢索頁面,如圖110所示。通過分欄式多寧段組合,進一步限定檢索條件,提高查準率。可選字段主要包括題名、作者、期刊會議名稱、關鍵詞、摘要、發表日期、文獻類型等。同時也可以對被引次數、有無全文、結果推送排序規則等進行設置。高級檢索將字段以更加易懂且詳細的方式解釋出來,便于用戶識別操作。
C. 經典檢索。
經典檢索即經典高級檢索,是傳統意義上的多字段組合高級檢索,其實與前面所講的高級檢索大同小異,只是前面的高級檢索更加具有親和力與解釋性。
D. 專業檢索。
專業檢索就是在檢索框中輸入CQL表達式,在檢索框下方有具體檢索說明,用戶參看后可以快速掌握檢索技巧。
需要指出的是,萬方數據庫專業檢索支持布爾檢索、截詞檢索、位置檢索等全文檢索技術,以保證檢索結果的查全率與查準率。因此,用戶要建立精確的檢索表達式就需要注意以下幾點:
?、龠壿嫿M配符;“*”“十”“^‘分別代表邏輯且、邏輯或、邏輯非。邏輯且表示前后連接的兩個檢索詞都必須出現在檢索命中文獻中,邏輯或表示前后連接的兩個檢索詞至少有一個出現在命中文獻中,邏輯非表示只出現前方連接的詞或者語詞集合而不能出現后方連接的詞或者語詞集合。
②截斷符;”$“,表示截斷右邊的檢索詞內容,多用于英文詞根截斷。如果用戶對單詞拼寫不肯定或者希望查到一組的文獻,就可以采用截詞檢索。例如,”invent$“就可以找到包含”invent“ ”inventing“ ”invented“ ”irventor“ ”inventory“ ”invention“等一組派生詞的文獻。也可以用于中文檢索,例如,”作者:張露“就表示要找的是作者字段中性張的文獻。
③位置運算符;”.“,限定兩個單檢索詞相鄰。檢索”化“”工“相鄰,就應該表示為”化。工“.
4.人大復印報刊資料全文數據庫。
人大復印報刊資料全文數據庫主要收錄我國人文社會科學領域的學術論文,包括文學、歷史、哲學、文化、藝術、體育、經濟學、政治學、法學、管理學、教育學、社會學等人文社會學科門類。內容源于中國人民大學書報資料中心《復印報刊資料》,匯集了自改革開放以來國內報刊公開發表的人文社科學術研究成果的精粹,由專業編輯和業界專家進行精選,分類編輯,匯編成庫,形成”精中選精“的最終成果,并不斷更新,收錄了我國出版的3000余種社科報紙、期刊登載的學術論文。
人大復印報刊資料全文數據庫主要提供簡單檢索與高級檢索兩種檢索方式。
A.簡單檢索。
從圖書館主頁中文數據庫中找到”人大復印報刊資料全文數據庫“,點擊進入該數據庫主頁,在頁面上方點擊”全文數據庫“,進入數據庫簡單檢索頁面,如圖113所示。簡單檢索提供了時間限定與字段限定功能,用戶只要限定該兩項,并在檢索框中輸入檢索詞,點擊檢索按鈕展開檢索即可。
B.高級檢索。
用戶點擊檢索按鈕右邊的高級查詢按鈕進入高級檢索頁面,如圖1.14所示。人大復印報刊資料的高級檢索可以同時提供5個檢索項,而且它們之間可以用”并且“”或者“”除了“連接。
5.Web of Knowledge數據庫。
Web of Knowledge數據庫是由美國Thomson Scientificti處公司開發的一個以知識為基礎的全球學術文獻信息網絡資源檢索整合平臺,是采用”一站式“信息服務的設計思路構建而成的數字化研究環境,將全球的學術權威文獻資源收錄其中,為全球科研工作者提供了信息共享和文獻檢索的國際網絡數據庫。收錄的文獻類型有國際學術期刊、免費開放資源、圖書、技術專利、會議記錄、網絡資源等,收錄的文獻范圍包括1986年至今的自然科學、工程技術、社會科學、藝術與人文科學領域全球權威的學術文獻信息資源。web of Knowledge數據庫最具有代表性的四大引文索引產品就是A&HCI數據庫、SSCI數據庫、SCI數據庫、MEDUNE數據庫。Web of Knowledge數據庫提供了強大的檢索功能,可以同時對多個子數據庫(包括專業數據庫和多學科綜合數據庫)進行單庫或跨庫檢索,可以使用數據庫提供的分析工具,利用書目信息管理軟件等,兼具知識的檢索、提取、管理、分析與評價等多項功能。
A. A & HCI數據庫。
A&HCI是Arts & Humanties Citationlndex(藝術與人文科學引文索引)的縮寫。A以HCI數據庫收錄了從1975年至今的l160多種國際期刊,內容涉及文學、語言學、哲學、宗教、歷史、考古學、藝術、音樂、戲劇、舞蹈、建筑、電影、廣播、電視、民俗等。
B. SSCI數據庫。
SSCI是Social Science Citationlndex(社會科學引文索引)的縮寫。SSCI數據庫收錄了1800余種國際社會科學期刊,內容涉及經濟學、法學、政治學、管理學、心理學、社會學、人類學、地理學、犯罪學、教育學、圖書館學和信息學、區域研究、城市研究等。
C.SCI數據庫。
SCI是Science Citationlndex(科技期刊引文索引)的縮寫。SCI數據庫收錄了6000余種國際期刊,涵蓋自然科學所有領域,如物理學、化學、工程技術、材料科學、生物科學、分子生物學、化學工程、地球化學、藥物學與藥理學、原子及分子物理學、光譜學等。
D.MEDLINE數據庫(生命與醫學科學引文索引)。
MEDLINE數據庫是由美國國家醫學圖書館(NLM)及合作機構編制的關于生命與醫學科學(包括生命科學、植物科學、動物科學、生物醫學、生物工程、公共健康與臨床醫學等)的文獻數據庫。記錄來源于1950年以來的4900多種以30多種語言出版的期刊,目前已有約1700萬條書目記錄,每年新增記錄約50萬條。
Web of Knowledge數據庫的檢索方式主要是快速檢索??焖贆z索可以檢索文獻主題、論文標題、作者、出版物名稱等,用戶可以使用AND、OR、NOT等邏輯運算符連接詞或者詞組,還可以限制時間跨度,一次性可檢索最多達50個詞或詞組。
6.EI數據庫。
殿數據庫是美國工程信息公司(Elsevier Engineer-ing lnfonnation lnc)于1969年開始出版的《美國工程索引》的簡稱。殿數據庫收錄了世界上55個國家15個語種的5600余種工程類期刊中的技術論文、會議論文和科技報告,每年新增65萬條記錄,數據庫每周更新。
EI數據庫內容涵蓋了工程和應用科學領域的各個學科,包括機械工程、土木工程、環境工程、電氣工程、結構工程、材料科學、固體物理、超導體、生物工程、能源、化學和工藝工程、照明和光學技術、空氣和水污染、固體廢棄物的處理、道路交通、運輸安全、控制工程、工程管理、農業工程和食品技術、計算機和數據處理、電子和通信、石油、宇航、汽車工程以及這些領域的子學科和其他主要的工程領域。
?。ㄈz索常見問題
1.檢索詞不全面,造成漏檢。
檢索時要充分考慮檢索詞可能出現的相似形式、同義詞或下位概念,以免造成漏檢。例如,在檢索有關歐洲各國現狀的文獻信息時,”歐洲各國“就不能單單寫為”歐洲AND各國“,應該擴展為”歐洲嘆法國嘆英國OR意大利OR德國OR西班牙OR荷蘭OR瑞士“等,來補充歐洲各國的概念。
2.檢索詞范圍不合適,造成漏檢。
選擇檢索詞要充分考慮其外延和內涵,根據課題要求來決定是用概念更寬泛的檢索詞還是用具體詞。概念太大、太籠統都容易造成漏檢,反之亦然。
3.檢索詞不規范,造成誤檢和漏檢。
選擇檢索詞的時候,口語化的縮略詞往往不能作為規范的檢索詞使用,檢索結果也經常會與預期不符。檢索詞的規范性會大大提高檢索效率。例如,”消協“是指”消費者協會“,但前者顯然不規范,在數據庫檢索中檢索命中有效文獻要比后者低很多。
4.不注意具體數據庫檢索指南,盲目檢索。
雖然檢索方法在很大程度上是通用的,但是在具體操作中,每個數據庫檢索運算符號不盡相同,研究者必須在檢索前首先參看數據庫檢索指南,根據具體說明再展開具體檢索活動,這樣會大大減少檢索時間,提高檢索查準率。