搜索引擎

Web search.jpg
本條目屬於網路搜尋引擎系列
網路搜尋引擎
元搜尋引擎
國際性搜尋引擎(多語言)
Google
Yahoo! Search
Bing
僅中文搜尋引擎
百度
360搜索
搜狗
yam蕃薯藤
PChome Online
中國搜索
其他搜尋引擎
DuckDuckGo
Exalead
Naver
Yandex
Alexa Internet
AOL
Ask.com
Qwant
其他連結

搜尋引擎(英語:search engine)是一種資訊檢索系統,旨在協助搜尋儲存在電腦系統中的資訊。搜尋結果一般被稱為「hits」,通常會以表單的形式列出。網路搜尋引擎是最常見、公開的一種搜尋引擎,其功能為搜尋全球資訊網上儲存的資訊。

工作方式

搜尋引擎為一組專案提供了一個介面,使使用者能夠指定關於感興趣的專案的標準,並讓引擎找到匹配的專案,這些標準稱為搜尋查詢。在文字搜尋引擎的情況下,搜尋查詢通常表示為辨識一個或多個文件可能包含的期望概念的一組單詞。[1]有多種樣式的搜尋查詢語法在嚴格性上有差異。它也可以在以前的站點中搜尋搜尋引擎中的名稱。而一些文字搜尋引擎要求使用者輸入由白色空格分隔的兩個或三個字,其他搜尋引擎可以使使用者能夠指定整個文件,圖片,聲音和各種形式的自然語言。一些搜尋引擎對搜尋查詢進行改進,以增加通過稱為查詢擴充的過程提供品質集合的可能性。查詢理解方法可用於標準化查詢語言。

基於索引的搜尋引擎符合查詢指定條件的專案列表通常會排序或排名。按相關性排列專案(從最高到最低)減少尋找所需資訊所需的時間。概率搜尋引擎根據相似性度量(每個專案和查詢之間,通常以1到0,1的比例最相似)和有時受歡迎程度或權限或使用相關性回饋來評估專案。布林搜尋引擎通常只返回匹配的專案,而不考慮排列順序,為了提供根據一些標準快速排序的一組匹配專案,搜尋引擎通常將通過稱為索引的過程來收集關於所考慮的一組專案的元資料。索引通常需要較少量的電腦儲存,這就是為什麼一些搜尋引擎僅儲存索引的資訊而不是每個專案的完整內容,而是提供導航到搜尋引擎結果頁面中的專案的方法。或者,搜尋引擎可以將每個專案的副本儲存在高速緩衝記憶體中,使得使用者可以在索引時或為了歸檔目的看到該專案的狀態,或者使得重複的行程更有效和更快地工作。其他類型的搜尋引擎不儲存索引。抓取器或蜘蛛型搜尋引擎(也稱為即時搜尋引擎)可以在搜尋查詢時收集和評估專案,基於起始專案的內容(稱為種子或種子URL)動態考慮附加專案網際網路爬蟲的情況)。元搜尋引擎既不儲存索引也不儲存快取,而只是重新使用一個或多個其他搜尋引擎的索引或結果來提供聚合的最終結果集。

類型

按來源

按內容類型

  • 音訊搜尋引擎(Audio search engine)
  • 全文檢索(Full text search)
  • 圖像搜尋(Image search)
  • 影片搜尋引擎(Video search engine)

按介面

  • 增量搜尋(Incremental search)
  • 即時回答(Instant answer)
  • 語意檢索(Semantic search)
  • 基於選擇的搜尋(Selection-based search)
  • 語音搜尋(Voice Search)

按主題

  • 書目資料庫(Bibliographic database)
  • 企業搜尋(Enterprise search)
  • 醫學文獻檢索(Medical literature retrieval)
  • 垂直搜尋(Vertical search)

另見

參考文獻

  1. ^ Voorhees, E.M. Natural Language Processing and Information Retrieval. National Institute of Standards and Technology. March 2000.