国产日韩欧美综合色视频在线|日本在线中文字幕四区|最新中文字幕在线|成人女人天堂午夜视频

設為首頁加入收藏業務一覽表公司歷程公司介紹聯系我們
當前位置網站運營 >> 研究搜索引擎評價網頁質量體系

研究搜索引擎評價網頁質量體系

研究搜索引擎評價網頁質量體系

    每個搜索引擎都有其獨特的一套體系來評價網頁的重要性。如Google利用PageRank算法用數字(1-10)不同等級來標識網頁的重要性。評價網頁重要性的算法,非常復雜。例如,搜索引擎的算法評價一張網頁的重要性時,可能會涉及到以下幾個方面
急劇擴大的網絡資源在給公眾帶來極大方便的同時,也給搜索引擎帶來了新的挑戰。建立科學、公正、系統的搜索引擎質量評價體系可以促進搜索引擎的建設和利用。
  1建立搜索引擎質量評價體系的意義
  面對浩如煙海的網絡信息,搜索引擎作為最流行的網絡檢索工具越來越受到大眾重視。同時,用戶也經常到無所適從的題目:當成千上萬的搜索結果到來之時,卻很難從中找到所需要的結果。根據searchengine watch對5個著名英文搜索引擎的統計,各大搜索引擎的搜索結果優良率均在40%以下。造成這種局面的原因很多,有技術困難:如人機交流實現方式題目,技術困難的解決需要計算機科學的不斷進步來解決;也有搜索引擎的設計運行題目,這一題目的解決可以通過建立既反映用戶要求,又符合現有技術能力的搜索引擎評價質量體系,指導用戶使用和搜索引擎網站改進產品
  1.1有利于公眾更好的利用搜索引擎進行網絡信息檢索
  盡管搜索引擎在網絡檢索中起著不可替換的作用,但受知識水平、信息渠道的限制,很多用戶經常不能正確的選擇和使用搜索引擎。面對多元化的網絡信息,不同的搜索引擎都有各自的強項。搜索引擎評價體系可以建立用戶與搜索引擎網站交流的橋梁,幫助和指導用戶甄別和使用合適的搜索引擎。如搜索引擎評價體系通過建立專業搜索引擎推薦序列,指導用戶利用某一專業搜索引擎檢索該專業資料,會收到較好的效果。
  1.2指導普通網站進行搜索引擎排名推廣
  據統計,大多數網站IP流量的70%是通過搜索引擎獲得的,所以網站在搜索引擎上“表現”如何,直接影響到了網站的推廣程度。建立搜索引擎評價體系可以用來指導貿易網站進行搜索引擎排名推廣。例如搜索引擎質量評價體系可以促進搜索引擎對搜索關鍵詞的標準化設置,指導普通網站根據企業建站的思路設置網站核心關鍵詞,進步網站的搜索引擎排名。
  1.3指導搜索引擎網站改進產品
  搜索引擎評價體系可以通過反映用戶的要求和專家的觀點建立對搜索引擎的科學評價,指導搜索引擎的改進。目前搜索引擎網站的升級速度落后于通用軟件,已經影響了用戶對網絡資源的使用。搜索引擎評價體系可以促進用戶與搜索引擎供給商之間進行交流。普通用戶對搜索引擎的熟悉往往是感性的,所提出的要求缺乏針對性和可操縱性,往往得不到搜索引擎網站的足夠重視。搜索引擎評價體系將用戶的普遍要求翻譯成專業的、量化的改進建議,將其反映到搜索引擎質量評價體系中,對搜索引擎的供給商施加較大的影響力,促使其在較短時間內進行產品升級。搜索引擎評價體系可以通過定期對搜索引擎網站進行受歡迎程度、技術、美學或總體評價和排名,以便引導用戶的消費指向,促進搜索引擎的改進。
  2對搜索引擎進行總體評價
  搜索引擎是一種結合了多種學科的網絡檢索產對不同類型的搜索引擎網站按照相應標準進行評品,設立可操縱性的評價體系有相當難度。筆者認價。為可以通過設置總體評價體系和單項評價指標來分別進行定性和定量評價。搜索引擎總體評價主要是針對那些難以從技術角度進行量化的方面,主要可以通過公眾調查和搜索引擎產品之間的功能比較進行相應質量評價。
  2.1用戶舒適程度
  搜索引擎要爭取更多的客戶,既要將網站外觀做得漂亮,使用戶在訪問搜索引擎的過程中獲得美的享受,又給用戶操縱帶來方便。搜索引擎的用戶舒適程度包括以下幾個方面:搜索引擎網站界面的外觀設計是否符合美學原則;用戶操縱是否方便,如幫助功能是否完備、是否有相應的功能說明。用戶的舒適程度可以根據受用戶歡迎程度來評估,可以通過統計點擊率、網上投票或設計問卷調查等途徑獲得。由專家對統計結果進行調查分析,將評價結果通過各種媒體反饋給網絡用戶和搜索引擎網站,指導檢索實踐。
  2.2專業程度
  網絡文件的格式、內容、網絡傳輸協議相當復雜,不同的搜索引擎網站也應進行專業化分工以便提供優質、高效的服務。因此,搜索引擎專業程度是重要的評價方面。搜索引擎質量評價體系可以根據搜索引擎網站的不同定位,針對某一指標對其專業度進行評價。針對搜索對象的不同內容,搜索引擎網站應設立有針對性的數據庫和索引。門戶搜索引擎網站主要針對大眾一般性需求,如新聞、娛樂資料。對檢索內容比較專業的信息則使用專業搜索引擎,如搜索旅游方面內容,中國旅游網搜索引擎是國內比較好的旅游中文專業搜索引擎。搜索引擎評價體系可以針對PDF,WORD,RMVB,AVI等不同格式的文件分別設計搜索引擎檢索功能,可以大大進步檢索效果。如PDF格式被廣泛應用于學術論文的電子化,專門針對此類格式的搜索引擎正在獲得學術界青睞。此外,針對搜索對象的不同傳輸協議的搜索引擎也受到用戶歡迎。如專門檢索ftp文件的天網ftp文件檢索系統擁有一批以學生為主的、忠誠度特別高的用戶群。
  2.3智能化程度
  搜索引擎評價體系可以促進搜索引擎的智能化進程。搜索引擎結合人工智能技術可以使網絡信息檢索從基于關鍵詞進步到基于知識或概念,通過采用數據挖掘技術、智能代理技術、基于人工智能的知識發現術,使網絡檢索服務具備智能化、人性化特征。評價搜索引擎的智能化程度,可以設立以下標準:(1)在保證檢索精度的條件下,搜索引擎要對網頁按重要性排序。這是由于用戶往往沒有足夠的時間查閱所有的搜索果,優先顯示重要的檢索結果就十分必要。以Google的排序方式為例,當從網頁B被鏈接到網頁A時,Google就以為“網頁A投了網頁B一票”。網頁的得票數越多,Google就以為其重要性越大。Google還分析為其投票的網頁,不同網頁所投出的票也具有不同的重要性。被“重要”網頁投票的網頁“重要性”會被適當放大;(2)跨語言檢索?;ヂ摼W打破了國界,跨語言檢索越來越顯得重要,成為搜索引擎評價體系中不可忽視的一環。
  跨語言檢索可以通過在主頁上添加在線翻譯功能,也可以將在線翻譯功能放在后臺運行;(3)網頁快照技術。通過儲存應急網頁,以便用戶在訪問已經過期或不存在的網頁。網頁快照技術是Google最先使用,現在已經成為百度等各大搜索引擎網站所必備的功能。搜索引擎技術處在不斷進步中,對其智能化程度的質量評價應該是一個開放的系統,隨著其功能進步而增加具體評價項目,以某一著名搜索引擎為基準,對其他搜索引擎按相對比例打分。
  3搜索引擎可量化的單項評價指標
  可量化的指標是質量評價體系科學性的重要體現。因此,搜索引擎評價體系要大量采用可反映搜索引擎檢索質量的量化評價指標,用于指導搜索引擎的建設和用戶的使用。
  3.1傳統的搜索引擎質量評價指標
  基于紙質文獻的傳統評價指標經過了數十年的發展,已經相當的成熟,其中的主要指標也可以用來評價搜索引擎的檢索質量,但部分指標需要針對網絡檢索的特點作一定程度的修改和完善才能較好的反映網絡環境下信息檢索的特點。
  3、1.1搜索引擎查全率搜索引擎查全率是指從
  搜索引擎系統檢出的與某檢索課題相關的信息數目與搜索引擎系統中實際與該課題相關的信息總量之比率。但是在網絡環境下,信息處于動態的變化過程中,搜索引擎查全率指標比較難測算。因此,可以通過搜索引擎相對查全率作為搜索引擎查全率的補充。搜索引擎相對查全率可操縱性較強,但受人為不確定因素的影響較大。
  3.1.2搜索引擎查準率
    搜索引擎查準率是又一重要的質量評價指標,是指從搜索引擎檢索系統檢出的有關某課題的信息條數與搜索引擎輸出的信息條數之比率。搜索引擎的查準率和查全率存在不兼容性,要進步搜索引擎查全率往往要放寬信息檢索范圍,而這會造成搜索引擎查準率的下降;同樣,要進步查準率就要縮小搜索范圍,但輕易遺漏所需要的信息。由于網絡環境信息極大豐富,用戶在使用搜索引擎進行網絡檢索時,往往更夸大查準率的進步。對于搜索引擎檢索來說,真實查準率較難計算,這是由于很多檢索課題的檢索結果數目太大,相關性判定工作本錢巨大,可操縱性不強。因此定義一個針對網絡環境下信息檢索的搜索引擎相對查準率就顯得十分必要。
  3.1.3搜索引擎漏檢率
    搜索引擎檢索漏檢率是指當使用搜索引擎進行檢索時,檢索系統把被檢索信息分成兩部分,一部分是與檢索要求相符合的信息,并被搜索引擎檢索出來,用戶依據自身要求將其分成相關信息和不相關信息;另一部分是未能與檢索要求相符合的信息,根據判定將其分成相關信息和不相關信息。搜索引擎漏檢率與查全率成反比,在實踐中采用抽樣方法進行統計。
  3.1.4搜索引擎誤檢率
  搜索引擎誤檢率是指當進行檢索時,搜索引擎把所有信息分為兩部分,一部分是與檢索要求相匹配的信息,并被檢索出來,用戶根據自己的判定將其分成相關的信息(命中)a和不相關的信息(垃圾)b;另一部分是未能與檢索要求相符合的信息,根據判定也可將其分為相關信息(遺漏)c和不相關信息(正確的拒盡)d。在搜索引擎檢索實踐中,將降低搜索引擎誤檢率主要是剔除垃圾信息,進步搜索引擎查準率。
  3.2基于互聯網的搜索引擎質量評價指標
  3.2.1響應時間
  搜索引擎響應時間有四個部分組成:用戶發送檢索請求到達搜索引擎服務器的時間;搜索引擎服務器處理用戶請求的時間;網站做出的答復到達用戶的時間;搜索引擎用戶處理檢索結果的時間。其中,用戶發送請求和服務器返回答復的時間取決于網絡傳輸速度,用戶處理檢索的時間取決于用戶計算機的配置,搜索引擎網站服務器處理用戶檢索請求的時間取決于服務器的硬件配置和負載情況、軟件的組成原理、編碼方法。進步網站服務器的整體性能,開發高效率的檢索軟件,使用緩存技術是搜索引擎縮短反應時間的重要方法。由于檢索技術的進步,檢索響應時間已經大大縮短,在這方面進步的空間已經很小。盡管搜索同樣數目的網頁,google比百度快60%一80%,這已很難成為盡大多數用戶做出選擇的理由。
     3.2.2數據庫的內容規模
     數據庫是搜索引擎工作的基礎,是搜索引擎評價的重要對象,其內容包括數據庫的覆蓋范圍、索引組成和更新周期,數據庫規模、類型、更新頻率、分類體系和信息抓取方式等。英文搜索引擎在規模方面上風明顯,如google的數據庫規模約是sohu的600倍,但中文搜索引擎在數據庫更新周期,分類方式、檢索語言等方面的差距并不明顯。
  3.2.3標準化程度
  互聯網信息是多元化的,搜索引擎應盡量采用國際通行的標準以方便用戶的使用。因此,搜索引擎標準化程度應該成為搜索引擎質量評價體系的重要指標。首先,搜索引擎的檢索語言應使用標準檢索詞,如使用國際標準的檢索詞“and”、“not”、“or”,各個檢索詞的功能也應按國際標準進行同一設置。其次,檢索結果的輸出格式也應實現標準化,應包含必要的內容,主要包括網頁鏈接地址、被突出的檢索詞、主頁網址、日期、網頁快照,并按一定順序排列。檢索結果格式的標準化可以方便用戶查找和使用,進步搜索引擎的用戶舒適度。搜索引擎評價體系是一個開放性的動態系統工程,其具體評價方式應隨著搜索引擎的推廣和使用進行持續的排名推廣,以便促進搜索引擎的不斷升級。
3.2.4網站權威性
    Gogo網站推廣以為網站權威性與網頁權威性這兩個概念是有所區別的。網站權威性是由一張張高質量的網頁、網站聲看、用戶口碑等等因素形成。搜索引擎判定一張網頁的重要性,可能會優先判定網站的權威性?;诰W站的權威性,再判定某一網頁的權威性。

[來源:寧波分類信息] [作者:zx330] [日期:11-11-26] [閱讀:]