国产日韩欧美综合色视频在线|日本在线中文字幕四区|最新中文字幕在线|成人女人天堂午夜视频

設為首頁加入收藏業務一覽表公司歷程公司介紹聯系我們
當前位置網站運營 >> 2010年谷歌圖書占全世界所有圖書的數量 一共約1億2986萬

2010年谷歌圖書占全世界所有圖書的數量 一共約1億2986萬

每一個網站都以一個標準的情勢全部打包?一個名為 InternetArchive網站就在做全數因特網的存檔任務。但是懷疑這項使命真的那么無心義嗎?由于我現在根蒂就看不懂兩千年前的數據,另一個問題是如何存檔存有巨量信息的因特網?現在有人在做這種工作。那兩千年以后的人能看懂現在保留的數據嗎?

其統計了停止2010年8月1號全世界所有圖書的數目,導語:谷歌搜索公司谷歌搜索圖書(GooglBook團隊在其官方博客上發表博文稱。一共約1億2986萬4880本??萍疾┛虲runchGear發表攻訐文章對谷歌搜索圖書計劃做了批評,感到該計劃實施難度龐大,但影響將會不可估量。以下是攻訐全文:

書的數量可以或許說不計其數。谷歌搜索圖書將使世界上所有的圖書都可以在線搜索,谷歌搜索的目標一向是將地球上所有的數據都電子化、分類、索引到其巨大的服務器里。谷歌搜索圖書生怕是這個龐大的工程中最有野心的布局之一。但是不要忘了人類將文字和聰明記實入圖書里已經有了五、六千年的汗青。影響將是不可估計的谷歌搜索為了完成這一浩大的工程,利用了當今很多最新的科技手法。

報告了如何計算出世界上所有的圖書有1億2986萬4880本這個他感到相對正確的數字的谷歌搜索圖書團隊剛在其官方博客發了一篇博客。

但是很樂意看到主動去挑戰海量的數據。因為這意味著,實在我對他詳細是如何得出這一數字并不感興趣。將來我尚有很多東西可以或許進修,尚有很多關于如何處理數據的成就會被提出。

還要與浩大大學藏書樓、公共藏書樓、私人保藏、博物館等等非常多的機構單干,舉個例子說:谷歌搜索要處理非常多類似于ISBN海內標準書號)圖書數據。處理這些機構供應的類似的圖書記實,并分辯出這些記錄的藐小差別。假想高效的算法來從這些重疊非常多的圖書記錄中找到每一本書的最初版本不是一件容易的事,毫無疑問必要頻仍的人工干涉干與。谷歌搜索必要利用了類似于算法的軌范分辨、分類、分析大批的圖片。

利用OCR光學字符識別)技術掃描圖書并非易事。比方:錯誤率要控制在幾多?對于不合印刷技巧的書是否需要不同的掃描儀?否必要人工清理冊頁的褶皺?手動翻書的人的手指擋住了部分內容信息怎么辦?如此之類的成就數不勝舉。

書籍作品自己的規律必定程度上降低了掃描任務的難度。大部分圖書作品都有很清晰的開頭和結尾,固然。期刊和雜志都是定期發行編號清晰等等。
 

[來源:來自網絡] [作者:abc123] [日期:10-08-07] [閱讀:]