在劉慈欣的《三體》中,太陽系將要被二維化時,程心乘坐飛船來到了太陽系邊沿的冥王星,在這里她遇到了曾經的執劍人羅輯。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
羅輯向她介紹了人類的墓碑:地球文明博物館。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
在這里,人類希望把自己的文明信息保留十億年!Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
但是當時的量子存儲器,只能保存兩千年。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
U盤和硬盤,能保存五千年。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
特殊金屬制成的光盤, 10萬年。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
特殊的紙張和油墨制成的印刷品,20萬年。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
后來科學家們發現,唯一可行的辦法是:把字刻在石頭上!這樣也許能保存1億年。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
最后,人類文明就變成了冥王星“石頭”上的字跡。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
每次看到這里我都挺震撼的,信息的長時間保存真難啊!Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
科幻總是能讓人產生聯想, 雖然不需要保存地球文明,但是想想我們的互聯網,有多少數據早已經銷聲匿跡了?Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
有個統計說網頁的平均壽命低得嚇人:只有區區75天!Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
很多網頁即使能被搜索引擎找到,打開時也經常會遇到404 not found。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
能不能把全球互聯網網頁都找個地方保存起來呢?永不丟失呢?Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
1.把互聯網“存”起來
Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
這是個瘋狂的想法,不過,還真有人這么干了!Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
照片中這位老帥哥叫做Brewster Kahle, 他的夢想就是做這件事情:把整個互聯網都存起來!Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
圖片Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
像曾經的被戰火摧毀的亞歷山大圖書館那樣,保存人類文明的知識。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
圖片Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
很明顯,這需要錢,很多錢。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
幸運的是,Kahle是一位成功的連續創業者,是一位億萬富翁。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
Kahle畢業于麻省理工,1992年創立了一家叫做WAIS的電子出版公司,可以讓華爾街日報,紐約時報和大英百科全書之類的出版物在互聯網上發布。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
1995年,Kahle把這套系統賣給了美國在線,賺了1500萬美元。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
隨后他又創立了Alexa Internet ,這個網站估計很多人聽說過吧。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
Alexa 以提供互聯網流量數據,網站全球排名等信息聞名,1999年又以2.5億美元被亞馬遜收購。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
圖片Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
在創立Alexa的時候,他很“狡猾”地在其中加入了一份合同,要求Alexa收集的所有內容副本都提供給他創立的另外一家非盈利機構: Internet Archive (互聯網檔案館)。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
這才是Kahle畢生追求的夢想。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
(Internet Archive 總部)Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
2.海量數據
Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
到目前為止,互聯網檔案館已經保存了:Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
8350 億個網頁Se628資訊網——每日最新資訊28at.com
4400 萬本書籍和文本Se628資訊網——每日最新資訊28at.com
100 萬個軟件程序Se628資訊網——每日最新資訊28at.com
1500萬 錄音(包括25.5萬個音樂會)Se628資訊網——每日最新資訊28at.com
1060萬個視頻 (包括260個電視節目)Se628資訊網——每日最新資訊28at.com
480萬張圖片Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
圖片Se628資訊網——每日最新資訊28at.com
(互聯網檔案館的服務器)Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
僅僅是單個副本就占用了145PB的空間(所有的內容至少存儲兩個副本)。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
冷冰冰的數字可能大家可能沒有感覺, 我分享一個我自己的故事。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
20年前,我使用鄭州商都信息港的免費空間,建立了一個個人主頁, liuxin.shangdu.net。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
這么多年過去了, 商都信息港早就沒有了,這個網站也早就不能訪問了。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
但是,我卻能在Kahle的互聯網檔案館找到它的備份!Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
給大家瞅瞅,說實話,看到20年前的東西心情非常激動。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
圖片Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
20年前的東西還能給你扒拉出來,你說牛不牛?Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
如果你也想找古老的資料,也可以去試一試:https://web.archive.org/Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
互聯網檔案館不僅僅保存網頁,還保存書籍。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
為了把書籍數字化,他還制造了一個叫做Scribe的特殊掃描儀。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
掃描儀分辨率超高,當然價格不菲, 掃描一頁的成本是10美分,平均每本書300頁,也就是一本書30美元,美國國會圖書館,有2600萬本書,如果都掃描的話,需要花費在7.5億美元。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
有很多志愿者幫助掃描,如果你為它服務了三年,互聯網檔案館會為你建立一座自己的雕像,以示感謝。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
圖片Se628資訊網——每日最新資訊28at.com
(據說仿秦始皇兵馬俑,看起來有點嚇人的不是?)Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
3.版權爭議
Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
保存人類互聯網的數據,這本來是一個功德無量的事情。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
但是,大家肯定會想到一個問題,它收錄了這么多的資料,獲取授權了嗎?Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
互聯網檔案館說任何人都可以將數字媒體上傳,肯定有很多軟件,書籍是沒有授權的。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
雖然網站收錄的許多軟件都是舊的、已經不再銷售或支持的版本,并且努力只收錄合法可分享的軟件,但有時可能會無意中收錄到一些版權受限的軟件。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
所以有人戲稱:這是世界上最大的盜版網站!Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
更要命的是,互聯網檔案館在運行一個“受控數字借閱”的項目,這個項目可以將實體書轉成數字副本,然后受控借閱。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
例如《三體》,你在上面找到了一套數字書,借了出來,然后別人就不能借閱這個數字書了,直到幾周后把你把它還回來以后,別人才能再次借閱,就像實體書一樣。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
也就是說,互聯網檔案館把數字書也當成實體書,以借閱實體書的方式來對外提供服務。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
但是,可以受控借閱的360萬本書中有很多還是正在印刷和銷售的,作者和出版商仍然保留這些書的版權,這就捅了馬蜂窩。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
4.不可避免的訴訟
Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
2020年,4家出版社(Hachette, Wiley, Penguin Random House, & HarperCollins)聯合起訴互聯網檔案館,指控他未經許可分發了30多萬本書,索賠數億美元。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
2023年3月,曼哈頓地方法官John G. Koeltl做出了判決,認為互聯網檔案館的“受控數字借閱”計劃不是合理使用。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
2023年12月,互聯網檔案館提起上訴,認為自己是一家非盈利的圖書館,通過“受控數字借閱”計劃借出的每本書都已經購買、付款,數字借閱與傳統的圖書館借閱基本相同,不會對作者或出版業造成新的危害。Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
這個官司可能還有持續很久,結果如何,讓我們拭目以待吧!Se628資訊網——每日最新資訊28at.com
Se628資訊網——每日最新資訊28at.com
本文鏈接:http://www.www897cc.com/showinfo-26-97903-0.html世界上最大的盜版網站,遇到麻煩了!
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 全世界互聯網變慢了!React社區鬧翻天,官方最終讓步!
下一篇: Go語言并發控制Channel使用場景分析與解決方案