百度發展到今天,已經擁有5億的網民,每天接收來自全世界138個國家的,超過60億次的搜索請求。搜索引擎公司很大的一個特點就是,要處理互聯網上幾乎所有的數據,只要你連接進互聯網,這些數據都要被百度這樣的搜索引擎公司索引,然后來供廣大網民來使用。
目前,已經處理的數據量是百PB量級,而且這個數量還在以更快的速度發展。如今,隨著帶寬的進一步提高,以及移動設備的進一步發展和普及,需要處理的數據量增長得越來越快,特別是近幾年來,多媒體數據大量產生。占得空間要大很多,而且對上傳的頻率和速度要求也比以前高很多。一個工作就是對數據中心進行節能減排,另一個工作就是數據中心的設計。
百度研究數據中心的設計,實際是研究如何把這些分散的服務器資源集中管理起來,然后將這些計算和存儲資源進行統一的調度和分配。
從更高層面看,在云計算時代,或者說互聯網發展得比較成熟的時候,整個的計算體系都在發生一些變化。
百度主要關注數據中心的幾個方面。
第一個就是容量,由于互聯網產業的快速發展,用戶和數據量隨之激增,百度的后臺在不斷擴容。由最開始的幾百臺服務器規模的單體數據中心,發展到現在的十萬量級服務器規模的單體數據中心。
第二個是密度。如果密度問題不解決的話,服務器所占用的空間、消耗的能源都是非常巨大的。過去是單立一個標準的服務器,發展到今天是幾十個服務器在一個機柜里面。
第三個是擴展性。由于互聯網的快速發展,使得數據中心數量高速增長,由一開始的單體建筑,發展到數據中心集群。
第四個是傳輸帶寬方面的要求。包括帶寬的穩定性、傳輸速率等。
第五個是快速交付能力。交付能力主要指的是部署數據中心。哪怕是部署一個一萬臺服務器規模的數據中心,都是一個極其復雜的事情,這里涉及每一個服務器的安裝、每一個服務器里面的操作系統和一些軟件的安裝。如果說每一天能夠部署一千臺,一萬多臺服務器只要半個多月時間就可以部署完成。
在服務器很少的情況下,對服務器減排、提高能效,并不會顯得非常重要。但是,隨著互聯網的高速發展,特別數據的爆炸式正在,百度服務器的規模每年增長速度超過了100%。這意味著,百度每一年買的服務器的數量比歷史上庫存下來服務器的總數還要多,比歷史總數還要多。
為什么要關注數據中心的節能問題,最根本的因素是考慮成本。成本包括三個方面,第一個是購置相關設備,包括服務、器網絡設備,以及其他的一些配件。第二塊成本是運營成本,第三塊是用電的成本。從這三塊成本來看,服務器的購置成本約占其中的一半,也就是說一臺服務器假如是三萬元,在整個服務器的生命周期里面,要付出約六萬元的總價,這就是為什么要關心服務器,關心數據中心節能降耗,以及維護成本的問題。
那么以單體10萬臺服務器規模的數據中心來算,PUE每降0.1,百度每年節約一千萬元的成本。通過多年的摸索和探索,百度自建了自己的數據中心,百度數據中心的PUE由傳統的2.5左右,降到了現在的1.3。
百度已成長比較大型的企業,國家各個部門對百度的期望也很高,百度的搜集引擎不僅僅是公司的盈利手段,更已經成為一種非常重要的社會資源。在十多年的高速發展中,百度在各個方面所做出的各種努力,對社會起到了積極的示范效應,數據中心的節能建設就是其中一個方面。
傳統的數據中心是比較粗放型的,它表現在有很多的冗余設備以及設備的負載偏低,制冷設備的利用率比較低,這造成了資源浪費。一個方面,是設備本身的浪費,通常采用的是標準化的服務器。標準的服務器里面有很多的設備是業務所不需要的;另一個方面,浪費了大量的電能。
一般來講,在傳統的數據中心統計中,一個服務器利用率不到20%,而云計算時代的數據中心,就是要充分利用每一臺服務器的能力。
- 1
- 2
- 總2頁
http:www.mangadaku.com/news/31361.htm

