2018年4月22日 星期日

機房建置,打破在服務器基礎設施上運行AI的瓶頸侷限

機房建置,現如今的企業組織機構正在大規模的採用AI人工智能應用程序來解析不斷呈指數級增長的龐大數據量,這不僅要求極高,並且需要具備強大的並行處理功能,因此原來的標準化CPU已然無法充分執行許多AI解析任務了。有鑑於此,當企業數據中心在接近或達到服務器性能的瓶頸侷限時,究竟應該相應的採取哪些有效的應對措施呢?
 機房建置
在本文中,我們將幫助您企業數據中心準備並應對由AI應用程序爲企業本地部署環境和雲基礎架構所帶來的限制。同時,我們還採訪了數據中心業界的同行們,邀請他們提供了相關的指導性建議,其中包括着重強調了企業數據中心與服務器供應商密切合作的重要性,這些服務器供應商可以爲您的企業從早期階段儘快過渡到穩步的高級生產階段,進而充分利用AI功能提供相應的指導。
當前的企業組織機構正在積極努力的應對衆多的變數,以確定他們對使用由深度學習時帶來的能夠提供新的洞察見解的人工智能(AI)應用程序到底應該採取怎樣的立場。而這一領域在當下可以說是充滿了無限的商機,不採取積極的行動可能會演變成商業災難,因爲企業的競爭對手們正在收集並分析處理海量以前無法獲得的數據信息,來擴大其客戶羣。大多數企業組織都已然意識到了這一嚴峻的挑戰,故而他們的業務部門,這員工,數據科學家和開發人員們都在共同努力,以確定企業的人工智能戰略。
在某種程度上,採用AI戰略的企業將逐步體驗到在利用AI應用程序方面更爲先進的領軍企業們過往的經歷:他們的服務器性能將遭遇到瓶頸侷限問題。人工智能應用程序,特別是深度學習系統可以對當下呈指數級不斷增長的海量數據信息進行分析,但這些系統要求非常高,並且需要具備強大的並行處理能力,故而越來越多的標準化CPU已然無法充分執行這些AI任務了。早期階段和高級階段的AI用戶在某些時候將不得不徹底改造其服務器基礎設施以實現所需的相關性能。
因此,IDC建議正在開發AI功能或擴展現有人工智能功能的企業組織機構應以嚴格控制的方式解決這一服務器性能瓶頸問題。務必要在充分掌握相關細節的前提下實施下一步的基礎設施遷移。此外,我們建議他們務必要與其服務器供應商密切合作,這些服務器供應商可以爲企業客戶從早期階段儘快過渡到穩步的高級生產階段,進而充分利用AI功能提供相應的指導。
IDC發現,大多數處於概念驗證(POC)測試或生產模式的人工智能和深度學習應用程序的企業在某種程度上已經達到了“服務器基礎設施瓶頸限制”的水平,有時在這些企業遷移到不同的服務器基礎設施後,會不止一次的出現基礎設施瓶頸侷限性的問題。
IDC採訪了相關的企業組織當他們在其現有的企業內部部署服務器基礎架構上開始運行AI應用程序時所經歷的情況.77.1%的受訪者表示他們在內部服務器部署基礎設施上運行AI遇到了一個或多個限制。在採用了認知軟件的雲用戶中,90.3%的企業遇到了這種限制。下表1列出了在企業內部部署服務器環境和雲基礎架構中運行AI應用程序的相關限制。
正是由於這些基礎設施的瓶頸侷限問題的出現,很多企業很快經歷了代際轉變。儘管人工智能應用程序和深度學習的興起僅僅只有幾年時間,但IDC發現,已有22.8%的企業在採用第三代服務器基礎設施來運行其人工智能應用程序了,而37.6%的企業在使用第二代服務器基礎設施,39.6%的企業則在使用第一代的服務器基礎設施,上述這些調查百分比表明了當下的企業客戶正在尋找合適的基礎設施。而下表2則列出了AI服務器基礎架構最常出現的代際。
轉向具有更高處理器性能(通常所採取的最常見的措施),更大的I / O帶寬和加速器的系統是一個合理的決定。但是這些數據也表明了理想配置所存在的不確定性。一些企業已經嘗試了橫向規模化擴展,並縱向擴展;而另外一些企業則採取了相反的方案。其他某些遷移從虛擬機開始,然後轉移到專用服務器,而其他一些同行卻與此相反。
這些矛盾的舉措其實並不像其看起來那麼奇怪。當前的企業組織不僅在AI軟件上進行試驗,而且同時也在基礎設施上進行試運行。一些企業已經開始採用橫向的規模化擴展配置,並且隨着解決方案的日趨成熟,他們決定需要更高的性能,而這些性能能夠在數據中心的現有擴展系統中獲得。其他一些企業則在擴展系統的一個分區上啓動了POC,並在解決方案進入下一階段時決定將其轉移到一個單插槽或雙插槽的服務器集羣。同樣的,一款解決方案可能已經在虛擬機中開發出來,然後被遷移到專用的服務器上,以便在有些絕緣隔熱的的環境中進一步開發(很多企業更傾向於在早期階段如此進行)。
國際數據公司(IDC)認爲,對於早期的實驗和開發而言,所有這些遷移的舉措都是有道理的。利用現有的環境意味着延遲投資於新的服務器基礎設施,直到企業明確了什麼是最爲恰當的配置爲止。但是,一旦應用程序接近運行並準備投入生產,就需要及時的做出合理的基礎架構方面的決策了,以避免觸及基礎設施的瓶頸。
根據來自已經運行了AI應用程序的企業用戶們的反饋,我們認爲:認知應用程序的理想基礎架構配置是一組具有加速器的單路或雙路服務器,不過,企業也還可以根據實際業務需要在稍後階段添加加速器。中型系統集羣也是可行的,但只有在工作負載迅速的規模化擴展的情況下才是相關的。其他配置可能也是可行的。從對於企業用戶的研究中可以清楚地看的出,超融合系統和虛擬機已被證明對認知應用的影響較小。

沒有留言:

張貼留言