秒建工作環(huán)境
Matrix Fusion在云端預安裝主流深度學習框架、數(shù)據(jù)科學資料庫和GPU驅(qū)動,用戶無需耗費時間搭建開發(fā)環(huán)境,可在一分鐘內(nèi)通過簡單的鼠標點擊完成開發(fā)環(huán)境設置,可以迅速靈活調(diào)用CPU和GPU資源。
智能化資源調(diào)度
Matrix Fusion 支持各類硬件及操作系統(tǒng),提供端到端的基礎設施軟件解決方案,管理基礎CPU和GPU計算資源,能夠自動進行工作負載資源調(diào)配。深度學習是同時利用CPU和GPU處理工作負載的典型應用,Matrix Fusion通過整合用戶所有的硬件資源(集群亦或是單機)成為CPU+GPU資源池,再將資源根據(jù)開發(fā)者需要重新分配CPU和GPU到開發(fā)者的虛擬環(huán)境下,管理員也可以將多余的計算資源靈活分配給其他用戶或更為嚴苛的工作負載。
用戶在不同的虛擬環(huán)境中可以選擇在CPU資源上開發(fā),然后在GPU資源中測試,需要擴展訓練到更多GPU上時,可立即調(diào)用虛擬環(huán)境中任意數(shù)量的GPU資源。
容器管理
Matrix Fusion 構(gòu)建于強大的計算硬件和GPU虛擬化的基礎上,搭載了全方位的容器管理方案。核心負載引擎容器化,是作為極大簡化深度學習和AI工作流程的最新技術,在金錢、人力、時間上投資不菲。而Matrix Fusion無需進行個性化調(diào)整,用戶只需登錄操作界面,就可以直接調(diào)用專業(yè)化容器解決方案。 Matrix Fusion容器管理層包括1個內(nèi)置資源庫,可以管理預配置容器(包括了每一種部署場景或個性化生成容器): 預配置環(huán)境:Matrix Fusion預配置最新的深度學習框架和數(shù)據(jù)科學數(shù)據(jù)庫,用戶可以直接使用TensorFlow、Caffe、Torch以及其他社區(qū)的最新技術版本。 DIY開發(fā)環(huán)境:用戶可以利用“工作區(qū)快照”或“調(diào)入容器”來修改并保存容器環(huán)境,DIY一個更貼合自己使用習慣的開發(fā)環(huán)境。Matrix Fusion “調(diào)入容器”可以為用戶提供一個簡約的容器(僅含操作系統(tǒng)、最低配置的數(shù)據(jù)庫和驅(qū)動要求),用戶自行修改環(huán)境,然后上載作為標準環(huán)境進行后續(xù)開發(fā)。 用戶可以通過“工作區(qū)快照”利用“Docker保存”工作流程來復制環(huán)境,修改后保存到資源庫中,以便于下一次的開發(fā)工作。 容器導出:容器可導出,作為推理或其他生產(chǎn)部署要求用。
Fusion Core
Matrix Fusion強大的靈活性來源于Fusion Core計算虛擬化引擎。Fusion Core控制應用和基礎GPU計算之間的API調(diào)用指示,允許GPU負載靈活分布于本地GPU內(nèi)存、網(wǎng)絡附加GPU、擴展至高達64個GPU,提供強大的整體性能。
因為Fusion Core采用的是“透明”模式而非虛擬層或其他虛擬化方式,所以不需要對基礎硬件或虛擬機環(huán)境做任何改變,也不需要改變應用編程本身。這意味著AI開發(fā)者和數(shù)據(jù)科學家可以無縫利用GPU虛擬化的優(yōu)勢,且將成本和集成需求降至最低。
數(shù)據(jù)卷
深度學習和AI工作負載所需數(shù)據(jù)通常來源廣泛,既有線上也有線下,既有外部也有內(nèi)部,既有批量文件也有文件系統(tǒng)等等。Matrix Fusion能夠簡化處理工作數(shù)據(jù),讓管理員明確網(wǎng)絡附加存儲位置并映射到容器中。只要主機能夠訪問數(shù)據(jù)地址,容器就可以訪問數(shù)據(jù),這讓AI開發(fā)者和數(shù)據(jù)科學家的工作大幅簡化. 此外,系統(tǒng)還支持靈活、無限制的數(shù)據(jù)映射,Matrix Fusion支持每個節(jié)點的本地NFS文件系統(tǒng)。這一默認選項提供了工作負載的標準地址,無論運行多大的深度學習工作負載(包括運行在多服務器之間的),都可以快速獲取運行任務所需的數(shù)據(jù)