異型自動插件機在深度學習算法訓練上非常高效
作者:wenwen
發(fā)布時間:2018-12-13
點擊數(shù):
目前以深度學習為代表的異型自動插件機人工智能計算需求,主要采用GPU、FPGA等已有的適合并行計算的通用芯片來實現(xiàn)加速。異型自動插件機在產(chǎn)業(yè)應用沒有大規(guī)模興起之時,使用這類已有的通用芯片可以避免專門研發(fā)定制芯片(ASIC)的高投入和高風險。但是,由于這類通用芯片設計初衷并非專門針對深度學習,因而天然存在性能、功耗等方面的局限性。隨著人工智能應用規(guī)模的擴大,這類問題日益突顯。
GPU作為圖像處理器,設計初衷是為了應對圖像處理中的大規(guī)模并行計算。因此,在應用于深度學習算法時,有三個方面的局限性:
第一,應用過程中無法充分發(fā)揮并行計算優(yōu)勢。異型自動插件機深度學習包含訓練和推斷兩個計算環(huán)節(jié),GPU在深度學習算法訓練上非常高效,但對于單一輸入進行推斷的場合,并行度的優(yōu)勢不能完全發(fā)揮。
第二,無法靈活配置硬件結構。異型自動插件機GPU采用SIMT計算模式,硬件結構相對固定。目前深度學習算法還未完全穩(wěn)定,若深度學習算法發(fā)生大的變化,GPU無法像FPGA一樣可以靈活的配制硬件結構。
第三,運行深度學習算法能效低于FPGA。
盡管FPGA倍受看好,甚至新一代百度大腦也是基于FPGA平臺研發(fā),但其畢竟不是專門為了適用深度學習算法而研發(fā),實際應用中也存在諸多局限:第一,基本單元的計算能力有限。為了實現(xiàn)可重構特性,F(xiàn)PGA內(nèi)部有大量極細粒度的基本單元,但是每個單元的計算能力(主要依靠LUT查找表)都遠遠低于異型自動插件機CPU和GPU中的ALU模塊;第二、計算資源占比相對較低。異型自動插件機為實現(xiàn)可重構特性,F(xiàn)PGA內(nèi)部大量資源被用于可配置的片上路由與連線;第三,速度和功耗相對專用定制芯片(ASIC)仍然存在不小差距;第四,異型自動插件機FPGA價格較為昂貴,在規(guī)模放量的情況下單塊FPGA的成本要遠高于專用定制芯片。
所以越來越多的企業(yè)都開始采用自動化設備來代替人工,從而降低生產(chǎn)成本,在制造異型自動插件機的企業(yè)當中,佳永自動化科技有限公司擁有著成熟的技術團隊,同時自主研發(fā)了異型自動插件機,其中采用了多軸高速精密運動控制,多角度視覺系統(tǒng)標定,伺服/視覺精準協(xié)同控制實現(xiàn)8-12個取插頭電動夾持的力/位控制。在所有視覺系統(tǒng)均開啟的情況下,單個插件速度也僅需0.6秒,可全面實現(xiàn)了異形元件插裝標準化作業(yè)。
以上就是小編關于異型自動插件機在深度學習算法訓練上非常高效的介紹,希望對大家有用哦!
責編:文文