“我在跑馬拉松的時候,身心都受到了磨礪。因此我明白了一個道理,想要把一件事做得更好,必須要持續不斷地轉型。”在近日的賽靈思開發者大會(XDF)上,賽靈思總裁兼首席執行官 Victor Peng 以他35年的長跑經歷來形容賽靈思的戰略轉型。此外,賽靈思還向全球消費者推出了兩款重磅轉型之作……
“我23歲第一次跑馬拉松,當時沒有任何準備,我堅持跑完了全程。整個過程非常痛苦,但讓我明白了提前做準備的重要性。在今后的35年里,我累計跑了100多場馬拉松,最長的一場是10年前參加的,賽程為100英里。“大會一開始,Victor 講述了他的馬拉松經歷, “我在跑馬拉松的時候,身心都受到了磨礪。同時我也明白了,想要把一件事做得更好,必須要持續不斷地轉型。”
Victor表示,當今時代的變化呈幾何級數發生,FPGA也變得更加復雜和強大。此前,賽靈思的可編程邏輯器件主要應用在原型設計和互聯上。而如今,隨著FPGA的復雜程度越來越高,賽靈思已經超越了FPGA器件,轉變為一家平臺提供商。
數據爆炸的發生,人工智能的興起,摩爾定律的放緩,顛覆了原有的市場和業務。系統和基礎設施在全球迅速擴張,對計算能力和帶寬也有了更高的要求。同時,也需要更加迅速地變化來滿足不斷變化的要求和標準。Victor解釋:“就像自然界‘物競天擇,適者生存’自然法則一樣,在數字世界,即使是量產型應用,靈活應變的系統也是最具彈性和可持續性的。”
正如Victor所言,“打造靈活應變、萬物智能的世界”正是賽靈思的使命,這個使命還將會延續幾十年。
為了更好地完成使命,賽靈思制定了新的戰略,即:數據中心優先,加速核心市場發展,驅動靈活應變的計算。Victor比喻:“像是一把椅子的三條腿,每一條腿都相互關聯,對策略的完整性至關重要。”
基于新使命和新戰略,賽靈思推出了全新的產品類別——自適應計算加速平臺ACAP。大會上,Victor重點介紹了賽靈思業界首款ACAP平臺Versal和AI加速器卡Alveo兩款新品。
Victor揭示,當前的設計周期已經超過了硅片發展周期。即使采用先進的架構,保證迅速流程化,也要花費18-24個月,而市場的變化往往在一夕之間。賽靈思的平臺要求既能加速機器學習,又能加速非機器學習部分,并可動態、迅速地完成加速,幫助用戶縮短集成人工智能到應用中的時間,提升上市速度。
為了更好地滿足用戶需求,賽靈思推出了全新的產品類別——ACAP(Adaptive Compute Acceleration Platform)。
ACAP是可擴展、一體化程度非常高的計算平臺,其硬、軟件都可編程。A指靈活應變。ACAP支持采用任何架構來優化網絡、算法和應用,具備低時延,高通量的優勢;CA指計算加速。ACAP是多核計算平臺,其內部有不同的計算引擎,可擴展性非常強,用戶可對它進行定制化的配置;P指平臺。數據流動、計算工作等都可在ACAP上來實現,并有更好的安全性和能耗。
在軟件層面,ACAP是非常一體化的開發平臺,內部含有編譯器等,具有高通量、可擴展、低延遲的性能,未來將能應用到任何場景中。
Versal是行業首款ACAP自適應計算加速平臺。據賽靈思產品與技術市場營銷高級總監Kirk Saban介紹,Versal能夠實現異構加速,可用于各種類型的應用,其設計面向所有開發者。Kirk表示,賽靈思有一個全面的工具流,幫助用戶充分利用Versal架構在熟悉的環境中進行開發。
Kirk認為,Versal的異構處理能力,由其多個不同類型的處理引擎帶來,使得Versal可應對不同的工作負載。Versal的引擎包括標量處理引擎、靈活應變的硬件引擎、智能引擎、高級協議引擎等。
標量處理引擎,有雙ARM Cortex-A72應用處理器,能效高且支持廣泛的應用。還有雙ARM Cortex-R5實時處理器,可滿足安全性非常強的應用需。另外,賽靈思還引入了革新性的引擎——平臺管理控制器,可對整個器件進行控制,可滿足自上而下的設計,實現軟件的可編程。
靈活應變的硬件引擎,適用于更高計算密度的再構建基礎硬件架構,它支持定制存儲器層級,用戶可看到不同層次的應用和外部應用,比如高級機器學習和AI推斷部署和實施,可提供動態重新配置功能,比之前各大產品快8倍。
智能引擎,其軟件可編程,硬件靈活應變。比如DSP引擎,在Versal架構可實現高精度浮點和低時延,面向定制化數據路徑的粒度控制。比如AI引擎,具備高吞吐量,低時延和高功效的特性,專為AI推斷和高級信號處理工作負載而優化。使用緊密耦合存儲器的向量處理器陣列,可直接訪問自適應硬件,實現定制存儲器層級,其軟件可編程。可用在無線的計算,雷達型的應用等。
值得注意的是,賽靈思AI引擎并沒有采用深鑒科技的技術。賽靈思軟件與AI解決方案產品市場營銷與產品規劃副總裁Ramine Roane先生在媒體群訪中解釋,深鑒科技的AI引擎應用范圍比較窄,更適用于某些神經網絡DNA,而賽靈思希望AI引擎可用于包括AI、DSP還有5G在內的更廣泛的領域。
Versal系列共六個產品
Versal產品組合將采用臺積電7nm FinFET制程工藝。目前共規劃六個系列:AI核心系列,AI Edge系列,AI RF系列,基礎系列,旗艦系列以及HBM系列。
其中,AI核心系列和基礎系列已經通過早期使試用計劃與多家關鍵客戶合作,將于明年下半年上市。基礎系列是通用性非常強的產品,可針對包括傳統互聯應用、加速應用在內的各個市場。AI系列是應用于對性能要求非常高的領域,比如機器學習的推斷。
AI Edge系列主要針對自動駕駛、機器人的應用,或者對獨立運營要求以及安全性比較高的應用,預計量產的時間為2020年。Versal旗艦版量產時間為2020年,HBM系列可用在高端的數據中心和測試產品中,其量產時間在2021年之后。RF系列可支持5G架構和應用,主要用在一些高性能的應用當中,包括天線的系統等,將于2020年量產。
除了Versal之外,Alveo也是賽靈思主要介紹的重磅產品。
賽靈思軟件和IP產品部執行副總裁Salil Raje先生在演講中強調了AI加速在人工智能訓練和推斷階段的特點。他表示,當前在推斷階段面臨創新的速度,低時延的性能,更低的功耗,整體的應用加速等方面的挑戰。
另外,Ramine 也明確表示,當前的賽靈思更專注于推斷部分的市場。推斷市場仍然處于上升期,推斷在加速應用這方面處于快速增長階段,現在正處于從CPU向加速卡轉換的階段,推斷的市場未來將比訓練市場規模更大。
此背景下,賽靈思Alveo誕生了。Alveo將用來大幅度提升云端和本地數據中心中業界標準服務器的性能。利用 Alveo,客戶在運行實時機器學習推斷以及視頻處理、基因組學、數據分析等關鍵的數據中心應用時,有望以較低時延實現突破性的性能提升。
據了解,Alveo基于16nm 工藝。目前,Alveo™ U200 和 Alveo U250已經開始接受量產訂單,起價為8995 美元。
就機器學習而言,Alveo U250實時推斷吞吐量比高端 CPU高出20 倍,相對于高端 GPU等固定功能的加速器,能讓 2 毫秒以下的低時延應用性能提升 4 倍以上。此外,Alveo 加速器卡相對于 GPU 能將時延減少 3 倍,在運行實時推斷應用時提供顯著的性能優勢。數據庫搜索等一些應用可從根本上得到加速,性能比 CPU 高90 倍以上。
此外,賽靈思還與其芯片合作伙伴進行了合作,并制定了新的標準和方案。比如:賽靈思與華為聯合發布FX系列加速卡,具備高帶寬、低時延功能,可讓FPGA、CPU、GPU交互使用;賽靈思與浪潮聯合發布了全球首款集成HBM2的FPGA AI加速卡F37X,該加速卡可在不到75W典型應用功耗提供28.1TOPS的INT8計算性能和460GB/s的超高數據帶寬,適用于機器學習推理、視頻轉碼、圖像識別、語音識別等應用場景的AI計算加速。