一、引言
人工智能在近幾年出現(xiàn)了突飛猛進的發(fā)展,尤其是深度學習的提出以及在多個領域的成功應用,使人工智能成為當前學術界和產(chǎn)業(yè)界的研究熱點之一。
如果把人工智能比作一輛轟鳴的戰(zhàn)車,那么算法和模型則扮演著“發(fā)動機”的角色。“發(fā)動機”的質量在一定程度上直接影響、甚至決定了“戰(zhàn)車”最終的效力。從學術角度來看,算法和模型一直以來都是人工智能研究的重點,涌現(xiàn)的大量成果直接推動了人工智能技術的迭代發(fā)展。從產(chǎn)業(yè)角度來看,算法和模型是人工智能技術在生產(chǎn)實踐中真正落地、促進產(chǎn)業(yè)發(fā)展的重要保障。
二、人工智能算法和模型發(fā)展現(xiàn)狀
人工智能算法模型經(jīng)過長期積累已覆蓋多個研究子領域。以機器學習為例,較為核心的算法包括最小二乘法、K近鄰算法、K均值算法、PCA分析法、梯度下降法、進化算法等,較為核心的模型包括線性回歸、邏輯回歸、決策樹、聚類、支持向量機、前饋神經(jīng)網(wǎng)絡等。由于具備較完備的理論基礎和長期的推廣應用,這些算法模型已經(jīng)成為相關問題的標準解決方案。當前,針對這些核心算法和模型的進一步研究和改進也在不斷向前推進。
人工智能在近些年的巨大突破也催生了一批“年輕的”算法和模型。以深度學習為例,新算法使得挖掘數(shù)據(jù)高層抽象特征成為可能,例如反向傳播算法等,而新模型則為解決復雜問題提供了可行路徑,例如深度神經(jīng)網(wǎng)絡、玻爾茲曼機等。這些算法模型極大簡化了傳統(tǒng)機器學習處理信息的方式,成為了計算機視覺、自然語言處理等領域的主流解決方案。可以預見,人工智能領域的新算法和新模型將會源源不斷的涌現(xiàn),并持續(xù)改變和優(yōu)化傳統(tǒng)領域的工作模式。
主流算法模型庫對常見算法模型進行了高效實現(xiàn),成為了人工智能生態(tài)中的重要一環(huán)。例如,Tensorflow框架集成了適配多種語言的機器學習和深度學習算法模型,并且適用于強化學習和遷移學習等新領域,同時提供了模型管理組件,支持模型的持久化存儲、導入和導出。Caffe框架集成了卷積神經(jīng)網(wǎng)絡相關算法模型,擁有大量訓練好的經(jīng)典模型以及近幾年提出的新模型(VGG、Inception、ResNet等),被廣泛應用于工業(yè)界和學術界。CNTK框架支持多種神經(jīng)網(wǎng)絡模型,并集成了AdaGrad、RmsProp等多種優(yōu)化算法,基于微軟在人工智能領域研究成果,提供了細粒度的功能組件和可擴展的模型定制化能力。Keras框架專注于深度學習,不僅提供了可靈活搭配的模型模塊,還集成了Adam、批標準化、PReLU等多種優(yōu)化算法,以高度的模塊化向用戶提供簡易的模型實現(xiàn)方式。MXNet集成了大量神經(jīng)網(wǎng)絡模型,支持多語言封裝,并支持在移動設備上運行,目前已成為AWS的推薦深度學習框架。我國在算法模型庫的建設上也嶄露頭角。百度推出的PaddlePaddle框架提供了針對計算機視覺和自然語言處理的模型庫,集成了MobileNet、SE-ResNeXt等最新模型。騰訊、阿里等企業(yè)也在人工智能算法模型領域貢獻了大量成果。
三、算法模型庫的重要性分析
夯實人工智能基礎,確保掌握關鍵核心技術。人工智能的原理和思想需要通過模型和算法予以展現(xiàn),人工智能研究的發(fā)展必定要基于已有的算法模型,也一定會帶來算法模型的升級更新。一個完備的算法模型庫既是對當前算法模型研究的總結歸納,又是開拓下一個研究階段的起點,有益于夯實我國人工智能研究的基礎,是掌握人工智能關鍵核心技術不可或缺的一步。
推動人工智能各領域研究,催化人工智能技術全面健康發(fā)展。人工智能是一個復雜交叉學科,覆蓋多個子領域,任何一個領域的研究短板都可能制約其他領域的進一步發(fā)展。算法和模型是這些領域間為數(shù)不多的交叉點之一,是各領域開展研究的共同必備要素。一個完備的算法模型庫為各領域研究提供基礎支撐,在一定程度上彌補了領域間隔閡,實現(xiàn)了領域知識的交叉共享,有利于推動人工智能技術的全面健康發(fā)展。
激發(fā)傳統(tǒng)學科研究取得突破,走出多學科交叉融合、共同發(fā)展的新路徑。人工智能提出了一套異于傳統(tǒng)學科的思維模式,利用機器學習、深度學習等技術解決傳統(tǒng)學科中的復雜性問題成為了可能。向傳統(tǒng)學科引入人工智能方法,不斷將算法和模型應用到研究工作中,同時吸收多學科知識來豐富和完善人工智能算法和模型,相互反饋、互相融合、共同發(fā)展,激發(fā)傳統(tǒng)學科研究走出新路子,取得新突破。
助力人工智能技術的產(chǎn)業(yè)應用,促進產(chǎn)業(yè)發(fā)展升級。我國的產(chǎn)業(yè)發(fā)展具有海量數(shù)據(jù)和市場規(guī)模持續(xù)增長的特征,人工智能技術也因此擁有巨大的應用潛力和優(yōu)勢。結合產(chǎn)業(yè)特點建設算法模型庫,既保證人工智能技術有的放矢,也大幅降低傳統(tǒng)產(chǎn)業(yè)融合人工智能技術的門檻,是推動人工智能在產(chǎn)業(yè)界持續(xù)廣泛深入應用的重要保障。
四、算法模型庫建設的初步考慮
人工智能算法模型庫的建設是一個以知識為核心、研發(fā)與管控相結合的系統(tǒng)工程,可以從以下幾點探索開展。
統(tǒng)一規(guī)范,建立標準。算法模型庫涉及多學科、多領域的知識體系,不同體系的算法模型在描述、結構、實現(xiàn)等方面均存在差異,在一定程度上阻礙了算法模型的整合。通過建立適當?shù)臉藴鼠w系,統(tǒng)一算法模型的描述,合理約束算法模型的實現(xiàn),兼顧一致性和靈活性,從而能夠在包容開放的基礎上進一步為擴充和升級做出指導。
開展評測,去偽存真。人工智能的研究進展迅速,新算法新模型不斷涌現(xiàn),以開放模式建設算法模型庫,必然會面對如何評估算法模型優(yōu)劣的問題。通過研究制定面向算法模型的評估方法,建立評估機制,跟蹤評測算法模型質量,做到去粗取精、去偽存真,從而保證算法模型的有效性、可靠性和安全性。
推廣應用,形成閉環(huán)。建設算法模型庫的最終目的是要服務于實際,在實踐中對算法模型進行充分的檢驗和驗證是推動算法模型進一步發(fā)展的重要途徑。積極推進算法模型庫在各領域各行業(yè)的應用,將實際效果反饋給算法模型研究者,形成理論與實踐的反饋閉環(huán),從而在深化人工智能技術應用的同時,不斷促進算法模型的優(yōu)化和創(chuàng)新。
五、展望
人工智能是新一輪科技革命和產(chǎn)業(yè)革命的重要驅動力量,算法和模型是人工智能技術的知識輸出。建設完備的算法模型庫是掌握關鍵核心技術、突破科技和產(chǎn)業(yè)發(fā)展瓶頸的重要一步,具有深遠意義和巨大價值。探索建立一個開放靈活、標準可控、安全優(yōu)質的算法模型庫,是進一步深入發(fā)展人工智能技術的必要環(huán)節(jié),也必然會在科技和產(chǎn)業(yè)發(fā)展的各個方面大展身手。