功能描述:
Nvidia的人工智能總監(jiān)和論文合著者Sanja Fidler說:“公司下一步可能會嘗試將可微渲染框架(Differentiable Rendering Framework,DIB-R)擴展到更復(fù)雜的任務(wù),比如為多個對象或整個場景渲染三維模型;這樣的工作可以應(yīng)用于游戲、AR/VR、機器人或目標(biāo)跟蹤系統(tǒng)中。”
Fidler還說:“關(guān)于三維深度學(xué)習(xí)目前很多公司已經(jīng)做了一些工作,如Facebook AI Research與DeepMind也能將二維轉(zhuǎn)化成三維AI,但DIB-R是第一個可以通過二維圖像預(yù)測幾個關(guān)鍵的三維特征(如對象的形狀、三維幾何、顏色和紋理)的神經(jīng)或者深度學(xué)習(xí)架構(gòu)之一。因此盡管之前有很多研究,但沒有一個能真正同時預(yù)測所有這些關(guān)鍵屬性的研究;它們不是專注于預(yù)測幾何形狀就是專注于預(yù)測顏色,而不是同時預(yù)測形狀、顏色、紋理和光線;而我們的這項研究是真正完成了——不是完全完成,但卻是對一個場景中的對象更加完整的理解。
NeurIPS的一項相關(guān)工作是試圖根據(jù)人們的聲音來預(yù)測他們的“聲之形”。
Fidler說:“我認為這是一個非常有趣的領(lǐng)域,我們沒有在這篇特別的論文中解決這個問題;但就深度學(xué)習(xí)而言,這是另一個有趣的輸入,當(dāng)提供給神經(jīng)結(jié)構(gòu)后就可以得到非常好的三維信息;如今,我認為這絕對是有效的。”
DIB-R是在Nvidia今年發(fā)布Kaolin(Kaolin是Nvidia的三維深度學(xué)習(xí)庫,擁有一系列的模型來幫助開發(fā)人員開始使用神經(jīng)網(wǎng)絡(luò)進行三維處理)之后發(fā)布的,Nvidia會在NeurIPS上公布五篇論文:《Learning to Predict 3D Objects with an Interpolation-based Differentiable Renderer》、《Joint-task Self-supervised Learning for Temporal Correspondence》、《Dancing to Music》、《Few-shot Video-to-Video Synthesis》、《Exact Gaussian Processes on a Million Data Points》。
參考資料:
https://venturebeat.com/2019/12/09/nvidia-trains-ai-to-transform-2d-images-into-3d-models/
聯(lián)系:highspeedlogic
QQ :1224848052
微信:HuangL1121
郵箱:1224848052@qq.com
網(wǎng)站:http://www.mat7lab.com/
網(wǎng)站:http://www.hslogic.com/
微信掃一掃:
|