功能描述:
Nvidia的人工智能總監和論文合著者Sanja Fidler說:“公司下一步可能會嘗試將可微渲染框架(Differentiable Rendering Framework,DIB-R)擴展到更復雜的任務,比如為多個對象或整個場景渲染三維模型;這樣的工作可以應用于游戲、AR/VR、機器人或目標跟蹤系統中。”
Fidler還說:“關于三維深度學習目前很多公司已經做了一些工作,如Facebook AI Research與DeepMind也能將二維轉化成三維AI,但DIB-R是第一個可以通過二維圖像預測幾個關鍵的三維特征(如對象的形狀、三維幾何、顏色和紋理)的神經或者深度學習架構之一。因此盡管之前有很多研究,但沒有一個能真正同時預測所有這些關鍵屬性的研究;它們不是專注于預測幾何形狀就是專注于預測顏色,而不是同時預測形狀、顏色、紋理和光線;而我們的這項研究是真正完成了——不是完全完成,但卻是對一個場景中的對象更加完整的理解。
NeurIPS的一項相關工作是試圖根據人們的聲音來預測他們的“聲之形”。
Fidler說:“我認為這是一個非常有趣的領域,我們沒有在這篇特別的論文中解決這個問題;但就深度學習而言,這是另一個有趣的輸入,當提供給神經結構后就可以得到非常好的三維信息;如今,我認為這絕對是有效的。”
DIB-R是在Nvidia今年發布Kaolin(Kaolin是Nvidia的三維深度學習庫,擁有一系列的模型來幫助開發人員開始使用神經網絡進行三維處理)之后發布的,Nvidia會在NeurIPS上公布五篇論文:《Learning to Predict 3D Objects with an Interpolation-based Differentiable Renderer》、《Joint-task Self-supervised Learning for Temporal Correspondence》、《Dancing to Music》、《Few-shot Video-to-Video Synthesis》、《Exact Gaussian Processes on a Million Data Points》。
參考資料:
https://venturebeat.com/2019/12/09/nvidia-trains-ai-to-transform-2d-images-into-3d-models/
聯系:highspeedlogic
QQ :1224848052
微信:HuangL1121
郵箱:1224848052@qq.com
網站:http://www.mat7lab.com/
網站:http://www.hslogic.com/
微信掃一掃:
|