中國智能化產業與產品網訊:據國外媒體報道,谷歌最新研發的系統DeepStereo能夠通過人工智能技術將一系列照片無縫組合成為視頻。
利用DeepStereo制作的視頻片段
據悉,DeepStereo能夠“猜測”出圖像缺少的部分,并且在空白的地方創造出原圖沒有的新內容。與傳統動畫利用視覺暫停的原理不同,DeepSteoreo可以“想象出”兩幅靜止圖像之間的畫面。
谷歌工程師約翰·弗林表示:“這項技術與之前的產品截然不同,我們嘗試采用新型深度架構直接合成新圖像,不需要預先設置景深、焦距等訓練數據。”
據了解,DeepStereo在工作時會采用兩套獨立的網絡架構。其中之一會根據已有的2D數據預測各個像素的景深。另外一個則會對色彩作出預測。兩者共同以2D圖像的形式完成對景深和色彩的預測,最終合成視頻。
DeepStereo的不足之處在于視頻角落的畫面仍顯示較為模糊,而這些角落無法被覆蓋,也不能使用像素填充。
盡管這一系統生成的最終產品與通過圖像簡單合成的動畫沒有太大區別,但該技術仍然能夠為谷歌的街景技術加不少分。
版權聲明