精品人妻无码一区二区三区四区无码,河南少妇搡BBBB搡BBBB,另类TS人妖一区二区三区牧瑶,17c精品传媒一区二区三区,人人妻人人澡人人爽
精密電阻
NEWS

Facebook研究人員使用視聽技術探索人工智能技術

平面圖對于可視化空間,規(guī)劃路線和傳達建筑設計非常有用。例如,進入新建筑物的機器人可以使用平面圖快速感知整體布局。
創(chuàng)建平面圖通常需要完整的布局,以便3D傳感器和攝像機可以捕獲整個空間。據(jù)國外媒體報道,1月11日消息,最近,來自Facebook,德克薩斯大學奧斯汀分校和卡內基梅隆大學的研究人員正在探索一種人工智能技術,該技術將利用短視頻中的視覺和音頻來重建剪輯中的平面圖。
。研究人員斷言,音頻提供了空間和語義信號,并補充了圖像的映射功能。
他們說這是因為聲音自然是由物體的幾何形狀驅動的。聲音從表面反射出來,顯示出房間的形狀,遠遠超出了攝像機的視野。
從遠處聽到的聲音,甚至在多個房間之外的聲音,都可以揭示出自由空間的存在以及聲音對象的可能存在。此外,從不同方向聽到的聲音會根據(jù)這些聲音所代表的活動或事物來顯示布局。
例如,淋浴的聲音可以指示浴室的方向,而微波爐的聲音可以指示廚房的方向。研究人員的方法稱為AV-Map,旨在將帶有多通道音頻的短視頻轉換為2D平面圖。
機器學習模型使用音頻和視頻數(shù)據(jù)序列來推斷平面圖的結構和語義,最后使用解碼組件來融合音頻和視頻信息。 AV-Map生成的平面圖大大超出了視頻中直接可見的區(qū)域,顯示了被分成離散的語義房間標簽(例如家庭房和廚房)的自由空間和占用區(qū)域。
該團隊在Matternet3D和SoundSpaces數(shù)據(jù)集的數(shù)字環(huán)境中對主動和被動兩種設置進行了實驗。在第一個實驗中,當在樣板房的房間中移動時,使用虛擬攝像機發(fā)出已知的聲音。
在第二種情況下,僅依靠家中物體或人的自然聲音。研究人員說,在未來的工作中,他們計劃擴展多層平面圖,并將繪圖思想與機器人聯(lián)系起來,以主動控制攝像機。

歡迎您的咨詢