StereoAdapter:北大首提自監督,適配水下雙目深度估計
水下機器人在復雜環境中導航和建模,需解決深度感知難題。研究人員提出StereoAdapter框架,結合單目和雙目視覺,利用自監督學習,在無水下真實深度標簽下,高效適配視覺基礎模型,實現高精度深度估計,顯著提升水下機器人導航和目標檢測能力。
水下環境中的深度感知對水下機器人自主導航、目標檢測和三維重建等任務至關重要。
相比單目方法,雙目視覺可以通過雙目相機直接獲得具有度量尺度的3D深度,避免了單目深度固有的尺度不確定性。
然而,將現有視覺算法直接應用于水下場景會遇到顯著挑戰。
水下成像因光學特性差異引入嚴重的域偏移:水對不同波長光的吸收導致顏色和亮度隨距離衰減,水體中的懸浮顆粒會產生前向/后向散射,攝像機與水的界面產生復雜折射。
這些因素違背了陸地視覺中常用的光度一致性假設,使得在水下獲得可靠的雙目匹配變得更加困難。
在此背景下,目前的方法面臨兩大挑戰:
如何參數高效地將龐大的視覺基礎模型(如在海量陸地數據上訓練的單目深度編碼器)適配到水下域,而不依賴大量有標注的水下數據;
如何將全局一致但存在尺度模糊的單目深度先驗與局部精確但光度敏感的雙目匹配約束緊密融合,在自監督條件下充分發揮雙方優勢。
此前一些研究嘗試從不同角度結合單目和雙目信息,例如TiO-Depth提出了「二合一」的單目-雙目聯合框架,Stereo Anywhere利用視覺基礎模型提供的單目先驗來增強雙目匹配,實現了在低紋理或反光場景下的零樣本泛化能力。
但在水下場景,劇烈的域差異依然使這些方法效果受限。
針對上述難題,北京大學等機構的研究人員提出了全新的StereoAdapter框架,以自監督學習為基礎,在不需要水下真實深度標簽的情況下,將強大的單目深度基礎模型與雙目幾何有機結合。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為“我要久久發用戶上傳并發布”,本平臺僅提供信息存儲服務。
熱門文章
- 1024程序員節京東開放“零幀起手”數字人技術
- 小米汽車開始賺錢了 但雷軍還有點煩
- 電車續航有望超過1000公里
- 2026年汽車以舊換新補貼來襲!最高2萬元,申領全攻略在此
- 技術平權新標桿!MG4半固態安芯版交付,10萬級純電市場迎變革
- 合資老炮放出「智」命大招:天籟·鴻蒙座艙要讓燃油車重回潮流C位
- 2025新能源閉眼入清單:10-50萬檔,這幾款等再久都值
- 15萬級MPV新王者,長超5米2+大7座,續航1300km,比別克GL8更值
- 保時捷911 GT3新增Manthey套件:不改引擎就能將紐北圈速提升3秒
- 從3000萬到下一個3000萬,一汽-大眾的底氣從何而來?
- 2025廣州車展一汽-大眾油電并進,以科技賦能開啟全新商品布局篇章
- 全新豐田威蘭達實拍!外觀顏值升級,配置拉滿,提供三種動力
- 20余款車型版本,9.98萬元起價,2026款長城炮廣州車展上新
- 全新保時捷911 Turbo S:賽道性能與豪華舒適完美平衡的杰作
- 全新一代奔馳GLB低偽裝諜照曝光,外觀向Smart精靈#5靠攏
- 古天樂香港提極氪009新車,現場兩“雕兄”惹眼
- 智界S7亮相廣州車展,20萬級智慧轎車再樹標桿
- 廣州車展 | 長安啟源Q05上市,起售價7.99萬,十萬內唯一激光雷達純電SUV
- 華為科技+改裝神器,猛士M817 Hero版硬核上市
- 五菱星光家族三星亮相天津,全能舒享大7座引領家用MPV新體驗