
Overview
LingBot-Depth ist ein hochpräzises räumliches Wahrnehmungsmodell, das darauf ausgelegt ist, die Tiefensensorik und die 3D-Umfeldverständnisfähigkeit von Robotern in komplexen realen Umgebungen zu verbessern. Entwickelt von Robbyant, einer verkörperten KI-Firma innerhalb der Ant Group, befasst es sich mit Herausforderungen wie fehlenden Tiefeninformationen auf transparenten oder reflektierenden Oberflächen. Es verwendet Masked Depth Modeling (MDM), um fehlende Tiefenbereiche aus RGB-Bildmerkmalen zu schätzen und zu rekonstruieren, wodurch dichte und genauere 3D-Karten erstellt werden. Im Vergleich zu wichtigen Modellen wie PromptDA und PriorDA verringert es den relativen Fehler um über 70% in Innenräumen und die RMSE um 47% bei spärlichen Struktur-aus-Bewegungs-Aufgaben.
Detailed specifications
Other4
- REL Reduction
- 70%
- RMSE Reduction
- 47%
- Company Country
- CN
- Additional Information
- - Masked Depth Modeling: Self-supervised pre-training via depth reconstruction. - Cross-Modal Attention: Joint RGB-Depth alignment in unified latent space. - Metric-Scale Preservation: Maintains real-world measurements for downstream tasks. - Training Data: Includes 2M real-world and 1M simulated RGB-D samples. - Hardware Setup: Scalable RGB-D capture system with Intel RealSense, Orbbec Gemini, and Azure Kinect.
Reviews for LingBot-Depth
Loading reviews…