POP-3D: Open-Vocabulary 3D Occupancy Prediction from Images - EXAKI training

The EXA4MIND Consortium

doi:10.5281/zenodo.15861855

Published July 11, 2025 | Version v1

Presentation Open

POP-3D: Open-Vocabulary 3D Occupancy Prediction from Images - EXAKI training

The EXA4MIND Consortium

EXAKI training number 1.

In this session, we present a joint work produced in collaboration between CIIRC at CTU in Prague and valeo.ai within the EXA4MIND project.

This work focuses on leveraging multimodal learning, particularly language-vision integration, to enable open-vocabulary 3D scene understanding. This is based on our work called “POP-3D: Open-Vocabulary 3D Occupancy Prediction from Images”, which was presented at NeurIPS.

Files

1 Session POP-3D_ ... SLIDES (2).pdf

Files (10.7 MB)

Name	Size	Download all
1 Session POP-3D_ ... SLIDES (2).pdf md5:64a15561cad1f56020bb8a3a6f972037	10.7 MB	Preview Download

Additional details

European Commission
EXA4MIND - EXtreme Analytics for MINing Data spaces 101092944

Accepted: 2025-07-11

Views

Downloads

Show more details

	All versions	This version
Views	46	46
Downloads	29	29
Data volume	331.1 MB	331.1 MB

More info on how stats are collected....

DOI

Resource type

Presentation

Publisher

Zenodo

Languages

English

License: Creative Commons Attribution 4.0 International

The Creative Commons Attribution license allows re-distribution and re-use of a licensed work on the condition that the creator is appropriately credited. Read more

Technical metadata

Created: July 11, 2025
Modified: July 11, 2025

POP-3D: Open-Vocabulary 3D Occupancy Prediction from Images - EXAKI training

Files

1 Session POP-3D_ ... SLIDES (2).pdf

Files (10.7 MB)

Additional details

Funding

Dates

POP-3D: Open-Vocabulary 3D Occupancy Prediction from Images - EXAKI training

Creators

Description

Files

1 Session POP-3D_ ... SLIDES (2).pdf

Files (10.7 MB)

Additional details

Funding

Dates