Reason3D: Searching and Reasoning 3D Segmentation via Large Language Model

Arxiv, 2024
Kuan-Chih Huang, Xiangtai Li, Lu Qi, Shuicheng Yan, Ming-Hsuan Yang

Visualization

Introduction

This paper introduces Reason3D, a novel LLM designed for comprehensive 3D understanding. Reason3D takes point cloud data and text prompts as input to produce textual responses and segmentation masks, facilitating advanced tasks like 3D reasoning segmentation, hierarchical searching, express referring, and question answering with detailed mask outputs.

Specifically, we propose a hierarchical mask decoder to locate small objects within expansive scenes. This decoder initially generates a coarse location estimate covering the object’s general area. This foundational estimation facilitates a detailed, coarse-to-fine segmentation strategy that significantly enhances the precision of object identification and segmentation.

Citation

If you find our work useful for your project, please consider citing our paper:

@article{reason3d,
  title={Reason3D: Searching and Reasoning 3D Segmentation via Large Language Model},
  author={Kuan-Chih Huang and Xiangtai Li and Lu Qi and Shuicheng Yan and Ming-Hsuan Yang},
  journal={arXiv},
  year={2024}
}

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
figs		figs
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reason3D: Searching and Reasoning 3D Segmentation via Large Language Model

Visualization

Introduction

Citation

About

Releases

Packages

KuanchihHuang/Reason3D

Folders and files

Latest commit

History

Repository files navigation

Reason3D: Searching and Reasoning 3D Segmentation via Large Language Model

Visualization

Introduction

Citation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages