spatial intelligence (1) 썸네일형 리스트형 [논문읽기] 3D-LLM: Injecting the 3D world into Large Language Models MIT IBM Watson 랩 및 Umass Amherst 등 여러 대학 출신들로 구성된 연구팀에서 진행중인 연구로 2024년 NeurIPS에 Spotlight로 발표되었다. ( 이름에서 바로 알 수 있듯이 3D 데이터와 LLM을 연결시켜 여러 가지 작업들을 할 수 있도록 하는 연구이다. 요즘 Vision Language Model (VLM)들이 많이 나오고 있는데, 이의 3D 버전이라고 생각하면 편할 듯 하다. 현재 Arxiv에 올라와 있는 논문은 NuerIPS에 제출되기 전 버전인 듯 하다. 아래 링크에서 보는 게 정확할듯...NeurIPS Poster 3D-LLM: Injecting the 3D World into Large Language Models 아래는 이 모델을 트레이닝하기 위해 직접 생.. 이전 1 다음