Char :: LLM - 시각-언어 모델(Vision Language Model: VLM)

LLM - 시각-언어 모델(Vision Language Model: VLM)

07.AI 2025. 8. 4. 11:28

728x90

(개념) 시각 인코더를 거대 언어 모델(Large Language Model: LLM)에 결합하여 시각적 입력을 이해하고 텍스트로 응답할수 있도록 설계된 멀티모델 인공지능 시스템

[시각적 장기 맥락을 지원하는 대표 시각-언어 모델 구조도]

(a) LongVLM

(b) MovieChat

728x90

프론티어 AI(Frontier AI) (0)	2025.08.22
RLM - 언어 추론 모델 (LRM; Language Reasoning Model) (5)	2025.08.16
LLM - 시각-추론 모델 QVQ (Qwen, QVQ-72B-Preview) (1)	2025.08.04
LLM - 멀티모달 AI (1)	2025.08.01
머신러닝 - 파인튜닝(fine-tuning), 미세조정 (4)	2025.07.31