Char :: LLM - 멀티모달 AI

LLM - 멀티모달 AI

07.AI 2025. 8. 1. 00:17

728x90

(개념) 텍스트, 오디오, 이미지, 비디오 등 다양한 데이터 유형을 통합해 처리하고 분석할 수 있는 AI 기술

(특징) 텍스트 기반 입력으로 이미지 기반 출력을 생성하거나, 이미지 데이터와 오디오 데이터를 결합해 새로운 이미지 데이터를 생성하는 등 입력과 출력의 데이터 양식이 다양

인간을 닮은 인공지능, 멀티모달 인공지능 기술 동향, IITP 주간기술동향, 2024.6.12 (재인용) 생성형 AI 학습을 위한 멀티모달 데이터품질특성 고찰 및 적용방안, TTA 저널 제218호

이기종 데이터들을 각각의 양식, 모달리티(Modality)라고 하는데,
멀티모달 AI에서 모달리티 연결은
모달리티가 어떻게 관련돼 있고 공통점을 공유하는지 명하는데 중요한 특성이다.

모달리티 간 연관된 정보가 통계적, 의미적 측면에서 공유되고 연결 및 고려되는 모습을 보여준다. 통계적 데이터 중심 관점에서의 연결은 다중모달 데이터 분포 패턴에서 식별된다. 반면, 의미적 접근방식은 모달리티가 고유한 정보를 공유하고 포함하는 방식에 대한 도메인 지식을 기반으로, 연결을 정의하고 있다.

따라서, 다양한 모달리티 정보 간 의미적 접근 방식을 기반으로, 멀티모달 AI 모델이 다양한 유형의데이터를 입력 및 처리하는 메커니즘을 고려해, 멀티모달 데이터의 품질특성을 정의할 수 있다.

생성형 AI 학습을 위한 멀티모달 데이터품질특성 고찰 및 적용방안, TTA 저널 제218호

http://weekly.tta.or.kr/weekly/files/20240509080557_weekly.pdf

728x90

저작자표시 (새창열림)

'07.AI' 카테고리의 다른 글

LLM - 시각-언어 모델(Vision Language Model: VLM) (0)	2025.08.04
LLM - 시각-추론 모델 QVQ (Qwen, QVQ-72B-Preview) (1)	2025.08.04
머신러닝 - 파인튜닝(fine-tuning), 미세조정 (4)	2025.07.31
LLM - 성능 - 모델 최적화 - '테스트 타임 스케일링(test-time scaling)' 기법의 역설 (2)	2025.07.30
에이전트 AI - 가디언 에이전트(Guardian Agent) (3)	2025.07.21

Posted by Mr. Slumber

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Char

LLM - 멀티모달 AI

'07.AI' 카테고리의 다른 글

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

글 보관함

달력

링크

티스토리툴바