Char :: 피지컬 AI (Physical AI) - 로봇 파운데이션 모델의 저지연 추론을 위한 AI 반도체 연구 동향 [주간기술동향 2213호]

피지컬 AI (Physical AI) - 로봇 파운데이션 모델의 저지연 추론을 위한 AI 반도체 연구 동향 [주간기술동향 2213호]

07.AI/10. AI 반도체 2026. 6. 3. 13:53

728x90

https://www.itfind.or.kr/trend/weekly/latestWeekly.do

2026.06.03
[로봇 파운데이션 모델의 저지연 추론을 위한 AI 반도체 연구 동향]

본 고는 로봇 파운데이션 모델의 저지연 추론을 위해 AI 반도체 기술을 연산 및 메모리 병목 관점에서 분석한다. VLA 기반 구조는 멀티모달 정보를 통합하지만, 트랜스포머(transformer) 특성상 어텐션(attention) 연산과 KV 캐시(cache)에서 성능 제약이 발생한다. 특히, 긴 시퀀스에서의 높은 계산 복잡도와 자기회귀적(autoregressive) 추론 시 누적되는 KV 캐시의 메모리 요구가 주요 병목으로 작용한다. 이를 해결하기 위해 어텐션 및 KV 캐시 최적화 기술이 활발히 연구되고 있다. 어텐션 측면에서는 FlashAttention, SpAtten, ELSA 등이 연산량과 데이터 이동을 줄이는 방향으로 발전하고 있다. KV 캐시 측면에서는 PagedAttention, H2O, FlexGen 등 메모리 관리 및 이기종 자원 활용 기법이 제안되고 있다. 이러한 기술들은 데이터플로우, 메모리 구조, 실행 방식이 결합한 형태로 진화하고 있다. 향후에는 하드웨어-소프트웨어 공동 설계를 기반으로 한 통합적 최적화가 핵심 방향이 될 것으로 예상된다.

728x90

저작자표시 (새창열림)

'07.AI > 10. AI 반도체' 카테고리의 다른 글

AI 메모리 - COMPUTEX 2026 이후 AI 추론 시대 메모리 혁명 (0)	2026.06.18
AI 반도체 - AI 반도체 경쟁의 구조적 전환 [주간기술동향 2213호] (0)	2026.06.03
AI 메모리 - 반도체 분야 주요 기술 및 시장 동향 (0)	2026.06.01
AI 반도체 - 글로벌 반도체 R&D 인프라, 4대 핵심 운영 모델과 한국의 전략적 방향 (0)	2026.06.01
AI 반도체 - CPO(Co-Packaged Optics) (0)	2026.05.27

Posted by Mr. Slumber

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Char

피지컬 AI (Physical AI) - 로봇 파운데이션 모델의 저지연 추론을 위한 AI 반도체 연구 동향 [주간기술동향 2213호]

'07.AI > 10. AI 반도체' 카테고리의 다른 글

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

글 보관함

달력

링크

티스토리툴바