12. 메일진

LLM - 성능 - 최적화 - TurboQuant 3비트 양자화 [주간기술동향 2212호]

Mr. Slumber 2026. 5. 21. 15:58
728x90
반응형

LLM 추론 메모리 병목 해소를 위한 극저 비트 KV 캐시 양자화 기술 동향 

https://www.iitp.kr/web/lay1/program/S1T62C66/itfind/view.do?seq=1397&cpage=1&rows=10&searchTarget=all

728x90