728x90
반응형

(개념) 인공지능, 소프트웨어 개발, 시스템 설계 등 다양한 기술 분야에서 기존에 존재하는 코드, 모델, 아키텍처 또는 외부 프레임워크를 재사용하지 않고, 기초 단계부터 모든 것을 새로 구축하는 방법론

 

- 특정 알고리즘이나 시스템을 구성할 때, 선행된 구현체를 참고하지 않고 완전한 초기 상태에서 개발을 시작하는 방법.

- 구현 대상의 내부 메커니즘에 대한 깊은 이해를 유도하며, 학습용 또는 연구 개발 초기 단계에서 자주 활용

- 주로 기성 모델(Pre-trained Model)이나 라이브러리를 사용하지 않는 것을 특징으로 함

 

(활용)

분야 활용 예시 비고
딥러닝/머신러닝 CNN, RNN, Transformer 등 아키텍처를 프레임워크 없이 직접 구현 PyTorch/TensorFlow 없이 NumPy 등으로 구현
시스템 소프트웨어 운영체제 커널, 컴파일러를 직접 구현 OSDev에서 전형적인 방식
알고리즘 학습 정렬, 탐색, 동적 계획법 구현 기본 자료구조부터 직접 설계
보안 및 임베디드 자체 커널, 부트로더, 펌웨어 개발 기존 보안 취약점 차단 목적

 

(Testbed 사례) - 2025년 8월 검색 기준

1. 생성형 AI 훈련

  • 최근 GPT, LLaMA, Gemini 등 고성능 모델이 공개되면서, 모델 구조를프롬스크래치로 재현하거나 경량화 구현을 시도하는 연구가 증가함.
  • : Meta AI"LLaMA from scratch" 구현 프로젝트 (2024~2025), HuggingFace Minimal GPT 구현 등.

2. 운영체제/컴파일러 교육 및 연구

  • 교육 목적으로 OS 또는 컴파일러를 from scratch로 구현함으로써 시스템 설계 전반을 직접 체험하는 방식.
  • : MIT xv6 운영체제, LLVM을 참조하지 않고 만든 custom compiler.

3. 보안/국방 시스템

  • 외부 의존성을 줄이기 위해 신뢰된 공급망 기반에서 모든 요소를 자체 개발하는 전략을 채택.
  • : 2025년 미 국방부(DoD) "Zero-Trust Hardware Security Stack"에서 검증된 오픈소스 없이 프롬스크래치로 개발.

(비교)

"From Scratch" vs "Fine-tuning" or "Transfer Learning"

항목 From Scratch Fine-tuning
데이터 전량 필요 소량으로도 가능
학습시간 매우 김 상대적으로 짧음
유연성 매우 높음 구조 제약 있음
성능 확보 어려움 기존 성능 활용

 

 

728x90
Posted by Mr. Slumber
,