728x90
반응형
카테고리 | 세부 내용 |
GPT-4 한계를 완전히 넘어서다 | - 18개 조직에서 GPT-4 능가 모델 발표 |
- Chatbot Arena 리더보드에 GPT-4-0314를 능가하는 70개 모델 등록 | |
- Google Gemini 1.5 Pro, Anthropic Claude 3.5 등 주요 모델이 장문 입력과 고급 기능 제공 | |
일부 GPT-4 모델이 내 노트북에서 실행됨 | - M2 MacBook Pro에서 Qwen2.5-Coder-32B, Meta Llama 3.3 실행 가능 |
- 64GB RAM 사용으로 GPT-4급 모델 실행, 최적화 성과 반영 | |
LLM 가격 폭락 | - 가격 경쟁과 효율성 향상으로 비용 감소 |
- GPT-4o Mini: GPT-3.5 대비 7배 저렴 | |
- Google Gemini 1.5 Flash: $0.0375/mTok | |
Multimodal 비전의 확산 | - 텍스트 외 이미지, 오디오, 비디오 입력 처리 지원 모델 등장 |
- Google Gemini, Claude 시리즈, Qwen2-VL 등 다양한 모델 발표 | |
음성과 라이브 카메라 모드 | - OpenAI, Google에서 음성 대화 및 카메라 피드 공유 기능 제공 |
- 음성 모드는 다양한 억양 및 언어 지원 | |
- 라이브 비디오 모드로 실시간 카메라 피드와 상호작용 가능 | |
프롬프트 기반 앱 생성 | - Claude Artifacts와 같은 기술로 온디맨드 앱 생성 가능 |
- Chatbot Arena에서 프롬프트를 활용한 앱 생성 및 성능 비교 | |
최고의 모델에 대한 무료 접근 | - GPT-4o, Claude 3.5 등 고성능 모델 무료 제공, 이후 유료화 |
- ChatGPT Pro 출시: 월 $200에 o1 Pro 사용 가능 | |
"에이전트" | - "에이전트" 개념의 정의와 실현 가능성 논란 |
- 신뢰성과 프롬프트 주입 문제로 인해 현실화 어려움 | |
평가(Evals)의 중요성 | - LLM 평가 도구의 중요성 대두 |
- 테스트 기반 개발 접근법이 핵심 역할 (Anthropic 사례) | |
- 평가 없는 프롬프트는 신뢰성 부족 | |
Apple Intelligence와 MLX | - MLX 라이브러리로 Mac에서 효율적 LLM 실행 가능 |
- Apple Intelligence는 기대에 미치지 못함 | |
추론 스케일링 모델의 부상 | - OpenAI o1, DeepSeek v3 등 계산 리소스를 활용한 추론 스케일링 모델 등장 |
- 더 어려운 문제 해결 및 성능 향상 | |
현재 최고의 LLM | - DeepSeek v3: 685B 파라미터로 공개 라이선스 모델 중 최고 성능 |
- 훈련 비용 $600만 미만으로 최적화 | |
환경적 영향 개선 | - 모델 효율성 증가로 에너지 소비 감소 |
- 훈련 비용 절감, DeepSeek v3가 대표적 사례 | |
환경적 영향, 더욱 악화됨 | - 데이터센터 확장으로 전력망과 환경에 큰 영향 |
- 과도한 인프라 구축 논란 | |
2024년, "Slop"의 해 | - "Slop": 검증되지 않은 AI 생성 콘텐츠를 지칭하는 용어 |
- 잘못된 AI 사용 방식 경고로 문화적 영향을 미침 | |
합성 학습 데이터의 놀라운 효과 | - 합성 데이터가 학습 효율성과 성능 개선에 기여 |
- DeepSeek v3, Meta Llama 3.3 등 주요 모델에 활용 | |
LLM 사용이 더 어려워진 2024년 | - LLM 도구의 복잡성 증가 |
- 사용자 교육과 신뢰성 개선 필요 | |
지식의 불균형한 분포 | - 기술 발전 속도와 사용자 이해 격차 심화 |
- 교육 콘텐츠 부족으로 정보 불균형 문제 발생 | |
LLM에 대한 더 나은 비판 필요 | - LLM의 과장된 기대감과 문제점에 대한 균형 있는 비판 필요 |
- 기술의 장단점을 이해하고 책임 있는 사용 방식 교육 |
GeekNews
카테고리 | 세부 내용 |
LLMs의 유용성 | - 사용자 커뮤니케이션 능력에 따라 성능이 달라짐 |
- 정확한 질문과 배경 설명이 중요 | |
- 지루한 작업을 빠르게 처리하는 데 유용 | |
- 일부 사용자들이 LLMs를 과소평가함 | |
"에이전트" 개념의 논란 | - "에이전트" 용어는 명확히 정의되지 않아 혼란 초래 |
- 자율성이 포함된 진정한 에이전트가 필요 | |
- "Agentic"이라는 표현은 불쾌감을 줄 수 있음 | |
LLMs 사용의 어려움 | - 사용 자체가 더 어려워졌다는 주장에 동의하지 않음 |
- 초보자에게 동일한 지침 제공 | |
- 다만, "좋은" 결과를 판단하기가 어려워짐 | |
- 벤치마크 조작으로 혼란 야기 | |
가격과 비용 구조 | - 가격 하락이 우려되는 상황 |
- 2025년 상반기에 가격 상승 가능성 예측 | |
- Google Gemini와 Amazon Nova의 가격 구조와 에너지 비용 간의 논란 | |
LLMs의 기술적 발전 | - 일부 GPT-4 모델이 노트북에서 실행 가능 |
- 데이터 센터 의존도가 낮아질 가능성 | |
- OpenAI의 가치가 과대평가되었을 수 있음 | |
Apple과 DRAM 공급 | - Apple의 64GB DRAM 사용이 특별한 이유를 이해하기 어려움 |
- 데이터 센터가 대부분의 RAM 제조 용량을 점유하고 있는데 Apple이 DRAM을 안정적으로 공급받는 방법에 의문 | |
LLMs에 대한 비판 | - 새로운 LLM 모델이 과대평가되었다는 주장 |
- 산업 내 도덕성과 우수성 기준이 낮다는 의견 | |
- "추론" 과정이 비효율적이라는 비판 | |
- 일부 사용자가 LLMs 결함으로 인해 기술을 포기함 | |
개인적 접근과 개선 노력 | - 개인적으로 테스트 프레임워크를 구축하려고 함 |
- LLMs를 최대한 활용하려면 불안정하지만 강력한 기술과 협력하는 방법을 배워야 함 |
2024년 LLMs에 대해 배운 것들 | GeekNews
Things we learned about LLMs in 2024
728x90
'12. 메일진' 카테고리의 다른 글
2025 - 산업부 R&D 제도의 주요 개정 내용 (0) | 2025.01.06 |
---|---|
2025 - 베네딕트 에반스(Benedict Evans) (2) | 2025.01.02 |
2024 - 데이터베이스 (4) | 2025.01.02 |
CES -2025 (0) | 2024.12.30 |
생성형 AI -「생성형 AI와 경쟁」 정책보고서 발간 (2) | 2024.12.24 |