- Google이 '바드 어드밴스드(Bard Advanced)'라는 업그레이드된 버전을 개발 중
- 이 서비스는 Google One의 유료 구독을 통해 제공될 예정
- 개발자 Dylan Roussel이 X(옛 트위터)에서 공유한 정보에 따르면, 바드 어드밴스드는 구글의 새로운 대형 언어 모델(LLM)인 '제미니 울트라(Gemini Ultra)'에 의해 구동될 것
- 현재 버전의 바드는 중간 등급인 '제미니 프로(Gemini Pro)'를 사용하는 반면, 바드 어드밴스드는 고급 수학 및 추론 기능을 갖춘 더 능력 있는 대형 언어 모델
- 개발자 Bedros Pamboukian은 '고급' 계층을 위한 작업을 진행 중임을 시사하는 코드 문자열을 발견
- Roussel은 사용자가 맞춤형 봇을 생성할 수 있는 '모토코(Motoko)'라는 코드명의 기능을 포함한 추가 업데이트를 발견하고 스크린샷을 공유했으나, 이 봇들을 공유할 수 있을지, 접근하기 위해 비용을 지불해야 할지는 아직 불분명함
- 구글은 또한 AI를 사용하여 사용자가 바드에 제공하는 프롬프트를 확장하고 개선하는 '파워 업(power up)' 기능을 도입할 수도 있음
- '갤러리(Gallery)' 섹션도 언급되어 있으며, 이는 사용자가 바드로 할 수 있는 다양한 주제를 탐색할 수 있게 할 것으로 추측됨
- 스크린샷에 의해 드러난 다른 작은 변경 사항으로는 이미지 생성과 같이 바드가 현재 작업 중인 긴 작업을 추적할 수 있는 '작업(tasks)' 탭과 공유된 바드 프롬프트에 사용자 정의 배경을 추가할 수 있는 방법이 포함됨
- 이러한 기능들이 공식적으로 언제, 또는 만약이 될지는 아직 알 수 없으며, 구글은 즉각적인 논평 요청에 응답하지 않음.
- 구글은 바드를 실시간으로 질문에 응답하고 YouTube 동영상에 대한 질문에 답변할 수 있도록 하는 등 지난 몇 달 동안 여러 업그레이드를 진행함으로써 ChatGPT와 마이크로소프트 코파일럿과 같은 경쟁자들과의 경쟁을 유지하고자 함.
GN⁺의 의견
- 구글이 인공지능 기술을 활용한 새로운 유료 서비스를 개발 중인 것은 AI 시장에서의 경쟁력을 강화하고자 하는 전략적 움직임으로 보임.
- 바드 어드밴스드가 제공할 고급 수학 및 추론 기능은 사용자에게 더 정교하고 전문적인 작업 수행 능력을 제공할 것으로 기대됨.
- 맞춤형 봇 생성과 같은 새로운 기능은 사용자 경험을 개인화하고 창의적인 활용을 가능하게 하여 AI 기술의 접근성과 유용성을 높일 것으로 예상됨.
- 지난 12월에 공개한 Gemini Pro 는 영어만 지원
- 이제 40개 언어와 230개국 에서 사용 가능
- 더블체크 기능도 40개 언어로 확장
- 'G' 아이콘을 클릭하면 바드의 응답이 정확한지 구글에서 검색하여 응답을 입증할 수 있는 콘텐츠가 있는지 평가
- 평가가 가능하다면 강조 표시된 문구를 클릭해서 백그라운드 정보 또는 모순되는 정보를 확인 가능
- Imagen 2 모델을 적용하여 이미지 생성도 지원(아직은 영어로만)
https://www.theverge.com/2024/1/4/24025270/google-bard-advanced-paid-subscription
Google appears to be working on an ‘advanced’ version of Bard that you have to pay for
You might need a Google One subscription.
www.theverge.com
▲구글 Bard, LLM 성능 리더보드에서 GPT-4 Turbo 바로 아래인 2위까지 상승
- 구글 Bard (Gemini Pro) 가 GPT-4-0314/0613 등을 제치고 GPT-4 Turbo (Arena ELO 1249) 바로 아래인 아래 2위 (1215) 까지 점프
- 또한, HHEM 리더보드의 Hallucination Rate도 12% 에서 4.9%로 감소. (GPT-4/4 Turbo는 3.0%, GPT 3.5 Turbo 는 3.5%)
- 바드 + 제미니 울트라가 어떻게 출시될지 정말 기대됨
Hacker News 의견
- 구글 바드의 성능 제한: 한 사용자는 구글 바드의 성능이 비용 때문에 제한되었다고 의심해왔음. 구글은 바드를 무료로 제공하고 있으며, 영원히 모든 사용자에게 거대한 모델을 무료로 운영하고 싶지 않았을 것임. 추론 비용에 대한 혁신이 있었거나, 경쟁에 뒤처진다는 평가에 지쳐 일시적으로 비용을 감수하기로 결정했을 수도 있음. 사용자는 구글이 공개적으로 최고의 모델을 운영하는 것을 볼 수 있도록 구독 서비스를 시작해야 한다고 생각함.
- Jeff Dean의 트윗에 따르면, "Gemini Pro-scale model"이라는 새로운 모델이 출시되었으며, 독립적인 lmsys 리더보드에서 2위를 차지했다고 함. "Pro-scale"이 무엇을 의미하는지, 모든 사용자가 이미 이 모델을 사용하고 있는지는 확실하지 않음.
- 바드의 초기 실망과 개선: 바드는 출시 당시 실망스러웠으나 개선되고 있음을 보는 것이 좋음. 사용자 개인적인 경험으로는 GPT 4/Turbo보다 Claude 2를 더 많이 사용하며, 그 응답 스타일과 질문에 대한 답변을 선호함. Kagi에서는 Claude 1을 GPT 4(비터보)와 동등하게 평가하며, Claude 2의 품질을 4 Turbo와 같은 수준으로 평가하고 있음을 주목할 만함.
- 바드 모델의 투표 수: 바드 모델은 상대적으로 투표 수가 적음. 다른 모델들과 투표 수가 비슷한 수준이 될 때까지 기다릴 것임.
- 바드의 적은 제한성: 바드는 GPT-4에 비해 훨씬 적게 제한되어 있으며, 이것만으로도 GPT-4보다 훨씬 낫다고 느낌.
- 무료 LLM 중에서 바드의 유용성: 모든 무료 LLM 중에서 바드가 가장 유용하다고 생각함. ChatGPT 3.5는 비교도 되지 않으며 게으름.
- 벤치마크 방법에 대한 궁금증: 벤치마크가 어떻게 수행되는지 궁금함. 사용자의 기대나 사용성을 더 잘 대표할 수 있도록 개선될 수 있을 것으로 의심함.
- Jeff Dean의 트윗을 본 후 바드를 사용해봄. GPT-4에 비해 여전히 실망스러움. 질문에서 벗어나 있으면서도 그 사실을 깨닫지 못함.
차트 생성을 요청했을 때, "여기 차트가 있다"고 세 번이나 답했지만 실제 차트는 없었으며, 결국 그 기능이 없다고 말함. - 개인적인 경험과의 불일치: 개인적인 경험으로는 답이 필요할 때마다 GPT로 돌아가게 됨. 대부분의 경우 Google Bard보다 ChatGPT 3.5를 선호하며, GPT 4가 확실히 Bard보다 낫다고 느낌.
- 바드와 ChatGPT 비교: 개인적으로는 바드가 ChatGPT보다 훨씬 낫다고 생각함. 검열되지 않은 Mistral을 사용하고 싶음.
- 바드의 반응성과 검열 추가: 이전에는 요청에 반응적이었고, 거부하지 않았음. 검열 계층이 추가된 것 같음. 예전의 바드가 그립다고 느낌.
https://twitter.com/JeffDean/status/1750930658900517157
X의 Jeff Dean (@🏡)님(@JeffDean)
Bard, powered by the Gemini Pro-scale model, debuts at the #2 position on the independent lmsys leaderboard. 🔥 Give it a try at https://t.co/m9D7JYUfls. Bard is much better & has many more capabilities since its debut in March, thanks to everyone on the
twitter.com
https://blog.google/products/bard/google-bard-gemini-pro-image-generation/
Bard’s latest updates: Access Gemini Pro globally and generate images
We’re expanding Gemini Pro in Bard to all supported languages and bringing text\u002Dto\u002Dimage generation into Bard.
blog.google
'07.AI' 카테고리의 다른 글
생성형 AI - EU, 2024 ICT 표준화 롤링플랜 (0) | 2024.03.27 |
---|---|
AI - 안전 단체 (1) | 2024.03.27 |
생성형 AI - LLaMa - LlamaCloud, LlamaParse (0) | 2024.03.08 |
딥러닝 - 스파이킹 뉴럴 네트워크(Spiking Neural Networks: SNN) (0) | 2024.03.07 |
딥러닝 - VQA (Visual Question and Answering) (0) | 2024.03.03 |