07.AI
생성형 AI - DALL-E 3
Mr. Slumber
2023. 10. 19. 13:52
728x90
반응형
챗GPT의 요약(테스트): 오픈AI의 '달리 3'는 프롬프트 엔지니어링을 줄이고 고품질 이미지를 생성하며 챗GPT와 통합돼 창작과 이야기 생성을 가능하게 합니다.
|
|
프롬프트: "성운이 폭발하는 것처럼 묘사된 농구 선수의 덩크슛"의 달리 2(왼쪽)와 달리 3(오른쪽) 생성 이미지. ©OpenAI
|
오픈AI의 이미지 생성 모델 달리(DALL・E)의 새로운 버전 '달리 3'가 발표됐습니다! 이미 뜨거운 관심을 받고 있는데요. 챗GPT 플러스 사용자들은 오는 10월 중에는 달리 3를 사용해 볼 수 있다고 하네요. 달리 3의 가장 큰 장점은 '프롬프트 엔지니어링(Prompt engineering)'의 의존도를 낮춘 것이라고 합니다. 기존 이미지 생성 모델은 프롬프트에 있는 키워드나 설명 일부를 빠뜨리는 경우가 많았기 때문에, 사람들은 프롬프트 엔지니어링이라고 불리는 기법들을 이용해서 모델이 더 잘 이해할 수 있는 프롬프트를 만들어 왔었어요.
|
달리 3는 복잡한 프롬프트 엔지니어링 없이도 프롬프트에 포함된 설명을 그림으로 정확하게 표현해 주고요. 달리 2와 비교했을 때 같은 프롬프트로도 퀄리티가 더 높은 그림을 생성했습니다(위 그림 참고). 심지어 달리 3는 이제 '챗GPT'의 기능으로도 포함되는데요. 챗GPT로 달리 3의 프롬프트를 추천받아서 그림을 그리거나, 달리 3가 그린 그림으로 이야기를 만들어 낼 수도 있다고 합니다. 아래 링크에서 일러스트, 디오라마, 픽셀 아트 등 달리 3로 생성한 다채로운 이미지들을 만나볼 수 있습니다!
|
오픈AI, DALL・E 3 시스템 카드 공개
|
✢챗GPT의 요약(테스트): 오픈AI가 달리 3 모델의 시스템 카드를 공개하고, 초기 버전의 문제 개선 및 이미지 생성 과제에 대해 설명했습니다.
|
오픈AI가 달리(DALL・E) 3 모델의 시스템 카드(System card)를 공개했습니다. 달리 3는 이전의 달리 2 모델을 기반으로 만들어졌는데요. 아직까지 모델 구조는 공개되지 않았어요. 시스템 카드에서는 모델 자체에 대한 정보보다는, 달리 3가 초기 버전에서 어떤 점을 보완했는지를 주로 설명하고 있습니다. 달리 3의 초기 버전은 선정적인 이미지를 생성하는 경우가 가끔 있었는데요. 오픈AI는 결과 이미지의 부적절성 여부를 'Microsoft Cognitive Service API'를 이용해 판단하고, 이미지에서 부적절한 부분만 따로 모아 놓은 데이터셋을 구축해 문제를 해결했다고 해요. 이외에도 인종, 연령 등의 다양성이 부족한 이미지나 화학적・생물학적 무기와 관련된 이미지, 특정 작가의 스타일로 그려진 이미지 등 이미지 생성 모델이 풀어야 할 숙제들이 잘 설명돼 있습니다.
|
DALL·E 3
DALL·E 3 understands significantly more nuance and detail than our previous systems, allowing you to easily translate your ideas into exceptionally accurate images.
openai.com
https://openai.com/research/dall-e-3-system-card
DALL·E 3 system card
openai.com
728x90