본 연구는 최근 6개월 동안의 이미지 생성형 AI의 발전 동향을 연구하고 이를 바탕으로 앞으로 이미지 생성 AI와 창작자들이 협업하기 위해서 교육 현장에서는 어떤 방향성을 설정해야 할지를 모색하는 것이다. 연구 방법으로 먼저 AI가 빠르게 발전하는 이유를 설명하고 23년 10월에 출시한 파이어플라이 2와 달·이 3의 6개월간의 인터페이스와 이미지 수준 변화를 알아보고 추가로 미드저니, 스테이블 디퓨전, 노블 AI의 특징과 이미지를 비교하였다. 연구 결과 달·이 3은 챗GPT 4와 하나가 되면서 대화형 인터페이스로 바뀌었으며 인간의 프롬프트를 이해하고 최적의 프롬프트로 작성하여 더 나은 이미지를 생성할 수 있게 되었다. 달 · 이 3은 이미지 수준도 높아졌지만, 챗GPT와 함께 개인 비서 역할로 발전하는 것이 특징이다. 파이어플라이 2는 어도비 그래픽 프로그램같이 인터페이스를 강화하고 이미지 수준도 높아졌으며 작업자가 사용할 소스이미지를 생성하는 방향으로 발전하고 있다. 미드저니는 다소 인터페이스가 불편하지만 수준 높은 이미지를 생성하여 일반인은 물론 작가와 회사에서 가장 많이 사용하고 있다. 개별 설치형인 스테이블 디퓨전은 오픈소스로서 무료이지만 사용법이 어렵고 고사양의 컴퓨터가 필요하다. 그럼에도 하드웨어와 코딩을 공부한다면 모델을 미세조정 하거나 플러그인을 활용하여 효과적인 도우미가 될 수 있다. 노블 AI는 쉬운 인터페이스로 일본 만화, 애니메이션을 좋아하지만 잘 못 그리는 입문자나 초등 교육 활동에 적합하다. 이를 반영한 교육 방향으로는 프롬프트 작성을 위한 생각하기 글쓰기 교육의 중요성과 함께 비용 문제의 대안으로 팀별 요금제를 제안하였다. 그리고 학생의 개인별 성향을 파악한 후 다양한 분야에 관심이 많은 학생은 달·이를, 작가적 성향이 뚜렷한 학생은 미드저니를, 하드웨어와 소프트웨어에 관심이 많은 학생은 스테이블 디퓨전을 추천하였다. 파이어플라이는 포토샵과 같이 이미지 작업의 기본적인 도구의 역할을 할 수 있다. 본 연구로 앞으로의 이미지 생성 AI의 발전을 구체적으로 예측할 수는 없지만 빠르게 발전하는 AI의 동향과 그에 적합한 교육 방향을 모색하기 위한 도움이 되기를 기대한다.
This research investigates how image generative AI has developed over the past six months and summarizes future trends in image generative AI development, exploring the direction that future creators capable of collaborating with AI should be educated in. The research method first explains the rapid advancement of AI due to self-directed learning with synthetic data and the mutual enhancement among various AIs. It also compares the interfaces and the quality of images generated by newly announced services in October 2023, such as Firefly 2 and DALL · E 3, to their previous versions, and further compares the interface features and image quality of Midjourney, Stable Diffusion, and Noble AI. The results show that DALL · E 3, integrated with ChatGPT 4, completely abandoned its original interface for a conversational one and can now understand human prompts and create optimal prompts for generating images. DALL·E 3 is expected to evolve into a role that aids human life in collaboration with ChatGPT, beyond just generating images, although its image quality has also improved. Firefly 2 has enhanced its user interface like Adobe graphic programs and improved image quality, especially generating images with different feelings according to photo and art options, evolving towards generating source images needed for work. Midjourney, despite its somewhat inconvenient interface, generates high-quality images and is most used by the general public, artists, and companies. Stable Diffusion, an individually installed open-source software, is free but requires a highperformance computer and a complex setup and usage learning curve. However, it can be effectively used as a work assistant by modifying the generative model or using plugins for those interested in hardware and programming. Noble AI, with its user-friendly interface, is suitable for beginners or elementary educational activities, or for those who like Japanese manga and animations but are not skilled in drawing. The educational direction reflected in these conclusions first needs to address the cost issue, suggesting a team pricing model as a realistic alternative if the cost issue cannot be resolved within the school’s existing education system. Moreover, education in thinking and writing for prompt creation remains important, and after understanding the individual tendencies of the educational targets, it recommends DALL · E for students interested in various fields, Midjourney for students with a distinct artistic tendency, and Stable Diffusion for students interested in hardware and software. Firefly can serve as a basic tool used by all image workers, similar to Photoshop. Although this study cannot accurately predict the future direction of image generative AI development, it can provide a perspective for exploring suitable educational directions in response to the rapidly evolving trends in AI.