효과적인 프롬프트 작성을 하려면 어떻게 해야 할까?
바야흐로 생성 AI의 시대다. 챗GPT가 혁명적인 바람을 몰고 온 이후로, 텍스트뿐만 아니라 이미지와 동영상 생성을 포함한 AI 도구가 전산업에 스며드는 추세다.
최근 오픈 AI의 동영상 생성 프로그램 SORA가 공개한 영상들은 경이로울 정도로 그 완성도가 놀라웠다. 이제는 정말 ‘다른’ 세상이 다가오고 있구나 하는 생각이 들 정도로. 이런 세상을 상상만 했지, 실제로 업무에 활용할 수 있을 거라는 생각을 불과 몇 년 전만 해도 못 했던 나 같은 사람은 적잖게 당황하고 있다.
그렇지만 시대의 흐름을 거스를 순 없으니 부랴부랴 흐름을 따라잡는 것밖에는 방법이 없겠고, 나도 올해부터 생성 AI의 세계로 한 발짝 들어가게 되었다.
콘텐츠 에이전시에서 일하고 있는 나의 입장에서 일단 ‘챗GPT’ 사용은 선택이 아닌 필수사항에 가깝다. 자연스럽게 유료 버전인 GPT-4를 사용하게 되었고, 그 안에 탑재된 이미지 생성 AI ‘달리’(DALL·E 3)와 친숙해지게 됐다.
이제부터 간단하게, 달리 3를 쓰며 생각한 나만의 시행착오·노하우를 쓰려고 한다.
[달리 3의 한글 이해]
이미 널리 쓰이고 있는 미드저니, 파이어플라이 같은 프로그램들도 나름의 장점이 있고 특유의 질감이 있지만, 그에 반해 달리 3가 가지고 있는 최고의 장점은 ‘한글 프롬프트에 대한 이해도’인 것 같다.
| 미드저니 | 스테이블 디퓨전 | 파이어플라이 | 달리 3 |
| 색감과 스타일이 가장 풍부. 디지털아트, 그래픽 노블, 판타지 느낌의 질감. | 비디오, 애니메이션 생성 가능. 실제와 비슷하면서도 약간 독특한 결과물. | 종횡비, 콘텐츠 유형 등 사전 설정. 다양한 기존 어도비 프로그램들과 연동. | 높은 프롬프트 맥락 이해 수준. 사진처럼 사실적인 이미지 출력. |
누구에게나 자신의 모국어가 더 쉽고 편할 것이다. 업무에서도 마찬가지일 텐데, ‘달리’는 자연어 처리 기능이 뛰어나기 때문에 웬만한 문장들은 거의 그대로 이미지에 반영한다. 그래서 더 손쉽게 원하는 이미지를 만들 수 있다.
예를 하나 들어보겠다.

위 그림은 내가 거의 처음 달리3를 이용해서 만든 이미지이고 프롬프트는 아주 간단했다. (「’Cinema'(영화)를 상징하는 이미지 한 장 만들어줘. 신스웨이브 스타일로」)
화풍을 바꾸니 (「’Cinema'(영화)를 상징하는 이미지 한 장 만들어줘. 인상주의 스타일로」)
이렇게도 만들어주고,

비율도 바꿔주고, (「16:9 비율로 다시 한 장 만들어줘」)

이미지 수정도 해준다. (「영사기가 스크린 쪽을 향하도록 이미지 수정해 줘」)

[효과적인 프롬프트 작성법]
그럼 이제, 긴 시간의 인터넷 서칭을 통해서 터득한 ‘이미지 생성 프롬프트 3단계’에 따라 최종 결과물을 뽑아보겠다. ➲

입력한 프롬프트는 다음과 같다.
– 기본 프롬프트: ‘Cinema'(영화)를 상징하는 이미지 한 장 만들어줘.
– 이미지 스타일: 따뜻한 색조, 다양한 컬러감의 인상주의 스타일. 16:9 사이즈.
– 상세 설명: 영사기가 스크린 쪽을 향해 빛을 쏘고 있고, 영화관 객석에는 많은 사람들이 앉아 있다.
‘내용’과 ‘스타일’을 구분해서 구체적으로 프롬프트를 입력하니, 확실히 더 마음에 드는 결과물이 나오는 것 같다.
아직까진 프롬프트의 내용을 그림 속에 완벽하게 다 반영하지 못하고, 이미지들의 연속성이 부족하다는 아쉬움은 있다. (기회가 된다면 이 시리즈의 다른 편에서 시드넘버를 이용한 이미지 연속성 유지 방법을 살펴볼 것이다)
하지만, 전체적으로 봤을 때는 확실히 무섭고 두려운 기능이다.
인공지능이 아직은 인간의 마음을 완벽하게 꿰뚫어 보지는 못하기 때문에 백 퍼센트 내 머릿속의 구상을 이미지화하지는 못하지만, 앞으로 빠르게 그 간극을 좁혀갈 것이다.
일론 머스크의 뉴럴링크가 하는 실험(뇌에 컴퓨터 칩 심기)이 일반에 상용화 된다면, 정말 머릿속의 칩을 통해서 ‘생각만으로도’ 화면에 이미지가 표현되는 그런 세상이 올지도 모르겠다.

