본문 바로가기

이슈

& 2) AI그림의 혁명

2022년 콜로라도 미술대회 대상작품 '스페이스 오페라 극장'

 

파이썬 기반의 웹설치형인 스테이블 디퓨전 (Stable Diffusion)으로 시작했던 AI그림은 현재 웹기반인걸 넘어서 챗GPT와 결합하고, 표현되는 게 한계가 없어져 사용자가 상상하는 거의 모든 것을 시각화할 수 있는 수준에 이르렀다. 

 

SD 초기 시절에는 대충 프로그램을 3개 설치하고 웹 IP로 접속해 그 당시 공통되었던 네거티브 프롬프트를 붙여 넣고, 엔진 파일을 찾아 다운로드하여 지정폴더에 넣고 적용해야 했으며, 시드나 블러강도 등 여러 가지 설정값을 세팅해야 프롬프트를 직접 입력해 그림을 만들 수 있는 준비가 되었었다. 여러 가지 플러그인을 추가할 수 있으며, 프롬프트도 영어로 서술형이 아닌 단어 나열하는 방식으로 배열순서나 괄호기호의 숫자를 이용한 강도 조정 등 여러 규칙이 있었지만 그것도 100프로 검증된 방법도 아니었다. 

 

하지만 인터넷 강국 집단지성의 힘은 대단했다. 얼마지나지않아 유용한 프롬프트를 모아놓은 프롬프트 사전이 나오고 'CIVITAI' 같은 플랫폼이 생겨나 프롬프트나 엔진, 설정값을 공유하기 수월해졌다. (지금은 괜찮아졌지만 이 당시 이 사이트의 선정적인 수위는 정말 필터가 없었다.) 일관성이 없고 랜덤성향이 강해 연속성을 주기 위해 그림체나 얼굴등을 학습시키는 로라가 나오고, 원하는 자세를 그릴 수 있는 컨트롤넷의 등장으로 점점 가속도가 붙기 시작했다. 그 당시 여러 관련 커뮤니티를 둘러봤는데 이런 쪽에 특화된 사람들의 공유와 습득, 응용하는 능력은 대단했다. 그 당시에 이미 얼핏 봐서는 실제사진과 구분이 안될 정도의 퀄리티가 나왔었다. 현재는 SD와 더불어 실사에 유독 강했던 미드저니도 새 버전이 업데이트되면서 실사에 예술성까지 더해졌다. 하여튼 일 년이 지난 현재 여러 AI아티스트의 작품들을 볼 때 품질만 보자면 사실 크게 달라진 게 없지만 예술성과 다양성이 더해지고 자세나 표정이 훨씬 자연스러워진 걸 느낄 수 있다. 

 

이정도면 이미 모델 초상권으로부터 해방이다.

 

이제 2D(고퀄애니그림체)는 정복되었고, 다음단계인 3D(실사)로의 진화가 이루어졌다. 그럼 그다음단계는? 동영상이다.

 

초기 AI그림을 이용한 영상은 일관성이 떨어지는 연속적인 그림을 이어 붙이는 방식이었고, 저프레임 플립북 같은 수준이었어서 어느 정도 노가다와 전문성이 필요했다. 하지만 지금은 월구독료 20달러 정도면 초보자도 쉽게 15초 분량의 꽤나 자연스러운 영상을 만들 수 있다. 예상보다는 발전속도가 느린 편인데, 기술이 기술을 발전시켜 가속이 붙기 시작하는 특이점이 오듯이 알고리즘 로직이 완성이 된다면 이는 창작의 방식을 근본적으로 변화시키고, 더 많은 사람들이 참여할 수 있는 기회를 제공할 것이다.  

반응형