1. ‘AI 웹툰 보이콧’의 주장 따져보기
AI와 관련한 갖가지 논란이 이어진다. 그중에서도 지난 6월 ‘AI 웹툰 보이콧’ 운동은 이미지 생성 AI와 관련한 유저들의 반감을 확인하게 하는 사건이었다. 수많은 유저들이 네이버웹툰 도전만화에 동일 게시물을 업로드한 운동이라는 점에서도 주목할 만했지만, 그 게시물이 나름의 주장과 근거를 담고 있다는 점이 특히 흥미로웠다. 해당 게시물은 논문처럼 참고자료까지 제시했다. 요컨대 해당 게시물은 논거를 지닌 설득의 행위이며, 참여자들은 해당 게시물의 논지에 대체로 동의하기 때문에 게시물을 복사해 올리는 행위를 한 것이다. 그렇다면 그 주장과 근거를 따져보며 유저들을 이끈 설득력의 정체를 파악해 보는 일이 이어져야 할 것이다. 하지만 1달이 지나도록 그런 일을 전문가가 행하지는 않았다. 많은 기사가 나왔지만 그 속에 담긴 전문가 코멘트는 AI를 쓴다면 잘 써야 한다는 원론적인 입장을 견지할 뿐이었다. 그렇게 우리는 ‘반감’이라는 정서를 확인했을 뿐, 정서의 근거가 되는 구체적 논리는 짚어보지 않고 넘어간 것 같다.
그래서 이 글은 두 차례에 걸쳐 ‘AI 웹툰 보이콧’의 핵심 주장과 근거에 해당하는 지점을 저작권을 중심으로 따져볼 것이다. ‘AI웹툰에 반대한다’는 가장 큰 입장이 있고, 그것을 뒷받침하는 핵심 주장들이 있을 때, 핵심 주장들은 다시 근거로 뒷받침된다. 근거 중에는 사실도 있겠지만 확인되지 않은 사실이거나 그 자체로 주장인 근거도 있다. 가령 “AI가 만든 그림은 단 한 장도 저작권에서 안전하지 않다”는 것은 AI 웹툰에 반대할 근거이면서 그 자체로 하나의 주장이다. 그러니 확인이 필요하다. 다시, 그것을 뒷받침하는 “AI는 그림을 ‘학습’하지 않습니다. “무단 도용”할 뿐입니다.”라는 말 또한 검증되지 않는 한 근거라기보다는 주장이다.
[ 그림 1, AI 웹툰 보이콧의 참고자료이지만 해당 주장의 근거가 충실히 담긴 자료라 하기는 어렵다 ]
바로 이 주장들을 집중해 살필 것이지만 그대로 다룰 수는 없다. 생성물의 저작권 침해가 예외 없이 일어난다는 주장이나, 학습 과정에서 반드시 무단 도용이 일어난다는 주장 모두 너무 강한 주장인 만큼 반박당하기 쉽기 때문이다. ‘무조건’ ‘100%’보다는 ‘1%’라도 일어날 가능성이 있다면, 그것을 문제로 지적하는 편이 더 입증하기 쉽고 결과적으로 강력한 주장이다. 이미지 생성 AI는 저작권을 침해할 가능성이 있는가? 혹은 이미 저작권을 침해한 사례가 있는가? 이것이 이 글이 다룰 사안이다.
2. 이미지 생성 AI 저작권 소송
이미지 생성 AI 관련 소송들로 시작하자. 인공지능이 제작한 저작물은 저작권이 없다는 판결은 내려진 바 있지만(1), 현재 진행 중인 소송들 가운데 특히 미국에서 진행 중인 두 건의 소송은 이미지 생성 AI의 저작권 침해 가능성에 대한 첨예한 이슈를 담고 있기에 주목할 가치가 있다. 하나는 한국에도 책이 출간된 만화가 사라 앤더슨이 핵심 소송인으로 등록된 건으로, 어느 팬이 ‘사라 앤더슨’을 프롬프트로 입력해 생성된 이미지를 트위터를 통해 제보한 일로부터 촉발되었다. AI 생성 이미지를 접했을 때의 감정을 앤더슨은 뉴욕 타임즈 기고문을 통해 다음처럼 전한다.
“저는 침해당했다고 느꼈습니다. 제가 그림을 그리는 방식은 제가 받은 교육, 어렸을 때 탐닉했던 만화, 그리고 제 삶의 총합을 구성하는 수많은 작은 선택의 복합적인 결정체라고 할 수 있습니다. 사람들이 생각하는 것보다 더 개인적인 디테일도 담겨 있죠. 예를 들어 제 캐릭터가 입고 있는 줄무늬 셔츠는 제가 가장 좋아하는 신문 만화인 <캘빈과 홉스>의 주인공(아마도 호랑이 홉스 쪽)을 향한 애정 표현이거든요. 또 누군가가 저를 모사하더라도 선의 무게와 같은 다양한 변형과 뉘앙스 때문에 정확한 재현은 어렵습니다. 인간은 예술에 자신의 인간성을 불어넣을 수밖에 없습니다. 이처럼 예술은 깊숙이 한 인간의 것인데, 인공지능은 제 평생의 작업을 알고리즘으로 축소함으로써 예술에서 인간성을 지워버렸어요(2).”
결국 앤더슨은 스태빌리티 AI(스테이블 디퓨전), 미드저니 등 3개 기업에 소송을 결심했다(3). 켈리 맥커넌과 칼라 오티즈라는 동료 예술가들이 함께 고소인으로 이름을 올렸고(4), 또한 그보다 앞서 AI 관련 소송을 제기했던 매튜 버터릭과 그의 변호인단에게 도움도 받았다(5). 앤더슨과 동료들이 소장에 밝힌 저작권 침해 사실을 정리하면 다음과 같다.
[ 그림 2, 사라 앤더슨의 국내 출간작. <어른이 되기는 글렀어>, 그래픽노블, 2016. ]
[ 그림 3, 사라 앤더슨을 프롬프트로 사용해 AI에서 생성된 이미지. “완벽하지는 않지만 제 그림 스타일의 시그니처 요소를 포착했습니다. 검은 앞머리, 줄무늬 셔츠, 커진 눈이 한눈에 알아볼 수 있습니다. AI가 점점 더 정교해짐에 따라 무엇이 가능한지에 대해 점점 더 걱정하고 있습니다.” 사라 앤더슨이 이미지에 덧붙인 말. ]
1) 승인 없이 본인들의 작품이 무단으로 학습되었고 그 과정에서 다운로드, 저장, 배포되었다.
2) 승인 없이 본인들의 작품이 활용되어 (‘특정 작가 스타일’과 같은 프롬프트로) 유사한 결과물이 생성되었다.
3) AI에 의해 생성된 유사한 결과물이 본인들의 작품과 경쟁하게 되었다.
4) 기업들의 AI 상품에 본인들의 작품의 복제물이 승인 없이 포함되어 앞으로도 지속적으로 활용되게 되었다(6).
2)~4)의 내용이 저작물의 활용에 대한 것이라면, 1)은 학습에 대한 것으로, 학습에 승인이 없었다(not licensed)는 것은 동의를 구하지 않았고 비용을 지불하지 않았다는 의미다. 특히 2)~4)와 같은 활용으로 인한 저작권 침해는 애초에 1)의 무단 학습이 없었다면 일어나지 않았을 것이기 때문에, 1)은 여러 저작권 침해를 가능하게 한 원인으로서도 무척 중요하다. 따라서 이 소송은 인간의 저작물에 대한 대가나 보상 없이 학습된 인공지능 플랫폼의 적법성에 대한 문제 제기로 해석 가능하다. ‘AI 웹툰 보이콧’과 겹치는 지점도 있지만, 더 명확한 법적 용어로 구체화되어 있으며 새로운 논점도 담겨 있는 것이다.
해당 소송의 판사는 최근, 소송을 제기한 예술가들이 제출한 원본 작품과 AI의 생성 이미지 사이에 “실질적인 유사성”이 부족하다며 소를 대부분 기각하는 것을 고려하고 있다고 판결 전 견해를 밝힌 바 있다. 하지만 동시에 예술가들 중 어느 정도의 실질적 유사성을 파악할 수 있는 앤더슨에 한해서는 스태빌리티 AI를 상대로 하여 소송을 계속 진행할 수 있도록 조율하고, 다른 두 예술가에 대해서는 소장을 수정해 제출하도록 하려 한다는 의사도 함께 밝혔다(7). 이는 판례를 쌓아가며 기존 법을 갱신하는 미국에서 기존 저작권법을 통해 해결할 수 있는 사례는 그것으로 접근하지만, AI와 관련한 저작권법이 없기에 발생하는 사법상의 어려움과 모호함이 있음을 보여주는 사례다.
또 하나의 사건은 기업 대 기업 간의 소송이다. 이번에도 스태빌리티 AI가 고발을 당했는데 무려 2,268조 원에 해당하는 손해배상액이 걸렸다(8). 이미지 유통 플랫폼 게티이미지가 건 소송으로, 여러모로 앤더슨 소송과 유사한 측면이 많다. 무단으로 학습된 점이 핵심이기 때문이다. 다만 수량의 차이는 상당하다. 앤더슨 소송은 스테이블 디퓨전에 활용된 데이터셋인 LAION 5B(9)를 중점으로 하여, 거기 포함된 데이터를 검색할 수 있는 haveibeentrained.com 사이트에서 확인된 바 있는 약 250건(앤더슨 200점 이상, 맥캐런 30점 이상, 오티즈 12점 이상)에 대한 권리 침해를 주장했다. 게티이미지도 LAION 5B에 자사에서 유통하는 이미지가 담겼다고 하는데, 그 수가 최소 1200만 건이라고 주장한다. 그렇게 많은 이미지가 학습되었기 때문인지, 게티이미지는 소송에 아래와 같은 명쾌한 증거를 제시할 수 있었다.
[ 그림 4, 왼쪽은 게티이미지 뱅크의 이미지, 오른쪽은 스테이블 디퓨전으로 생성한 이미지. getty image 워터마크가 뭉개진 상태로 생성되었다. 게티이미지가 증거로 제출한 사진 ]
위 이미지는 재판 증거이면서 AI의 학습과 생성 원리를 이해하도록 도와주는 증거이기도 하다. 생성 AI는 수학적 추측을 활용해 학습하고 그럴듯한 결괏값을 만들어 낸다. 언어적으로 말하면 '라면을' 다음에는 '먹었다', '먹겠다' 등 먹는 것과 관련된 동사가 올 확률이 매우 높다는 것을 다양한 언어 데이터를 통해 학습하는 것이다. 데이터 중에 '라면을 죽인다'와 같은 문장이 있었다 해도, 생성을 통해 그것이 만들어질 확률은 매우 낮다. 텍스트 생성 AI는 대규모 데이터셋에서 이와 같은 시퀀스 데이터의 패턴을 통계적으로 학습한다. 확률적인 가중치를 학습하며 관련된 매개변수(파라미터)를 조정하여 '토큰'(단어 등의 수학적 단위)을 이어붙여 그럴듯한 문장을 생성하는 것이다(10). 테드 창이 AI를 ‘응용 통계’라고 불러야 맞다고 하고, 팀닛 게브루가 ‘확률적 앵무새’라고 불러버렸던 건 이런 원리 때문이다. 이미지 생성 AI도 확률과 통계를 기반으로 학습하고 생성한다는 점에서 크게 다르지 않다.
그림 4의 오른쪽 뭉개진 getty image 워터마크는 그런 원리로 생성되었다. 학습 데이터 속에서 특정 픽셀값들의 조합이 특정 횟수 이상 반복되면서 그것은 하나의 세트로 특정 형태로 학습되었을 것이다. “라면을” 다음에 높은 확률로 “먹는다”가 나온다는 것이 학습되면, 생성할 때도 ‘라면’ 뒤에는 ‘먹는다’를 세트로 붙이게 될 확률이 높듯이, 1200만 개에 달하는 게티이미지 소스 중 워터마크가 있는 채로 학습 데이터에 포함된 많은 이미지들이 학습 중에 여러 차례 중복 학습되었기 때문에 그것들은 연결된 하나의 기호적 표현을 이루는 조합일 확률이 높다고 판별되었을 것이고 그 결과 특정 형태로 출력된 것이다. 비슷한 예로, 학습 데이터와 텍스트의 쌍이 출력값에 영향을 미치기도 한다. 그래서 프롬프트에 getty image를 넣으면 그림5와 같은 출력이 나오기도 한다. 학습 데이터가 출력값에 지속적인 확률적 영향을 미치는 예다.
이처럼 게티이미지에서 서비스하는 이미지가 학습 데이터로 무단 사용되었다는 것이 명백하며, 또한 게티이미지에서 AI 학습에 대한 거부를 사이트상 약관에 명시해 두었다는 점을 소장에 명시하는 등 여러 합당한 사실관계와 근거가 있기 때문에 게티이미지 측의 권리 주장은 상당히 강력해 보인다(11). 그렇기에 이 소송에 이어서 5월에는 영국에서 스테이블 디퓨전의 판매를 막는 소송을 추가로 제기하며, 게티이미지는 승소에 대한 자신감을 내비치고 있다.
[ 그림 5, 스테이블 디퓨전 모델 1.4에 프롬프트로 getty image를 넣으면 getty image 워터 마크가 붙어나오기도 한다.(프롬프터: 조익상 ]
4. AI 관련 법 제정 흐름과 남은 문제
스테이블 디퓨전 외에도 많은 AI 관련 기업들이 소송을 당하고 있고 이는 근년 동안 마이크로소프트 등 많은 회사들이 AI윤리 담당 부서를 감축해서라도 AI 모델 출시 속도전에 뛰어든(12) 것과 무관하지 않다. 반면, 어도비와 같은 기업은 AI 윤리와 책임을 강조하며, 자사 AI 툴 파이어플라이 사용으로 인한 소송이 일어나면 어도비가 책임지겠다는 선언을 하기도 했다(13). 여러 소송과 어도비의 사례와 같은 예방적 움직임은 생성 AI의 저작권 문제가 더 섬세하게 다뤄질 필요가 있다는 것을 방증한다.
소송 외에도 예술가들 및 AI의 저작권 침해에 우려하고 있는 사람들은 여러 방식으로 대응하고 있다. 네덜란드 출신 예술가 에바 토어넌트(Eva Toorenent)는 다른 예술가 5명과 함께 ‘유럽 AI 규제 조합 European Guild of Artificial Intelligence Regulation’을 설립했다. "우리의 목표는 약탈적인 AI 기업으로부터 저작권 소유자와 아티스트를 보호하기 위한 법과 규제를 만드는 것입니다(14)." 한국에서도 정보인권 단체들을 중심으로 제정 추진 중인 AI 관련법의 ‘선허용·후규제 원칙’에 이의를 제기하는 목소리가 나온 바 있다(15).
국가들도 법령을 손보는 등 균형 잡힌 AI 시대를 대비하고 있다. 유럽의회(MEP)의 AI 법안은 저작권 있는 자료를 AI가 사용하는 것을 금지하고, AI가 생성한 콘텐츠에 저작권 라벨, 곧 원천 콘텐츠의 출처를 밝히는 조치를 취하도록 했다(16). 이어서 아직 법령으로 명문화되지는 않았지만, 미국 백악관에서 구글, 오픈AI, 마이크로소프트, 메타 등 7개 AI 선도 기업에 AI 생성 결과물에 워터마크를 삽입하는 등의 안전조치를 권고하기도 했다. 국가에 따라 다른 방향을 취하는 곳도 있지만, 자국 AI 산업의 발전을 꾀하는 것과 기존 산업 및 예술 분야의 권리를 지키는 것 사이에서 고민하며 절충점을 찾아가려는 흐름은 대부분의 나라에서 발견된다. 저작권법으로 좁힌다면, 저작권 자료의 학습에 있어서의 이용 허락 문제와 허락 시의 보상, 생성 AI 결과물이 시장에 풀릴 경우 인간의 저작물과 경쟁하게 되는 경우에 대한 보호 등이 주요 논의 대상이다.
지금까지 AI기업에 제기된 소송을 중심으로 AI의 저작권 침해가 상당히 우려할만한 문제이며, 실제로 많은 토론과 분쟁이 일어나고 있음을 확인했다. 이 글에서는 생성 AI의 등장으로 인해 부정적 영향을 입은 예술가들과 기존 기업의 입장을 주로 다뤘다. 이어지는 글에서는 생성 AI를 적극적으로 이용하려 하는 쪽 – AI 활용 기업과 ‘AI 크리에이터’ 등 - 의 반론과 활동을 다룰 예정이다.
< 참고자료 및 출처 >
(1) 추현우, <美 저작권청 "AI가 만든 만화, 저작권 인정 불가">, 디지털투데이, 2023.02.24https://www.digitaltoday.co.kr/news/articleView.html?idxno=470860
(2) 사라 앤더슨, , The New York TImes, 2022.12.31. https://www.nytimes.com/2022/12/31/opinion/sarah-andersen-how-algorithim-took-my-work.html
(3) https://www.courtlistener.com/docket/66732129/andersen-v-stability-ai-ltd/ 소송 기록을 열람할 수 있다.
(4) https://www.theverge.com/2023/1/16/23557098/generative-ai-art-copyright-legal-lawsuit-stable-diffusion-midjourney-deviantart
(5) https://stablediffusionlitigation.com/ 이 사이트는 소송과 관련한 기술적 쟁점을 잘 담고 있다.
(6) Case 3:23-cv-00201 Document 1의 30~32쪽에 기술된 총 16개 항목을 추린 것. https://storage.courtlistener.com/recap/gov.uscourts.cand.407208/gov.uscourts.cand.407208.1.0.pdf
(7) Luke Plunkett, , Fastcompany, 2023.8.10. https://www.fastcompany.com/90935637/the-future-of-art-is-in-ais-hands
(8) 차주경, <게티이미지, 인공지능 사진 생성 도구에 ‘2,268조 원’ 소송 제기, >, IT동아, 2023.2.9. https://it.donga.com/103435/
(9) https://laion.ai/projects/ 위키백과나 서적 표지 등 광범위의 이미지를 인터넷에서 긁어모은 약 58억 점의 이미지-텍스트 라벨 쌍을 포함하는 AI 훈련용 데이터셋.
(10) 더 상세하고 친절한 설명은 다음을 참고하시오. 원종우, <알아야 뭘 하지: 인공지능, 어떻게 돌아가는가?>, 만화규장각, 2023.5.25. https://www.kmas.or.kr/webzine/cover/2023050049
(11) 이광욱, 이근우, 권은구, <그림 생성 초거대 AI 모델에 대한 법적 이슈>, 법률신문, 2023.3.3. https://www.lawtimes.co.kr/news/185810
(12) 강현주, <생성형 AI 기술은 트랜스젠더의 오래된 농담을 이해할 수 있을 것인가?>, 문화/과학 114호, 2023, 6. 151~2쪽.
(13) https://www.adobe.com/kr/about-adobe/aiethics.html 해당 링크를 비롯 홈페이지에서 AI 윤리 관련 내용과 어도비가 보장하는 책임의 범위를 확인할 수 있다.
(14) Suzanne Bearne, , BBC, 2023.8.1. https://www.bbc.com/news/business-66231268
(15) 노지민, <정보인권 단체들 “국회, AI법 입장 명확히 밝히라”>, 미디어오늘, 2023.3.19
(16) 이재민, <유럽 의회가 인공지능법 초안을 통과시켰다. 물론, 시행까진 최소 2년이 걸린다.>, 웹툰인사이트, 2023.6.21. https://webins.co.kr/F/A/9203?fbclid=IwAR3sQj1HWD4KzRyBO6nD4H_lTVO2-1_dAVXE2UksWyRRmiIbriLJjQ8SIk4
(17) 이재민, <백악관과 헐리웃을 오가는 인공지능 이야기>, 웹툰인사이트, 2023.7.28. https://www.webtooninsight.co.kr/Forum/Content/9256