생성형 AI의 저작권 침해 논란: 학습 데이터의 공정이용인가, 도둑질인가?

“내 그림을 훔쳐서 훈련시켰다” vs “공정한 학습이다”

2026년 현재, AI 기술 발전의 발목을 잡고 있는 가장 큰 리스크는 ‘기술력’이 아닌 ‘법적 분쟁’입니다. 뉴욕타임스(NYT)가 오픈AI를 고소하고, 할리우드 작가들이 파업을 했던 핵심 이유는 바로 ‘데이터의 주권’ 때문이었습니다.

생성형 AI는 인터넷상의 방대한 데이터를 학습(Training)하여 결과물을 만듭니다. 이 과정에서 원작자의 동의 없이 사용된 데이터를 과연 ‘공정이용(Fair Use)’으로 볼 수 있을까요? 이번 글에서는 AI 시대를 관통하는 저작권 딜레마를 분석합니다.

입력(Input) 단계의 문제: AI가 학습을 위해 원본 데이터를 크롤링하고 데이터베이스화하는 과정 자체가 저작권 침해라는 주장입니다. (저작권자 측)
변형적 이용(Transformative Use): 원본을 그대로 베끼는 것이 아니라, 데이터의 패턴을 학습하여 완전히 새로운 창작물을 만들기 때문에 인간이 공부하는 것과 다를 바 없다는 주장입니다. (AI 기업 측)

내가 프롬프트를 입력해서 미드저니(Midjourney)로 그림을 그렸다면, 그 그림의 주인은 나일까요? 현재 미국 저작권청(USCO)과 한국 법원의 입장은 ‘아니오’에 가깝습니다.

판단 기준	현재 법적 해석
인간의 개입	단순한 프롬프트 입력은 ‘아이디어 제공’일 뿐, ‘창작적 표현’으로 보지 않습니다. 인간의 리터칭(수정)이 많이 들어간 경우에만 부분적으로 인정합니다.
등록 가능 여부	AI가 100% 생성한 결과물은 저작물로 등록이 불가능합니다. (공공의 영역으로 간주)

콘텐츠 크리에이터인 우리도 AI를 도구로 활용하되, 이것이 보조적인 수단인지 주된 창작인지 명확히 구분하는 윤리적 감각이 필요한 시점입니다.