アーティストの作品でAI訓練 「無断で複製された」米国で集団提訴
対話型AI(人工知能)「ChatGPT(チャットGPT)」など生成AIの開発と利用が急速に進むなか、AIの訓練に使われるデータの著作権をめぐり、アーティストらが提訴に乗り出した。判決次第では、企業のAI開発や、音楽など他の創作活動に関わるデータの扱いにも影響する可能性がある。
文章や画像を作り出す生成AIの普及で著作権が問題になるのは、最新AIを訓練するにあたり、すでにネット上にある画像や文章など膨大なデータを集める必要があるためだ。
米サンフランシスコに住むアーティスト、カーラ・オルティスさんは1月、仲間のアーティスト2人とともに画像生成AI「Stable Diffusion(ステーブルディフュージョン)」を運営する英スタビリティーAI、Midjourney(ミッドジャーニー)などを相手取り、著作権侵害で集団訴訟を起こした。
訴状では、生成AI企業が、AIの訓練に使う許可を得ずに「原告の作品を複製した」と主張。スタビリティーAIは朝日新聞の取材に対し、「係争中なのでコメントしない」と回答。そのうえで、次のバージョンの訓練データから、アーティストが希望すれば作品を除外できる「オプトアウト」の対応を進めているとした。
米写真配信サービス大手のゲッティイメージズも1月、同社の数百万枚の画像を無断で利用したとして、スタビリティーAIを著作権侵害で提訴した。米シカゴ大でコンピューターサイエンスを教えるベン・ジャオ教授は「AIの開発はデータがすべて。どのようにして我々がAIの訓練に使うデータを管理し、データが使われた場合には誰が報酬を得るのかを考えていくことが重要だ」と話す。
対価もなく、勝手に使われたデータ
米サンフランシスコのミッション地区で3月下旬、オルティスさんに話を聞いた。
「道義に反することが起きた」
昨夏、オルティスさんはその頃公開された画像生成AI「Stable Diffusion(ステーブルディフュージョン)」などで、自分の作品に似た多くの画像をみつけた。
これらの生成AIは、LAION(ライオン)と呼ばれる画像データをもとに学習されていた。ドイツの非営利団体が無料で公開するデータで、昨年公開された「LAION―5B」は、ネット上の約58億の画像と文字データが集められている。
学習で使われたデータを調べると、多くの知人の作品も含まれていた。
「とても不安になった。前例のない規模でデータが集められていた」
オルティスさんは、自らが理事を務める芸術家団体の仲間と連絡を取り、カナダのAI専門家に相談。専門家も、アーティストの作品が許可なくAIの学習データに含まれていたことに驚いていたという。
AIが作った画像は、どこまで本物に似るのか。
オルティスさんがスマホの画…
【春トクキャンペーン】有料記事読み放題!スタンダードコースが今なら2カ月間月額100円!詳しくはこちら