裁判で議論を起こす

「AIって、もともとはぼくらの情報なんだぜ」
 しばらく前にこのブログでこう書きました(6月13日)。
 最先端のAIといえども、その力の源泉はぼくら一人ひとりがネットに出している情報だという意味です。このブログのように、ぼくらが作ったテキストや写真、動画などすべてをネット上のデータとして取り込み、巨大なデータ集合を「活用」することでAIは機能する。
 だからAIって、もとはぼくらなんだ。
 それ、勝手に使うなよ。

 でもAIの側にしてみればいいたいでしょう。だから何なんだよ。
 文句あるなら、いってみろ。
 そんなこといわれてもなあととまどっていたら、キッチリ文句をいう人が現れました。AIはぼくらのデータを勝手に使っている、だから著作権法違反だと裁判を起こしたのです(ChatGPT maker OpenAI faces a lawsuit over how it used people’s data. June 28, 2023. The Washington Post)。

 カリフォルニア州の連邦地方裁判所に訴訟を起こしたのは、ライアン・クラークソン弁護士らです。原告には相当数の一般市民が名を連ねました。彼らはチャットGPTのようなAIが、自分たちのデータを集めて「巨大言語モデル」を作っているといいます。AIは詩を書くことも複雑な会話をすることも、プロレベルの資格試験に合格することもできるが、その“原資”となった自分たちのデータは断りなく無償で使われている、これは著作権法違反だというわけです。裁判所がAIによる市民のデータ利用に一定の歯止めをかけ、補償への筋道をつけることを期待している。

 AIと著作権というのはまったく新しい争点で、議論がどこに向かうかはわかりません。AIの側も、どんなデータをどう収集し使っているかは公開していないからちょっとはうしろめたい。厳密にいえば著作権違反のようだけれど、でも実際問題として違反といい切るのもむずかしい。人は言語を覚えるとき、たくさんの人と会話しながら覚えていくわけで、AIがおなじような過程を再生しているといってそれを違法とはいいにくい。
 そうなるとこれは、言語習得とは何か、自然言語に著作権の枠ははめられるのか、そもそも著作権って何かと、かぎりなく議論が広がります。

 全体を俯瞰することはできない。でもひとついえるのは、この裁判によってAIをめぐる本格的な議論がはじまるだろうということです。アメリカの集団訴訟と、いまヨーロッパでEUが進めている規制法の二つによって、AIの当面のあり方が決まる。日本はその後をついていけばいいということでしょう。
(2023年6月30日)