BingのAIチャットとChatGPT、それぞれの著作権や出典元の表記義務について調べてみた

Bing AIチャット,ChatGPT レビュー・ほか,ChatGPT

BingのAIチャットとChatGPT、それぞれの著作権や出典元の表記義務について調べてみた

誰でも利用できるAI技術が登場し始めました。
OpenAIのChatGPTが爆発的に話題になり、Microsoft BingにAIチャットが実装されました。

AI技術といっても発展途上で、これらはAIではなくデータベースと文章生成プログラムの域を超えていないという意見も少なくはありませんが、我々は、ひとまず「コンピュータと人のように会話をする」という新しい遊び道具を手に入れた訳です。

AIツールによる著作権侵害訴訟は既にある

しかし、この技術には大きな問題がついてきます。
彼らから得られる情報が真実かどうかはさておき、彼らがトレーニングデータとしている情報元との著作権侵害にて訴えられているケースは複数あります。

既にいくつかのAIモデルに対して、集団訴訟のようなものは発生しており、Microsoft、OpenAIもまたその渦中にあるようです。

情報によれば、Microsoft、OpenAIが抱える訴訟内容は、一部のプログラマー達からコードを無断で出力している事に対して著作権侵害を訴えられている訳です。
これにはGitHubが絡んでいるのですが、Microsoftが買収しているためGitHub=Microsoftという括りで良いでしょう。

当方はGitHubの利用規約を知りませんが、著作権を侵害されたとされるプログラムコードはGitHubに保存していたものだと考えられますので、規約次第といったところでしょうかね。

BingのAIチャットとChatGPT、著作権やコンテンツに関する利用規約の違い

ChatGPTはOpenAIの公式ページにて利用規約としてAIによって生成されたコンテンツの扱いを定義していますが、Microsoft BingはAIチャットが実装される前の古い規約内容のままで更新されていない状態となっています。

今までも違う作者のコンテンツやニュースを引用する時は必ず引用元として、最低でも表記やリンクは必要なのですが、当然AIによる作品や文章も同じように引用元としてコンテンツ内のわかる場所に明記する必要はあるのだろうとは考えます。

特にMicrosoft Bingの返信内容は例えば物語や詩であっても常にといっても良いほど、WEB上の情報を無尽蔵に参照していますので、必ず参照元の明記が必要だとは考えられます。

ここからは、規約やAIチャットの返信内容から、どういった事を守る必要があるのか確認していきます。

BingのAIチャットに確認するも、返答は毎回、違うものが返ってくる

重要な部分ですので、そもそもAIの回答に何の意味もありませんが、利用規約でも明記されていませんので、ならばと、BingのAIチャットに生成されたコンテンツ(AIによる返信)について全く同じ文面で尋ねるも、残念ながら違った方向の答えが返ってきます。

Bing AIによるコンテンツの扱いについての回答1
Bing AIによるコンテンツの扱いについての回答1
Bing AIによるコンテンツの扱いについての回答2
Bing AIによるコンテンツの扱いについての回答2

また、文面を少し変更すると、出典元にBingの明記・リンクが必要だったり、Bingの名前と著作元にBingが参照したWEBサイトの許可を得て明記するように指示されます。
その際に確認してみたところ、それがAIに書かせたストーリーなどであっても、参照しているサイトがある為、許可と出典元は必要とのこと。

BingのAIがどう答えたかを多い順にまとめると

  1. 出典元としてBingの名前を記載して
  2. 著作権の問題によりできない
  3. Bingの明記と参照元サイトの明記
  4. 出典元としてBingの名前とリンク記載して
  5. Bingの明記と参照元サイトの許可と著作元としての明記

こんなところでしょうか。
好きに使ってよいという回答は得られませんでした。

うーん、一番多かった「出典元としてBingの名前を記載して」は明らかにNGなような気がしますね。
だってBingさんも思いっきり参照しまくって権利なんて、ほとんど何もないはずだから・・

少なくとも、公開する記事なり文章に含める場合はBingの名前は、コンテンツの生成元として明記しておく必要がありそうです。

ChatGPTの場合は、普通に自由に使える?AI作の明記は必要か

同問題について何度かChatGPTに確認した事があるのですが、一般論としてAIによる著作権侵害の存在は認めるものの、OpenAIのAIモデルに関しては、そもそもとして許可を得られていない文章もイラストも音楽データはトレーニングデータとして活用していないと毎回言い切ります。

ChatGPTは、この回答にブレる事はなさそうです。(よっぽど、他の例など聞き方を変えればわかりませんが。)

OpenAIのコンテンツ利用規約において以下のように明記されています。

Your Content. You may provide input to the Services (“Input”), and receive output generated and returned by the Services based on the Input (“Output”). Input and Output are collectively “Content.” As between the parties and to the extent permitted by applicable law, you own all Input, and subject to your compliance with these Terms, OpenAI hereby assigns to you all its right, title and interest in and to Output. OpenAI may use Content as necessary to provide and maintain the Services, comply with applicable law, and enforce our policies. You are responsible for Content, including for ensuring that it does not violate any applicable law or these Terms.

和訳:
あなたのコンテンツ。あなたは、サービスに対して入力(「入力」といいます)を提供し、入力に基づいて生成され、サービスから返される出力(「出力」といいます)を受け取ることができます。入力と出力をまとめて「コンテンツ」と呼びます。当事者間および適用法によって許可される範囲で、あなたはすべての入力を所有し、これらの利用規約に従うことが条件となりますが、OpenAIは出力に対するすべての権利、権利、利益をあなたに譲渡します。OpenAIは、サービスを提供し維持するために必要な場合、適用法を遵守し、当社のポリシーを執行するためにコンテンツを使用する場合があります。あなたは、コンテンツに責任を負い、適用法またはこれらの利用規約に違反しないようにすることが含まれます。

Terms of Use | OpenAI

要約するとAIによる出力(ChatGPTでいうところの返信内容)は別記されている利用規約を遵守する場合、すべての権利、権利、利益はユーザーである我々に譲渡されるという事です。

しかし、コンテンツポリシーには以下のことを遵守するよう求められているように、AIに作らせた文章や作品を人間が作ったオリジナルコンテンツのようにふるまって公開する事は禁じられていますので注意が必要です。

Indicate that the content is AI-generated in a way no user could reasonably miss or misunderstand.

和訳:コンテンツが人工知能によって生成されたものであることを、ユーザーが見落とすことがないように明確に表示してください。

Sharing & Publication Policy | OpenAI

出典元の表記義務はないけど、作品の権利を得るには、ChatGPTとは書かずとも最低でもAIによって作成されたモノである事をコンテンツに明記する必要がありますね。

AIそのものや、AIの開発元がどう提示したとしても、トレーニングデータとして利用した情報やイラストなどの元の著作権を侵害している可能性を考える必要がありますが、Bing AIのとは違い、上記したChatGPTの回答と同様に、OpenAIのトレーニングデータは許可を得ていたり、著作権のない古い文章を活用していると、(OpenAIのどこか、SNSかも)どこかに記載がありました。

最初は本当に信じてなくて、絶対、著作権侵害したデータもトレーニングデータに使っていると考えていました。

それを確信に変えようと、例えばイラスト生成AIなんかの生成結果画像を見て著作権侵害を見つけたかったのですが、話題になったディズニーとかのイラストやキャラクターを明らかにベースにしているようなイラストなどは他のAIイラストではあっても、OpenAIのイラスト生成AIが作ったイラストでは全然生成していないぽいんですよね。

本当に許可が取れている範囲内でしかトレーニングデータに活用していないのかも、と。
AIの回答でもWikipediaのデータは活用してると言いつつ、ちゃんとWikipediaに許可を得ています、と。

そう考えると、最新の情報はともかく、古い情報も良く間違っているのは納得いきますね。

確かに、そうでなければ、AIで生成した権利、権利、利益をすべてユーザーに譲渡するなんて、明記できませんよね。

・・いや、プログラムコードについては訴訟起こされていますが・・?
これはGitHub本体の許可は得ているけど、GitHubユーザーの一部が反発した、といったところなのかな。

AIに記事を書かせて稼ぐ方法、はリスクがあってオススメできません

ChatGPTが話題になりましたが、Bingが正確な情報を(ネットから収集して)提供しだして、「AIに記事を書かせて稼ぐ方法」みたいなタイトルのYouTube動画がオススメに乱立してしまいましたけど、どうなのでしょうね。

発信者本人達は相応の技術と問題を回避するアイディアを持っていて大丈夫なのでしょうけど、それを儲かるかもと、鵜吞みにそのまま実践することは、リスクありオススメできません。

少なくとも、Bing AIの記事は危険すぎますよね。あれって、かなりの確率で同じ回答を数多くの人が見ている訳ですし、物語などの創作物でも参照元を参考にし過ぎてる気がします。

しかし、他人の文章を少し弄って、自分の文章として公開していた人たちは元々居たので、その延長なのでしょう。
直接、他人の記事から盗むのではなく、AIを経由するから罪悪感は少なくなったのかもしれません。

少なくとも、AIの生成するコンテンツがオリジナルとなったとしても、それを揚々として言うものではないのではないかと思いますが、やはり世の中、色々な人がいますね。

そんな事をやる人たちが増えると、AIそのものがまた普通の人からは触れない遠い存在に戻されてしまいそうです。

そんな事に活用しなくても、有効な使い道は他にも山ほどあるはずです。

というより、Bing AIを利用して記事を作成するにも、そのままコピペではなく、もう少し良い使い方がありそうな気もします。

AIツールを有効活用するためには、その先の発展を期待するなら、ちゃんと一定のルールやマナーを守って使うべきだと再確認しましたし、しましょう。