生成AI(人工知能)は、今や日常生活やビジネスの多くの面で活躍しています。特にRAG(Retrieval Augmented Generation)という技術によって大量の社内データ、専門知識を持ったAIを手軽につくれるようになってきました。あまりに実用的なのですぐに商用利用したいと思う方も多いと思いますが、一度立ち止まってみてください。提供するサービスは著作権の問題はクリアできているでしょうか?
この記事では、技術や法律の初心者の方にも分かりやすく生成AIの基本から、著作権との関係、そして活用する際のベストプラクティスについて解説します。
生成AIとは何か?
生成AIとは、人工知能が新しいコンテンツを「生成」する技術のことです。例えば、文章、画像、音楽などをAIが自ら創り出すことができるのです。これはデータを学習し、そのデータに基づいて新しいデータを生み出す能力によって実現されています。AIがニュース記事を書いたり、絵画を描いたりすることも可能です。応用分野は広く、マーケティング、エンターテインメント、研究開発など多岐にわたります。たとえば、AIが過去の有名な画家のスタイルを学習して新しい絵画を生成したり、音楽プロデューサーが使う楽曲作成のアシスタントとして機能したりすることがあります。これらの技術は、創造的なプロセスを助け、新しいアイデアの発見につながることが期待されています。
RAG(Retrieval Augmented Generation)とは何か?
RAGは、生成AIの一種で、「検索強化生成」とも呼ばれます。これは、生成する際に特定の情報を検索し、その情報を基にコンテンツを生成する技術です。例えば、特定のトピックについての文章を生成する際に、関連する情報をデータベースから検索して、それを参考に文章を生成します。これにより、より正確で豊かなコンテンツが生み出されるのです。たとえば、ある歴史的事件に関する詳細な記事を書くために、RAGを使用すると、AIは関連する事実や日付、人物をデータベースから引き出して、事実に基づいた説得力のある記事を生成することができます。
生成AIと著作権の関係性について
生成AIによって作られたコンテンツと著作権の関係は、非常に複雑です。AIが生成した作品は、現在のところ、多くの国で著作権の保護を受けることはできません。しかし、AIが人間の作品を参考にして生成した場合、その元の作品の著作権を侵害する可能性があります。このため、AIを使用する際には著作権に注意する必要があります。たとえば、AIが有名な小説家の作風を模倣して物語を生成した場合、その小説家の著作権を侵害している可能性があり、法的な問題が生じることがあります。したがって、AIによるコンテンツ生成においては、著作権法の範囲内で行動することが重要です。
RAGを使う際はどう捉えられるのか
Retrieval Augmented Generation(RAG)の使用に際して著作権の問題に引っかかるかどうかは、主に「入力対象著作物の表現上の本質的な特徴が感じ取れるか」によります。著作権法第30条の4は非享受目的の利用に関する権利制限を定めており、入力対象著作物の享受目的がある場合はこの規定の適用がされません。ここでいう「表現上の本質的な特徴」とは、その著作物の独特な表現やスタイルなどを指します。
RAGでは、主に「事実」「ノウハウ」「アイデア」「知識」などの情報を利用することが目的で、入力対象著作物の「表現上の本質的な特徴」を含む回答を生成することは通常想定されていません。また、著作物のデータベース化やLLM内の処理により、その特徴が失われることが多いです。
ただし、LLMによる回答に入力対象著作物の表現上の本質的特徴が含まれている場合は、著作権侵害に該当する可能性があります。この場合、対象著作物の入力行為やAI生成物の生成、利用(社内共有や配信等)が問題になるでしょう。
したがって、RAGの適法性と違法性の境界は、「LLMによる回答に入力対象著作物の表現上の本質的特徴が含まれているか否か」になります。
こちらの資料は文化庁による詳細な説明です。RAGについても言及していますので、より掘り下げて理解されたい場合はぜひ参考にしてください。
簡単に言えば人間と同じで、まるまるコピーはNGということ
上記が正しい認識ですが、もう少し砕けた認識をするならば、通常通り明らかなコピーはだめですよ、ということです。これは人間と同じですね。日本は他の国に比べると生成AI周りの著作権については寛容で、特に学習の時点に関しては特に法的な咎めはありません。
気をつけるべきはアウトプットの際に、引用元をまるまるコピーしていないかということです。これは生成AIにダブルチェックするようにしてもいいですし(その分時間とコストがかかりますが)人間が行っても良いです。
生成AIを活用するためのベストプラクティス
生成AIを効果的に活用するためには、いくつかのベストプラクティスがあります。
まず、著作権の観点も含めてプロンプトで指示をして問題がないように出力させましょう。特にまるまるコピーにならないよう何回もプロンプトのテストを繰り返す必要があります。出力として引用元のPDFドキュメントなどを表示するような際は一層著作権の侵害にならないように気をつけましょう。
また、生成されたコンテンツの品質を確認し、必要に応じて人間が編集することも大切です。さらに、著作権に配慮し、必要であれば許諾を得ることも忘れてはなりません。例えば、ブログ記事を生成するためにAIを使用する場合、その記事がオリジナルであることを確認し、情報の出典が明確であることを保証する必要があります。
同じく、AIによって生成された画像を商業的に利用する場合は、その画像が他人の著作物を侵害していないか、または必要なライセンスを取得しているかを確認することが重要です。不安な場合はAdobe Fireflyなどの著作権フリーの出力がデフォルトになっているようなツールを使うのが良いでしょう。
まとめ
生成AIが活躍し、あらゆる分野で人間を凌駕するパフォーマンスを発揮しています。しかし、その学習元は他の誰かのコンテンツである場合が大半です。特にRAGを使う場合はオリジナルのコンテンツが良くも悪くも近くにあります(良い、というのはそれだけハルシネーションが起きづらいという意味です。悪いのはその元コンテンツをまるまるコピーしてしまうリスクがあるということです。
著作権の世界はまさに大きな変化の必要性に晒されており、必ずしも生成AIの現状にあったものではありません。しかし、そういう時だからこそ現在の法がどのような論理に基づいて作られているのかを理解し、足元を掬われずに実用に落とし込んでいくことが重要だと思います。
*この記事は生成AIによって半自動的に生成しています。
大好評!「マーケティングのための生成AI活用大全」のダウンロードはこちらから
弊社ではChatbotの開発や生成AIを活用した記事作成なども行っています。弊社の具体的な事例もありますのでご興味がある方はこちらからご覧ください。
また生成AI活用のイメージが湧かない、課題感はあるが言語化できていないという方はお気軽にこちらからお問合せください。