オープンデータ取得方法の法的評価:スクレイピング行為、利用規約違反、著作権侵害リスクを弁護士が解説
はじめに
行政機関や民間企業によるオープンデータの公開が進む中、その利用形態は多様化しています。特に、プログラムを用いてウェブサイト等から自動的にデータを収集するスクレイピング(Web scraping)は、大量かつ継続的にデータを得る手段として広く用いられています。しかし、オープンデータであるからといって、その取得行為が常に法的に問題なく行えるわけではありません。データ提供元の利用規約や、既存の法規制との関係において、様々な法的リスクや倫理的な課題が存在します。
弁護士の皆様が、クライアントからのデータ取得に関する相談に対応する際、これらのリスクを正確に把握し、適切な助言を行うことは不可欠です。本稿では、オープンデータの取得方法、特にスクレイピング行為に焦点を当て、関連する法的評価および倫理的留意点について解説いたします。
オープンデータ取得における法的論点
オープンデータの取得方法としては、提供者が公開するAPIを利用する方法、CSVやJSONなどのファイル形式でダウンロードする方法、そしてウェブサイト上の情報をスクレイピングする方法などがあります。ここでは、特に法的リスクが顕在化しやすいスクレイピングに焦点を当てて法的論点を整理します。
1. 不正アクセス禁止法との関係
オープンデータは通常、IDやパスワードによる認証を必要とせず、公開されている情報へのアクセスを前提としています。したがって、一般的に公開されているウェブサイト上のオープンデータをスクレイピングする行為は、それ自体が直ちに不正アクセス行為の禁止等に関する法律(不正アクセス禁止法)に抵触する可能性は低いと考えられます。
しかし、以下のようなケースでは、他の法律と併せて問題となる可能性があります。
- セキュリティ脆弱性の悪用: スクレイピングの過程で、意図的であるか否かに関わらず、提供システム側のセキュリティ上の脆弱性を突くようなアクセスを行った場合、不正アクセス行為とみなされる可能性があります。
- 過剰な負荷: 短時間に大量のアクセスを行い、提供者のサーバーに過剰な負荷を与え、サービス提供を妨害するような行為は、威力業務妨害罪等に問われる可能性があります。
2. 著作権法との関係
オープンデータとして公開されている情報自体が、著作権法による保護の対象となるか否かは、データの性質によります。単なる事実データ(例:気温、統計数値)は著作権の対象とはなりませんが、それらを編集・体系化したデータベースが「データベースの著作物」として保護される場合があります(著作権法第12条の2)。また、ウェブサイトのデザインや記事等の表現形式は著作物となり得ます。
スクレイピング行為が著作権侵害となるか否かは、以下の点が論点となります。
- 複製権侵害: スクレイピングによりデータを取得し、自らのストレージ等に保存する行為は「複製」(同法第2条第1項第15号)にあたります。データベースの著作物やウェブサイト上の表現形式を複製した場合、著作権侵害となる可能性があります。ただし、情報解析(ビッグデータ解析を含む)のために、著作物に表現された思想又は感情若しくは事実の分析等を行うことを目的とする場合における複製等については、一定の要件のもとで著作権者の許諾なく行うことができるとされています(同法第47条の7)。オープンデータを用いた情報解析を目的とするスクレイピングは、この規定により適法化される可能性が高いと考えられます。しかし、この規定は「情報解析」目的を限定しており、例えば単に競合サイトのコンテンツを複製して自社サイトに転載するような場合は適用されません。
- 公衆送信権侵害: 取得したデータを、ウェブサイト等を通じて一般に公開した場合、公衆送信権(同法第23条第1項)を侵害する可能性があります。特に、データベースの著作物の内容を複製して公開する場合などが該当します。
- 引用の要件: 取得した情報の一部を利用する場合、著作権法上の「引用」の要件(公正な慣行に合致し、引用の目的上正当な範囲内であること、引用部分とそれ以外の部分が明確に区別できること、引用元を明記すること)を満たせば適法となります(同法第32条)。しかし、スクレイピングで大量に取得したデータをそのまま利用することは、引用の範囲を超える場合がほとんどです。
オープンデータのライセンス(例:クリエイティブ・コモンズ・ライセンスなど)が付与されている場合、そのライセンス条件の範囲内での複製や公衆送信は著作権者の許諾があるとみなされ、著作権侵害とはなりません。しかし、ライセンス条件(帰属表示の要請など)を遵守しない場合は、ライセンス違反となり、同時に著作権侵害となる可能性があります。
3. 利用規約(Terms of Service)との関係
多くのウェブサイトでは、データの利用に関する利用規約が定められています。オープンデータとして公開されている場合であっても、利用規約においてスクレイピング行為や取得したデータの利用方法について制限を設けている場合があります。
- スクレイピングの禁止・制限: 利用規約でスクレイピング行為自体を明示的に禁止している場合、これに反してスクレイピングを行った行為は、契約(利用規約への同意)違反となります。契約違反に対する法的措置(損害賠償請求等)が取られる可能性があります。
- 取得データの利用目的・方法の制限: 利用規約で、取得したデータの利用目的(非営利に限るなど)や利用方法(第三者への再提供の禁止など)が制限されている場合、これに反する利用は契約違反となります。オープンデータライセンスと利用規約が併存する場合、両者の関係性や優劣も確認が必要です。一般的には、利用規約が個別のウェブサイトの利用方法を、ライセンスがデータ自体の利用方法を規律するものとして解釈されることが多いですが、明確に利用規約でライセンス条件の上乗せや変更を行っている場合もあります。
利用規約による制限が、利用者に対してどこまで法的拘束力を持つかは、利用規約への同意方法(クリックラップ、ブラウズラップなど)や、規約の内容の合理性等によって判断されます。しかし、特に明示的に同意を求めている利用規約に違反した場合、契約違反責任を問われるリスクは高まります。
4. 個人情報保護法との関係
スクレイピングの対象となるウェブサイトに個人情報が含まれている場合、個人情報保護法との関係が問題となります。
- 個人情報の取得: スクレイピングにより個人情報を取得する場合、「適正な方法によって取得」する必要があり(個人情報保護法第20条)、偽りその他不正の手段により取得してはなりません。単に公開されている情報を機械的に取得する行為が直ちに「不正の手段」に当たるかはケースバイケースですが、個人情報保護法違反のリスクを伴います。
- 利用目的の通知・公表: 個人情報を取得した場合、利用目的を本人に通知または公表する義務が生じます(同法第21条)。
- 安全管理措置: 取得した個人情報の漏洩等を防止するため、必要かつ適切な安全管理措置を講じる義務があります(同法第23条)。
- 匿名加工情報・仮名加工情報: 取得した情報に個人情報が含まれている場合でも、適切に匿名加工情報(同法第43条)または仮名加工情報(同法第35条)に加工すれば、その後の利用・提供に関する規制が緩和される場合があります。しかし、匿名加工情報や仮名加工情報の作成・利用にも、それぞれ個人情報保護法に定められた要件を遵守する必要があります。特に、匿名加工情報を作成する場合には、その情報を第三者に提供する際に公表義務が生じます(同法第46条)。
オープンデータとして公開されている情報であっても、氏名、住所、メールアドレスなどの個人情報、あるいは他の情報と容易に照合することで特定の個人を識別できる情報が含まれていないか、慎重な確認が必要です。
オープンデータ取得における倫理的留意点
法的な問題に加えて、オープンデータの取得には倫理的な側面も存在します。
- 提供者の意図尊重: オープンデータは公共的な目的や情報公開の促進を目的として提供されている場合が多いです。提供者の意図や公開の背景を理解し、それに反するような利用(例:特定の個人や団体への誹謗中傷、違法行為への利用)は倫理的に問題があると考えられます。
- サーバー負荷への配慮: スクレピングは提供者のサーバーに負荷をかける行為です。過剰な負荷は他の正当な利用者へのサービス妨害につながりかねません。適切な頻度と速度でアクセスを行うなど、技術的な配慮が求められます。
- robots.txtの確認: ウェブサイトには、自動クローラーやスクレイピングボットのアクセスを制御するためのrobots.txtファイルが設置されている場合があります。これは法的な義務を課すものではありませんが、サイト管理者からの協力を求める規範として機能します。robots.txtに記載された指示を無視したスクレイピングは、倫理的に問題視される可能性があります。
- 帰属表示の実施: オープンデータライセンスや利用規約で帰属表示が求められている場合は、法的な義務となりますが、義務がない場合でも、データの提供元を明らかにし、その努力に敬意を示すことは倫理的に推奨される行為です。
弁護士が実務で考慮すべき点
弁護士がオープンデータの取得に関する相談を受ける際には、以下の点をクライアントに確認し、適切な助言を行う必要があります。
- 取得対象の特定: どのようなウェブサイト、どのようなデータ(データ形式、内容)を取得しようとしているのか。個人情報は含まれているか。
- 取得方法: API利用か、ファイルダウンロードか、スクレイピングか。スクレイピングの場合、その技術的な実装(アクセス頻度、負荷、使用ツール等)。
- 利用目的: 取得したデータをどのように利用するのか。再配布、派生サービスの開発、内部での情報解析など。営利目的か非営利目的か。
- 提供者の利用規約・ライセンス: 対象となるウェブサイトの利用規約や、公開されているデータに付与されたオープンデータライセンスの有無および内容を徹底的に確認する。スクレイピング禁止条項、利用目的制限条項、帰属表示義務などを確認する。
- robots.txtの確認: robots.txtファイルが存在するか確認し、その指示内容を尊重すべきかを判断する。
- 個人情報のリスク: 取得データに個人情報が含まれる場合、匿名化・仮名加工の可能性や、個人情報保護法上の義務(利用目的通知、安全管理措置等)の履行可能性を検討する。
- 著作権リスク: 取得対象がデータベースの著作物やその他の著作物にあたるか、取得方法や利用目的が著作権法上の例外規定(情報解析目的の複製等)に該当するかを検討する。ライセンス条項の遵守を確認する。
これらの確認を踏まえ、クライアントの具体的な計画が、不正アクセス禁止法、著作権法、個人情報保護法、提供元の利用規約等に抵触するリスクがないか、倫理的に問題がないかを多角的に評価し、必要に応じて代替手段の提案やリスク回避策(利用規約遵守、技術的配慮、匿名化処理等)について助言を行うことが重要です。特に、利用規約違反は契約ベースのリスクであり、法的な違法性とは別に損害賠償請求等の対象となり得るため、その有効性と拘束力について慎重な検討が必要です。
結論
オープンデータは社会の発展に大きく貢献する可能性を秘めていますが、その取得、特にスクレイピング行為においては、既存の法規制や提供元が定める利用規約、さらには倫理的な側面に対する深い理解と適切な配慮が不可欠です。
弁護士は、オープンデータ利用に関するクライアントの相談に対し、不正アクセス禁止法、著作権法、個人情報保護法といった基本的な法律の知識に加え、オープンデータ分野特有のライセンスや利用規約に関する知見を駆使し、法的リスクを正確に評価し、実務に即した実現可能な解決策を提示していく必要があります。本稿で解説した論点が、皆様の実務の一助となれば幸いです。
今後もオープンデータの利用形態や関連技術は進化していくと考えられ、それに伴い新たな法的・倫理的課題も生じる可能性があります。常に最新の法規制、判例、技術動向を注視し、専門家としての知見をアップデートしていくことが求められます。