A 社内利用のみという前提であれば以下の点が指摘できます。第三者への提供を検討されている場合には、オプトアウトの手続きや匿名加工の処理等を検討する必要がありますので個別にご相談ください。
著作権法30条の4は、情報解析(2号)のために必要な範囲で著作物を利用することができる旨を定めます。したがって、著作物をウエブサイト等からダウンロードしてディープラーニングの学習用データとして利用することが可能です。また、これによって作成されたものについては、それが元の著作物の創作的表現が残らない形であれば、新たに作成したものに、元の著作物の著作権は及びません。もっとも、著作権法30条の4は、「当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りではない」として、著作物の利用を禁じておりますので、具体的な利用方法等についてはご相談ください。
なお、個人情報保護法については、著作権法30条の4に相当する規定がないため、個人情報保護法の規制に服することとなることについてご留意ください。具体的には、個人情報の取得にあたっては、その利用目的の公表又は通知が必要です(個人情報保護法21条1項)。また、利用目的の達成に必要な範囲を超えてはなりません(個人情報保護法18条1項)。また、個人データの管理にあたっては、その漏洩、滅失、棄損の防止その他の個人データの安全管理のために必要かつ適切な措置(安全管理措置)を講じなければなりません(個人情報保護法23条)。講ずべき安全管理措置の内容については、「個人情報保護法ガイドライン(通則編)」に詳述してあります。なお、要配慮個人情報(人種、信条、社会的身分、病歴、反税の経歴等)については、取得に原則として本人の同意が必要です(個人情報保護法20条2項)。
また、データの収集にあたっては、第三者の営業秘密(不正競争防止法2条6項)や限定提供データ(不正競争防止法2条7項)について、窃取、詐欺、脅迫その他の不正の手段が介在して取得したものを利用しないよう注意が必要といえます。特に、有料の新聞記事や会員限定のコンテンツ等は、個別の契約内容にもよると思われますが、当該購入者や有料会員に提供を限った限定提供データに該当するものが相当程度あると思われます。限定提供データに該当する場合には、購入者や当該会員以外の者が利用することは不正競争防止法2条1項11号違反に該当する可能性があります。相当量蓄積性等において争う余地があるコンテンツもあると思われますが、個別の契約において有料会員等のみの利用に限定している場合が多いと思いますので、契約違反になる可能性は否定しがたいと考えられます。

