コロナウイルスに関するデータセットをメモを残しておきます。
COVID-19 Open Research Dataset (CORD-19)
Allen Institute for AI がデータセットを公開してくれていました。
COVID-19 Open Research Dataset
Allen Institute for AI(AI2)は、AI 研究を様々な分野に貢献させること目指した組織のようです。
Microsoft の方等が設立したようです。
AI2 が提供してくれているコロナウイルスに関するデータセットは
COVID-19, SARS-CoV-2 等のコロナに関する 13000 以上のフルテキストを含めた、29000 の学術的な記事のデータセットです。
実は Kaggle でこのデータセットに関するのコンペが開催されており、もしかしたらそちらデータはダウンロードしたほうが
分析しやすい形になっているかもしれません。
(未確認です)
ちなみにコンペのリンクは
COVID-19 Open Research Dataset Challenge (CORD-19)
【github】2019 Novel Coronavirus COVID-19 (2019-nCoV) Data Repository by Johns Hopkins CSSE
GitHubにコロナウイルスに関するデータについてのまとめがありました。
https://github.com/CSSEGISandData/COVID-19
このリポジトリにはcsvデータもあります。
また、感染者数ビジュアライズしたアプリもあります。
※執筆中