Close

人流増減と気象データで新型コロナウィルス新規感染者数を予測 ~深層学習と統計の併用による新規感染者数予測と新規変異株出現時の人流抑制の目安~

News&Topics

  • ホーム
  • News&Topics一覧
  • 人流増減と気象データで新型コロナウィルス新規感染者数を予測 ~深層学習と統計の併用による新規感染者数予測と新規変異株出現時の人流抑制の目安~

カテゴリ:プレスリリース|2021年7月 8日掲載


発表のポイント

〇 深層学習(ディープラーニング)に基づく新規感染者数予測システムの開発と変異株出現時の評価法
〇 新規感染者数(1週間平均)の増減は、深層学習により80%、主要駅における人流だけでも75%(東京は63%)を説明できる
〇 各都府県の過去2週間の人流増減率(6~12日前の1週間平均値)より、実効再生産数をおおよそ推定可能
〇 アルファ変異型ウィルスの実効再生産数は、従来のウィルスに比べて20-30%大きい
〇 デルタ変異型ウィルスの実効再生産数は、従来のウィルスに比べて20-40%大きいと推定
〇 深層学習が変異株に対応するには約4週間を要するものの、新規変異株に対する初期の実効再生産数の人流増減率依存性より、人流抑制の目安を導出可能

概要

 名古屋工業大学の研究グループ(大学院工学研究科電気・機械工学専攻・平田晃正教授(先端医用物理・情報工学研究センター長)、Rashed Essam特任准教授、小寺紗千子特任准教授)は、新型コロナウィルスの感染拡大・収束について、2020年3月から2021年6月末までの都府県ごとの移動データおよび気象データを学習することにより、新規感染者数の予測を行いました。人工知能関連技術の深層学習(ディープラーニング)のうち、時系列データの取り扱いに強みを持つLSTMとよばれる回帰型ニューラルネットワークを適用し、人流の減少幅および気象の時系列データなどを入力し、以降一か月にわたる一日ごとの新規感染者数(1週間平均値)を学習、予測に応用しました。東京都、愛知県、大阪府、兵庫県、京都府、福岡県を対象とし、データを規格化することにより、変異株の影響が大きくない状況であれば、約80%の精度で予測可能となりました。また、アルファ変異型出現後のデータより、新規変異株に十分な予測精度を持たせるためには、約4週間のデータ蓄積が必要であることがわかりました。そのような場合には、潜伏期間を含めた過去1週間の人流増減率の統計値により、実効再生産数を概算、目安となる人流増減率も算出可能です。6月30日現在までのデータから、人流変化が同じ条件下では、アルファ株、デルタ株の実効再生産数は、従来に比べて、それぞれ20~30%、20~40%大きいことなどがわかりました。

背景

 現在までに報告されてきた感染症拡大に関する数理モデルでは、一般に、人流、温湿度、人口密度などとの関連性が考慮されていない、あるいはその中で用いられるパラメータの設定が必要となります。新型コロナウィルスに関し、名古屋工業大学の研究グループでは、これまで上記要因の影響を考慮した統計処理および予測式の構築を行ってきました[1]。
 その後、人口の移動データ[2, 3]や人口移動データによる新規感染者数予測データ[4]が公開されるようになりました。Googleによる新規感染者数予測モデルは、「SEIRモデル」という数理モデルに基づき、その中で用いるパラメータは機械学習によって推定されます。本研究グループでは、これまでの知見で統計的に優位なパラメータであった人口移動と気象データの時系列データを入力値とし、深層学習(ディープラーニング)することにより新規感染者数の7日間平均値(当日±3日)の直接予測を試み、2週間先までの新規感染者数の平均値を80%程度の予測精度で実現しました[5](中日新聞2020年12月12日1面)。この背景には、緊急事態宣言、まん延防止等重点措置などの時期による実効性だけでなく、人の動きも日々異なるがゆえ、その影響を柔軟に考慮する必要性に伴うものです。
 我が国においても、新型コロナウィルス変異株のうち、2020年12月よりアルファ変異株(イギリス株)、2021年3月よりデルタ変異株(インド株)が報告され、従来株に比べて感染力が強いと報告されるなど高い関心が寄せられています。一方、2021年2月17日から、ワクチンの接種が始まり、その接種率、有効性に注目が集まっています。イギリス、イスラエルなどでは接種率が高いにもかかわらず、デルタ株の感染が拡大するなど、これらを統合的に評価する技術の開発とその適用が求められています。

分析結果

 名古屋工業大学の研究グループは、深層学習により、新型コロナウィルスの新規感染者数予測モデルを構築してきました[5, 6]。入力パラメータとして、人流増減率、気象データ(日最高/最低気温、平均湿度)、平日/休日、政府および各行政区における緊急事態宣言の有無を使用しました。
 はじめに、予測のための最適な入力パラメータについて調査しました。2021年4月11日~5月22日を対象として学習、5月23日~6月22日までの新規感染者数の7日間平均を推定、予測精度を比較した結果を表1に示します。表より、すべての入力データを用いた場合、推定精度が最も高く、気象データを考慮しない場合よりも予測精度が6都府県の平均をした場合2%程度高いことがわかります。また、気象データの影響が小さい要因としては、比較的短い期間の予測のため気象の変化が少ないこと、さらに今回対象とした地域は主に都市部のため、人口密度が高くソーシャルディスタンスの影響が強くあらわれたことなどが考えられます[1]また、人流増減率についても、県庁所在地における中心駅の移動を考慮した場合には平均6%の減少となりますが、東京では20.9%の減少となります。また、移動情報を考慮しない場合には10.4%の減少(東京を除けば、約75%の予測精度)となることがわかります。

表1 各入力値に対する新規感染者の7日間平均値の予測精度の比較。①全データ入力、②気象データのみ入力しない、③主要駅の移動のみ、④人流情報なし。感染拡大、収束期間と人口密度(左)、日絶対湿度との関係(一例)(右)

Table1.png
 感染者数への新規変異株の影響を考察するため、アルファ変異株の影響がみられた第四波における結果を図1に示します。図より、アルファ変異株の感染者が多かった関西地方で、深層学習による予測値と報告値の間に相違がみられます。一方、変異株の影響が比較的少なかった東京では予測範囲内で推移していたことも確認できます。

Fig.1.jpg

図1 各県における新規感染者数(当日を中心とした1週間平均値)の報告値と予測値の比較

Fig.2.jpg

図2 人流増減率と実効再生産数の相関。第3波までを従来株として比較。人流増減率は、主要駅におけるもの。

 アルファ変異株の影響が大きかった大阪府、兵庫県に加えて、影響の少なかった東京都に着目し、主要駅における人流増減率と実効再生産数(報告値)の関係性について示します(図2)。人流増減率は、潜伏期間を考慮して6日前を起点として7日間遡った平均値(6~12日前の期間の平均値)[7]として定義しました。図より、大阪府では一次関数で近似した場合、決定係数(R2)は0.6,0.74と高い相関を確認しました。兵庫県における決定係数は0.35でした。この相違の要因としては、鉄道の利用者の割合、両府県の拡大地域の面積などが考えられます。同じ人流増減率であると仮定した場合、大阪府、兵庫県におけるアルファ変異型ウィルスの実効再生産数は、従来のウィルスに比べて20-30%大きくなることがわかります。両府県とも、第3波よりアルファ変異株が出現した第4波のほうが、実効再生産数を1以下に抑えるためには、強い人流抑制が必要であると示唆されます(大阪:第3波 -26%⇒第4波 -31%、兵庫:第3波 -22%⇒第4波 -33%)。また、変異株の影響の少なかった東京では、必要な人流抑制は第3波と同程度あるいはそれ以下であるということもわかりました。
 また、図2に大阪におけるアルファ株出現期(2021年3月10日~4月14日、1週間ごと:図中□)のアルファ株のみの、東京におけるデルタ株の出現期(2021年5月26日~6月30日:図中△)のデルタ株実効再生産数の概算値を示しています。図より、新規変異株が出現して拡散する時期の実効再生産数は高いものの、時系列的には減少します。さらに、6月30日までに得られたデータより、従来株に比べて20%~40%、アルファ株と同程度あるいはやや高めであることが確認できます。このことより、駅における人口増減率を東京では-40%~-45%、大阪では-35%程度(7月1日現在)とすれば、実効再生産数を1以下に保てることが予測されます。ただし、これは学習データのように大きな人流の変化がないと仮定した場合であり、大規模イベント、長期休暇などに伴う人流の変化によりその傾向が異なる可能性があります。図1においても、4月1から4月14日にかけての値は通常よりも大きく、年度末の人流と考えられます。ここでは示しませんが、年末の休暇に伴う人の動き、検査数の変化などのばらつきにより、高い実効再生産数を示した事例もあることがわかっています。

Fig.3.jpg

図3 変異株を学習するまで(イメージ図)

 

Fig.4.jpg

図4 東京における7月、8月の新規感染者数(1週間平均値)の予測シミュレーション。
気象は昨年と同程度であると仮定。

 図3に示すように、深層学習が変異株に対応するには約4週間を要しました。これは、図2で示した実効再生産数の相違によるものであり、その人流増減率との関係を、過去の傾向を比較することで、実効再生産数1以下にするのに必要な人流減少率の目安を都道府県別に導出することが可能となります。
 図4に、例として、現在の人流と連続性を保ち、かつ2020年の人流を仮定した場合の、東京における7月及び8月の新規感染者数(1週間平均値)の予測シミュレーションを示します。気象は、2020年と同等と仮定しました。図2に基づきデルタ株出現後の実効再生産数を等価的に考慮した場合、ワクチンの影響を概算に基づき考慮した場合、さらに7月22日以降人流が5%増えると仮定した場合の値について示します。7月22日以降の人流は、大型イベントなどが開催される場合、年末年始あるいは年度末などと同様、付加的な要素が考えられます。なお、ワクチンの影響はイスラエル、マルタにおける報告値に基づき、有効性が確認されるまでの期間を第1回接種から6週間、接種率60%で集団免疫が得られると概算した場合の結果となります(ここでは、人流+5%の場合のみ)。

[1]都府県で規格化しているため、一部の都府県のみには適用できません。

ニューラルネットワークの構成とデータの取り扱い

 予測モデルには、深層学習(ディープラーニング)の分野において用いられる、LSTMとよばれる回帰型ニューラルネットワークを用いました。LSTMは、人工回帰型ニューラルネットワークアーキテクチャの一つで、時系列データの予測に適しています。今回、種類の異なる各種時系列データを取り扱えるよう、多層LSTMを採用しました。また、都府県ごとの学習ではなく、類似性を考慮したうえでデータを規格化することにより、対象都府県を同時に学習、推定しています。
 表1に示した予測モデルの評価では、1週間ごとに更新され、2020年2月15日から各期間までを学習データとし、4週間後までの予測結果を出力するという作業を、2021年1月26日を開始日として、15回(週間)繰り返しました。

有用性と今後の展望

 本技術により、都市部における新規感染者数予測が可能となりました。東京以外の都府県については、主要駅の人流増減率、気象データ(日最高/最低気温、平均湿度)、平日/休日、政府および各行政区における緊急事態宣言の有無の情報により75~80%の予測精度が得られることがわかりました。一方、東京については人流が複雑であり、各種人流情報が必要でした。また、新規変異株の影響も、予測モデルが学習する4週間の間でも、新規変異株に特化した実効再生産数を学習あるいは推定できれば、人流抑制の目安を算出することが可能であることもわかりました。特に、本発表で得られた知見により、感染者数抑制に対する具体的な指標を示すことができれば、コロナ対策に役立つ有用なツールとなり得ます。また、推定された新規感染者数は、ワクチンの有効性を検討する際の指標としても有用であると考えられます。

プレスリリース情報および関連主要論文


[1] 2020年6月17日プレスリリース「新型コロナウィルス、人口密度と気温・絶対湿度が影響 ~新型コロナウィルスの拡大・収束期間、感染者数・死者数の分析結果について~」
https://www.nitech.ac.jp/news/press/2020/8366.html
関連文献
E. A. Rashed, S. Kodera, J. Gomez-Tames, and A. Hirata, "Influence of Absolute Humidity, Temperature and Population Density on COVID-19 Spread and Decay Durations: Multi-prefecture Study in Japan,"Int. J. Environ. Res. Public Health, vol.17, no.15, pp.5354, 2020.
S. Kodera, E. A. Rashed, and A. Hirata, "Correlation between COVID-19 Morbidity and Mortality Rates in Japan and Local Population Density, Temperature, and Absolute Humidity," Int. J. Environ. Res. Public Health, vol.17, no.15, pp.5477, 2020.
[2] ドコモ モバイル空間統計 https://mobaku.jp/covid-19/
[3] Google COVID-19: コミュニティモビリティレポート https://www.google.com/covid19/mobility/
[4] Arik et al., https://storage.googleapis.com/covid-external/COVID-19ForecastWhitePaper.pdf
[5] E. A. Rashed and A. Hirata, "One-Year Lesson: Machine Learning Prediction of COVID-19 Positive Cases with Meteorological Data and Mobility Estimate in Japan," Int. J. Environ. Res. Public Health, vol.18, no.11, pp.5477, 2021.
[6] E. A. Rashed and A. Hirata, "Infectivity Upsurge by COVID-19 Viral Variants in Japan: Evidence from a Deep Learning Modeling." Int. J. Environ. Res. Public Health (submitted).
[7] S. Lauer et al., Annals of Internal Medicine, vo.172, no.9, pp.577-582, 2020.

▶プレスリリース資料の詳細は、下記のページをご覧ください。
先端医用物理・情報工学研究センター

お問い合わせ先

研究に関すること

名古屋工業大学大学院工学研究科
電気・機械工学専攻
教授 平田 晃正
TEL:052-735-7916
e-mail : ahirata[at]nitech.ac.jp

広報に関すること

名古屋工業大学 企画広報課
Tel: 052-735-5647
E-mail: pr[at]adm.nitech.ac.jp

*それぞれ[at]を@に置換してください。


  • ホーム
  • News&Topics一覧
  • 人流増減と気象データで新型コロナウィルス新規感染者数を予測 ~深層学習と統計の併用による新規感染者数予測と新規変異株出現時の人流抑制の目安~