GISツールとデータ解析
体にこたえる危険な暑さやゲリラ豪雨が続いております。冷房を切って寝てしまうと暑さで汗だくで目が覚めることもありますので気をつけてください。
—————
【13日の天気】猛暑続く 熱中症に警戒 家の中でも対策を 山沿い中心に天気急変にも注意
https://news.yahoo.co.jp/articles/ebc7510329b800cd105bbd4b18857b1e426360e3
—————
こういった気温のマップですが、図のように通常観測点は決められた地点で観測された点データで気象庁から報告されます。アメダスですね!
—————
国土交通省気温の状況
https://www.data.jma.go.jp/obd/stats/data/mdrr/tem_rct/index_mxtem.html
—————
これをマッピングする際に、図のように観測点ではない地点のデータは、周辺データから予測してマッピングしていきます。点データだけだと何かわかりにくいですよね?このようにある既知の数値データ列を基にして、そのデータ列の各区間の範囲内を埋めることを”内挿”と呼びます。この地図上の空間データ解析には色々と方法があります。これには専門知識が必要ですが、GISツールを使うと専門外の人でも比較的楽に実施することが可能です。もちろん、どのツールを使った方がいいのかは、基礎知識として把握しておく必要があります。
実際に、アメダスから報告された点データを内挿すると以下のようになります。点データより、関東と名古屋周辺を中心として気温が高くなっていることが瞬時にわかります。いや~すごいですよね。
このGIS(Geographic Information System)ですが、地理的空間情報の地理的に把握、分析するために電子地図上で一体的に処理する情報システムのことを言います。以下の”ゼロからわかるGIS”を見てもらえるとよくわかると思います。
例えば、地震による地域危険度のデータも”表”だけではどこかを瞬時に把握することは難しいですよね?でも、地図上に視覚化すると危険度の高い地域の分布を把握することが可能になります。分析・アルゴリズム以外にも、”データの可視化”がデータサイエンスでは重要になります。今までこの”データの可視化”はエクセルで簡単に図を作れるため、誰もそこまで注意していなかったのですが、今後データ数が増えれば増えるほど、ただの分析以外にも可視化は重要になってくると考えられます。(ただ、一番大切なのは分析結果からどう”行動に移す”かなんですけどね、、、そのためには説得力がある図は非常に大切です)
最近では、各地域の基本データはe-Statから気軽に入手できます。
—————
統計で見る日本
https://www.e-stat.go.jp/
—————
GISで使う地図データは国土地理院から入手できます。
—————
基盤地図情報
https://fgd.gsi.go.jp/download/menu.php
—————
ただ、やはりこの2つを組み合わせるためには、少しクセがあるので専門家に一度聞いてみたほうがいいかもしれません。
このようにオープンデータが公開されていることから、これらを使ってこの地域の特徴や周辺地域の競合他社を分析すると、効率よくビジネスをすすめることが可能になります。だからこそ、本当に必要なのはデータサイエンス以外にも、“データからわかったことを考察できるその分野の専門知識”なのかもしれませんね。