衛星えいせいデータ 2021/5/31

地理ちり空間くうかん情報じょうほうを扱あつかうなら知しっておきたいPythonライブラリ、GeoPandas入門にゅうもん~基礎きそ編へん~

さまざまなデータを地理ちり空間くうかん情報じょうほうとして重畳ちょうじょうする上じょうで有用ゆうようなPythonのライブラリであるGeoPandas。前編ぜんぺんではGeoPandasを用もちいたデータの描画びょうが方法ほうほうなど基礎きそ的てきな扱あつかい方かたを紹介しょうかいし、後編こうへんでは衛星えいせいデータと組くみ合あわせて解析かいせき結果けっかを可視かし化かする方法ほうほうを紹介しょうかいします。

Pythonで地理ちり空間くうかん情報じょうほうを行おこなう場合ばあい、GeoPandasの使つかい方かたを覚おぼえておくととても便利べんりです。

例たとえば、都道府県とどうふけん別べつの気象きしょうデータを持もっていたとします。そのテーブルデータ(csv)には地理ちり情報じょうほうと言いえば、都道府県とどうふけんの名称めいしょうくらいしかありません。このような場合ばあい、これを日本にっぽん地図ちずの上うえに重畳ちょうじょうして可視かし化かすることはできません。

しかし、このデータに地図ちず上じょうに描画びょうができる情報じょうほうを与あたえることさえできれば、好すきなデータを地図ちずの上うえに重かさねることができます。このようなことをしたい場合ばあいに、GeoPandasの使つかい方かたを知しっておけば助たすけになります。

今回こんかいは、簡単かんたんな例れいを通つうじて、GeoPandasの魅力みりょくの一端いったんを知しってみましょう。

今回こんかいの解析かいせきではGoogle Colaboratoryを利用りようしています。ローカルでも動作どうさします。

仮かりにローカルで実行じっこうする場合ばあいには、いくつかの処理しょりは必要ひつようありませんので都度つどスキップしてください。

今回こんかい利用りようするデータはこちら

この前編ぜんぺんでは

・ラスターデータとベクターデータの振ふり返かえり
・GeoPandasを利用りようしてベクターデータの読よみ込こみや描画びょうが
・csvデータとベクターデータの組くみ合あわせによる解析かいせき
・やや高度こうどな描画びょうが方法ほうほう
・時じ系列けいれつ動画どうが（タイムラプス動画どうが）の作成さくせい
・Plotlyを用もちいた可視かし化か例れい

について紹介しょうかいします。

ラスターとベクター

地理ちり空間くうかん情報じょうほうとはいわゆるGISというものです。まずは基礎きそ中ちゅうの基礎きそ、画像がぞうの形式けいしきとしてラスター、ベクターというものを思おもい出だすに留とめ、この記事きじの後編こうへんでは、実際じっさいにコードを動うごかしながら地理ちり空間くうかん情報じょうほう解析かいせきに必要ひつような知識ちしきである、参照さんしょう系けいの概念がいねんを説明せつめいします。
※参照さんしょう系けいが何なにか気きになる方ほうはこちらの論文ろんぶん等ひとしをご覧らんください

ラスターデータ

Source : National Ecological Observatory Network (NEON)

ラスターデータとは上うえのように格子こうし状じょうの中なかにデータが入はいったものです。格子こうしの大おおきさにより、画像がぞうの滑なめらかさが変かわります。格子こうしが細こまかいラスターデータは、より解像度かいぞうどの高たかい画像がぞうと考こうえらられ、格子こうしが大おおきくなれば、荒あらい画像がぞうになります。

この一ひとつ一ひとつの格子こうしをピクセルと呼よびます。

ラスターはGeoPandasで扱あつかうより、rasterioなどで扱あつかうことが多おおいのですが、このピクセル座標ざひょうを地理ちり座標ざひょうに置おき換かえ、ピクセル一ひとつ一ひとつをテーブルデータとして扱あつかうことができます。特とくに初はじめから地理ちり座標ざひょうを備そなえているGeoTIFFデータでは、この変換へんかん作業さぎょうはとても楽らくです。

上うえの図ずを見みれば明あきらかです。不鮮明ふせんめいな画像がぞうでは、ピクセルの形かたちがはっきりとわかりますが、高たかい解像度かいぞうどのものでは、ピクセルの形かたちは捉とらえることができません。

ラスターデータは単たんに写真しゃしんのようなデータというわけではなく、ピクセルの中なかに入はいっている値ねを用もちいて発展はってん的てきな解析かいせきを行おこないます。代表だいひょう的てきなものとして植生しょくせいの活性かっせい度どを示しめすNDVIやEVIがあります。

他たに、下図したずのように地表ちひょう面めん温度おんどの推定すいていも求もとめることができます。

ピクセル座標ざひょうが地理ちり空間くうかん情報じょうほうを含ふくむと、実際じっさいに地図ちず上じょうにデータを重かさねることができます。

画像がぞう自身じしんは自分じぶんがどこに当あてはまるのかを知しっていません。ここに参照さんしょうとなるデータを与あたえてあげる(georeference)と、画像がぞうデータがどこに位置いちするべきなのかを判断はんだんできます。

ベクターデータ

続つづいてベクターです。ベクターはラスターと違ちがい、格子こうしの中なかにデータを持もたない、ピクセルで構築こうちくされていないデータです。

点てんのデータ、線せんのデータ、そしてポリゴンと呼よばれる多角たかく形がたのデータがこれに当あたります。例たとえば、市町村しちょうそん区くの境界きょうかい、Google Map上じょうでお気きに入いりの場所ばしょに落おとしたピンがベクターデータになります。

上うえ図ずを見みるとわかるように、ポイントは、一ひとつの座標ざひょうで構成こうせいされています。ラインは少すくなくとも2点てんの情報じょうほうが必要ひつようであり、その線せんは閉とじていません。ポリゴンでは、複数ふくすうの点てん、線せんが閉とじることが条件じょうけんとなります。もちろん、円えんもポリゴンです。

ベクターファイルの有名ゆうめいな形式けいしきとしてはshp(shapefile)があります。GeoJSONも代表だいひょう的てきなファイル形式けいしきと言いえるでしょう。ベクターは数学すうがく的てきに記述きじゅつされたデータであり、解像度かいぞうどという概念がいねんをもっていません。そのため拡大かくだいしても縮小しゅくしょうしても、変化へんかはありません。

GeoPandasを触さわってみよう

GeoPandasとはそもそも何なになのか。GeoPandasとはPandasによるテーブルデータの処理しょりと、Shapelyによる幾何きか学がく的てきなデータ処理しょりを併あわせ持もったものになります。そこにmatplotlibによる描画びょうが支援しえんも行おこなわれているため、地理ちり空間くうかん情報じょうほうを簡単かんたんなテーブルデータで処理しょりできるだけでなく、ちょっとしたコマンドで直接ちょくせつ描画びょうがまで行おこなえるという優まされものです。

言葉ことばで説明せつめいするよりも、図ずで見みるとわかりやすいです。地理ちり空間くうかん情報じょうほうは様々さまざまな形式けいしきがありますが、それを上うえ図ずのようなテーブルにしてしまい、shapelyにより処理しょりされる幾何きか情報じょうほうはgeometryという列れつに保存ほぞんされています。このようなテーブルデータをGeoDataFrameと呼よびます。

geomtryでは

・PointsまたはMulti-Points
・LinesまたはMulti-Lines
・PolygonsまたはMulti-Polygons

が基本きほん的てきなオブジェクトとして扱あつかわれます。

ColabでGeoPandas＋αあるふぁを使つかう準備じゅんびをします。下記かきのセルを実行じっこうしてください。

GeoPandasには以下いかの依存いぞん関係かんけいがあります。

・numpy
・pandas
・shapely
・fiona
・pyproj

詳くわしくは公式こうしきリファレンスをご覧らんください。

# Important library for many geopython libraries
!apt install gdal-bin python-gdal python3-gdal 
# Install rtree - Geopandas requirment
!apt install python3-rtree 
# Install Geopandas
!pip install git+git://github.com/geopandas/geopandas.git
# Install Folium for Geographic data visualization
# !pip install folium
!pip install plotly-express
!pip install --upgrade plotly
!pip install matplotlib-scalebar
# Use EE in Python
!pip install geemap
!pip install ipygee

# Colab使用しよう時じ
import os
os.kill(os.getpid(), 9)

# Colab使用しよう時じ

# Driveのマウント
# Filesからもワンクリックでマウント可能かのうです
from google.colab import drive
drive.mount('/content/drive')

ライブラリのインポートを行おこないます。上記じょうきで全すべてがインストールされていれば、エラーなく実行じっこうできます。

import pandas as pd
import numpy as np
import os
import geopandas as gpd
from shapely.geometry import Point
import matplotlib
import matplotlib.pyplot as plt 
import folium
import plotly_express as px
from datetime import datetime
import geemap
from ipygee import*

データを使つかって実際じっさいに解析かいせきをしてみましょう。

今回こんかいは、e-statから初婚しょこんの平均へいきん年齢ねんれいのデータをダウロードした上うえで可視かし化かします。

レイアウトをいじってからダウンロードしてありますが、それ以外いがいには特とくに加工かこうはしていません。

初婚しょこん年齢ねんれいデータの読よみ込こみ

# 階層かいそうは適宜てきぎ変更へんこうしてください
marriageDf = pd.read_csv('/content/drive/MyDrive/Sorabatake/marriage.csv')

データの中身なかみを確認かくにんします。

marriageDf.info()

RangeIndex: 680 entries, 0 to 679
Data columns (total 14 columns):
# Column Non-Null Count Dtype
— —— ————– —–
0 cat01_code 680 non-null int64
1 年齢ねんれい(5歳さい階級かいきゅう) 680 non-null object
2 cat02_code 680 non-null int64
3 世帯せたいの主おもな仕事しごと 680 non-null object
4 cat03_code 680 non-null int64
5 総数そうすう・再掲さいけい 680 non-null object
6 cat04_code 680 non-null int64
7 夫おっと・妻つま 680 non-null object
8 area_code 680 non-null int64
9 都道府県とどうふけん（特別とくべつ区く−指定してい都市とし再掲さいけい） 680 non-null object
10 time_code 680 non-null int64
11 時じ間あいだ軸じく(年次ねんじ) 680 non-null object
12 unit 680 non-null object
13 value 680 non-null float64
dtypes: float64(1), int64(6), object(7)
memory usage: 74.5+ KB

こちらはe-statからダウンロードしたものとなります。ダウンロード前まえにレイアウトをいじってからダウンロードしてありますが、それ以外いがいには特とくに加工かこうはしていません。

ここでは、簡単かんたんなデータクリーニングも含ふくめて進すすめていきましょう。

marriageDf.head()

marriageDf.describe(include='all')

列れつ名めいを変更へんこうします。

marriageDf = marriageDf.loc[:,['夫おっと・妻つま','都道府県とどうふけん（特別とくべつ区く−指定してい都市とし再掲さいけい）','時間じかん軸じく(年次ねんじ)','value']].\
rename(columns={'夫おっと・妻つま':'sex','都道府県とどうふけん（特別とくべつ区く−指定してい都市とし再掲さいけい）':'prefecture','時間じかん軸じく(年次ねんじ)':'year','value':'avgAge'}).copy()

続つづいて、値ねも編集へんしゅうします。

具体ぐたい的てきには、

・夫おっとはmale、妻つまはfemale
・xxxx年ねんから年としを削除さくじょ
・都道府県とどうふけんレベルのみ抽出ちゅうしゅつ

します。

marriageDf.sex = marriageDf.sex.replace('夫おっと','male',regex=False).replace('妻つま','female',regex=False)
marriageDf.year = marriageDf.year.replace('年とし$','',regex=True)
# marriageDf.year = pd.to_datetime(marriageDf.year, format = '%Y').dt.to_period('y')
marriageDf.year = marriageDf.year.astype('int64')

includeStr = ['県けん$','道みち$','都と$','府ふ$']
marriageDf = marriageDf.loc[marriageDf.prefecture.str.contains('|'.join(includeStr)),:].reset_index(drop=True)

marriageDf.describe(include='all') # describe all variables

初婚しょこん年齢ねんれいが最もっとも低ひくい値ねを探さがしてみましょう。

marriageDf.loc[marriageDf.avgAge == marriageDf.avgAge.min(),:]

佐賀さが県けんの28.5歳さいと表示ひょうじされます。

初婚しょこん年齢ねんれいが最もっとも高たかい値ねを探さがしてみましょう。

marriageDf.loc[marriageDf.avgAge == marriageDf.avgAge.max(),:]

東京とうきょう都との32.5歳さいと表示ひょうじされます。

つまり、都道府県とどうふけんレベルで見みると、佐賀さが県けんが最もっとも早はやく、東京とうきょう都とが最もっとも遅おそく結婚けっこんしていることがわかります。

ベクターファイルの読よみ込こみ

GADMからファイルをダウンロードします。

シェープファイルをダウンロードし、解凍かいとうすると以下いかのファイルが含ふくまれています。

・.cpg
・.dbf
・.prj
・.shp
・.shx

です。geopandasではシェープファイルを読よみ込こむ際さいに、.shpしか指定していしません。しかし、GeoPandasでデータを読よみ込こむためには、.shp、.dbf、そして.shxは同おなじフォルダに存在そんざいしている必要ひつようがあります。仮かりにこれらのファイルが欠かけてしまっている場合ばあい、pythonはエラーを返かえします。解凍かいとうしたファイルからshpだけを残のこして他たのファイルを削除さくじょしないようにしましょう。

# 階層かいそうは適宜てきぎ変更へんこうしてください
jpnShp = gpd.read_file('/content/drive/MyDrive/Sorabatake/japanSHP/gadm36_JPN_1.shp')

jpnShp.head()

今回こんかいは行政ぎょうせいレベル１を利用りようしているため、都道府県とどうふけんレベルでのデータを利用りようすることができます。

データフレーム内ないでgeometryの列れつが地図ちず上じょうに対象たいしょうを描画びょうがするために必要ひつような情報じょうほうになります。

geopandasではフィルタリングもお手ての物ものです。Pandasに慣なれている場合ばあいには、問題もんだいなくデータのクリーニングが行おこなえます。データの操作そうさを行おこなう前まえに、簡単かんたんな可視かし化かを行おこなってみましょう。

以下いかの3行ぎょうのコマンドで描画びょうがすることが可能かのうです。

ax = jpnShp.plot(figsize=(10, 10))
jpnShp.plot(ax=ax)
plt.show();

今回こんかいは都道府県とどうふけんレベルのデータを利用りようしていますので、境界きょうかいも描画びょうがします。

併あわせて、名前なまえも重畳ちょうじょうします。

# 日本にっぽんのシェープデータを可視かし化かする
ax = jpnShp.plot(figsize=(14, 14))
jpnShp.apply(lambda x: ax.annotate(s=x.NAME_1, xy=x.geometry.centroid.coords[0], ha='center', color = 'black', size = 6),axis=1)
jpnShp.plot(ax = ax, edgecolors='black')
plt.title('Administrative level 1 map in Japan', fontsize=16)
plt.show();

GeoDataFramedではShapelyとmatplotlibにより、簡単かんたんにベクターデータを可視かし化かすることができます。それでは、この図ずと先さきほど取得しゅとくしたe-statのデータを結合けつごうし、さらに描画びょうがを行おこないます。

shpとcsvの結合けつごう

シェープファイルのようなデータは、地図ちず上じょうにデータを投影とうえいするために必要ひつようなデータを既すでに持もっています。単たんなるテーブルデータは、このようなデータを持もっていません。しかし、今回こんかいのシェープファイルは都道府県とどうふけんの形かたちを描画びょうがする以上いじょうのデータを含ふくんでいません。

例たとえば、果物くだものの都道府県とどうふけん別べつ収穫しゅうかく量りょうのデーブルデータを持もっているとして、一方いっぽうでこのデータには地図ちず上じょうにデータを描えがくための情報じょうほうは含ふくまれていません。このような場合ばあいに上うえで示しめしたシェープファイルを利用りようすれば、果物くだものの収穫しゅうかく量りょうを持もった都道府県とどうふけんのデータ(GeoDataFrame）が作成さくせいできます。

今回こんかいは、平均へいきん初婚しょこん年齢ねんれいですが、やることは同おなじです。早速さっそく試ためしてみましょう。

# 不ふ必要ひつような列れつの削除さくじょ
japan = jpnShp.loc[:,['NAME_1','NL_NAME_1','geometry']].copy()

combDf = japan.merge(marriageDf,left_on='NL_NAME_1',right_on='prefecture',how='left') # データの結合けつごう
combDf.head() # check

再度さいど、描画びょうがを行おこないます。今度こんどは、2019年ねんの平均へいきん初婚しょこん年齢ねんれいを日本にっぽん地図ちずに重畳ちょうじょうします。

from matplotlib_scalebar.scalebar import ScaleBar
from mpl_toolkits.axes_grid1 import make_axes_locatable

縮尺しゅくしゃくや方位ほういを入いれないとGIS屋やさんに怒おこられるので、入いれ忘わすれないようにしましょう。

Pythonで縮尺しゅくしゃくを入いれるためには、ScaleBarを利用りようするのが良よいです（Cartopyを使つかえばもっと正確せいかくです）。
※個人こじん的てきにはPythonでの縮尺しゅくしゃく追加ついかは面倒めんどうです。もっとシンプルに論文ろんぶんで使つかえる、プレゼンで使つかえる地理ちり空間くうかん情報じょうほうの可視かし化かであればRの方ほうが楽らくに実行じっこうできます。

ScaleBarでは1ピクセルあたりの長ながさと、その単たんにを指定していする必要ひつようがあります。今回こんかいは50とkmを指定していしていますので、1ピクセルあたり50kmという計算けいさんになります。また長ながさは、 1, 2, 5, 10, 15, 20, 25, 50, 75, 100, 125, 150, 200, 500 or 750のみしか扱あつかえませんので、縮尺しゅくしゃくと実際じっさいの長ながさにはややずれが生しょうじることが考かんがえられます。細こまかい精度せいどまで気きにしなければならない場合ばあいには、自分じぶんで緯度いど経度けいどを基もとにして距離きょりを算出さんしゅつして縮尺しゅくしゃくを作つくるのが良よいと思おもいます。

# 男性だんせい
# 方位ほういの作成さくせいについての参考さんこう記事きじ：
## https://mohammadimranhasan.com/geospatial-data-mapping-with-python/
combDf2019M = combDf.loc[(combDf.year == 2019)&(combDf.sex == 'male'),:].reset_index(drop=True).copy()
ax = combDf2019M.plot(figsize=(16, 16))
scalebar = ScaleBar(50, location='lower right',units='km')
ax.add_artist(scalebar) # 200km
ax.text(x=153.215-0.55, y=40.4, s='N', fontsize=30) # North Arrow
ax.arrow(153.215, 39.36, 0, 1, length_includes_head=True,
          head_width=0.8, head_length=1.5, overhang=.1, facecolor='k') # North Arrow
combDf2019M.apply(lambda x: ax.annotate(s=x.NAME_1, xy=x.geometry.centroid.coords[0], ha='center', color = 'black', size = 6),axis=1)
combDf2019M.plot(column='avgAge', cmap = 'rainbow', edgecolors='black', ax = ax, legend=True,legend_kwds={'label': "Average age of first marriage",'orientation': "vertical"})
plt.title('Average Age of First Marriage among Males by Prefectures in 2019', fontsize=16)
plt.show();

図ずを見みると、東京とうきょうが平均へいきん初婚しょこん年齢ねんれいが高たかいことが分わかります。その一方いっぽうで西日本にしにほん側がわ、特とくに中国ちゅうごく・四国しこく・九州きゅうしゅう地方ちほうでは平均へいきん初婚しょこん年齢ねんれいがやや若わかいのがわかるかと思おもいます。

このように、単たんに値ねとしてみるより、地図ちずで可視かし化かするというのは、非常ひじょうにわかりやすく、大おおまかな地理ちり的てきな変異へんいを捉とらえることに役立やくだちます。

加くわえて女性じょせいも見みてみましょう。

# 女性じょせい
combDf2019F = combDf.loc[(combDf.year == 2019)&(combDf.sex == 'female'),:].reset_index(drop=True).copy()
ax = combDf2019F.plot(figsize=(16, 16))
scalebar = ScaleBar(50, location='lower right',units='km')
ax.add_artist(scalebar) # 200km
ax.text(x=153.215-0.55, y=40.4, s='N', fontsize=30) # North Arrow
ax.arrow(153.215, 39.36, 0, 1, length_includes_head=True,
          head_width=0.8, head_length=1.5, overhang=.1, facecolor='k') # North Arrow
combDf2019F.apply(lambda x: ax.annotate(s=x.NAME_1, xy=x.geometry.centroid.coords[0], ha='center', color = 'black', size = 6),axis=1)
combDf2019M.plot(column='avgAge', cmap = 'rainbow', edgecolors='black', ax = ax, legend=True,legend_kwds={'label': "Average age of first marriage",'orientation': "vertical"})
plt.title('Average Age of First Marriage among Females by Prefectures in 2019', fontsize=16)
plt.show();

女性じょせいも傾向けいこうは同おなじですね！

これらの図ずがコロプレスマップと呼よばれるものです。

5年ねん分ぶんをまとめて描画びょうがします。このようにすることで時間じかんごとの変化へんかが分わかりやすくなります。

combDf2018M = combDf.loc[(combDf.year == 2018)&(combDf.sex == 'male'),:].reset_index(drop=True).copy()
combDf2017M = combDf.loc[(combDf.year == 2017)&(combDf.sex == 'male'),:].reset_index(drop=True).copy()
combDf2016M = combDf.loc[(combDf.year == 2016)&(combDf.sex == 'male'),:].reset_index(drop=True).copy()
combDf2015M = combDf.loc[(combDf.year == 2015)&(combDf.sex == 'male'),:].reset_index(drop=True).copy()

with plt.rc_context(rc={'font.family': 'serif', 'font.weight': 'bold', 'font.size': 12}):
    fig, ((ax1, ax2), (ax3, ax4), (ax5, ax6)) = plt.subplots(nrows=3, ncols=2, figsize = (20,20))
    fig.autofmt_xdate(rotation = 45)
    # 2019
    scalebar = ScaleBar(50, location='lower right',units='km')
    combDf2019M.plot(column='avgAge', cmap = 'rainbow', edgecolors='black', ax = ax1, legend=True,vmin=28.5, vmax=32.5)
    ax1.set_title('Average age of first marriage in 2019', fontsize=10)
    ax1.text(x=152.215-0.85, y=40.7, s='N', fontsize=15) # North Arrow
    ax1.arrow(152.215, 39.36, 0, 1, length_includes_head=True, head_width=0.8, head_length=1.5, overhang=.1, facecolor='k') # North Arrow
    ax1.add_artist(scalebar)
    # 2018
    scalebar = ScaleBar(50, location='lower right',units='km')
    combDf2018M.plot(column='avgAge', cmap = 'rainbow', edgecolors='black', ax = ax2, legend=True,vmin=28.5, vmax=32.5)
    ax2.set_title('Average age of first marriage in 2018', fontsize=10)
    ax2.text(x=152.215-0.85, y=40.7, s='N', fontsize=15) # North Arrow
    ax2.arrow(152.215, 39.36, 0, 1, length_includes_head=True, head_width=0.8, head_length=1.5, overhang=.1, facecolor='k') # North Arrow
    ax2.add_artist(scalebar)
    # 2017
    scalebar = ScaleBar(50, location='lower right',units='km')
    combDf2017M.plot(column='avgAge', cmap = 'rainbow', edgecolors='black', ax = ax3, legend=True, vmin=28.5, vmax=32.5)
    ax3.set_title('Average age of first marriage in 2017', fontsize=10)
    ax3.text(x=152.215-0.85, y=40.7, s='N', fontsize=15) # North Arrow
    ax3.arrow(152.215, 39.36, 0, 1, length_includes_head=True, head_width=0.8, head_length=1.5, overhang=.1, facecolor='k') # North Arrow
    ax3.add_artist(scalebar)
    # 2016
    scalebar = ScaleBar(50, location='lower right',units='km')
    combDf2016M.plot(column='avgAge', cmap = 'rainbow', edgecolors='black', ax = ax4, legend=True, vmin=28.5, vmax=32.5)
    ax4.set_title('Average age of first marriage in 2016', fontsize=10)
    ax4.text(x=152.215-0.85, y=40.7, s='N', fontsize=15) # North Arrow
    ax4.arrow(152.215, 39.36, 0, 1, length_includes_head=True, head_width=0.8, head_length=1.5, overhang=.1, facecolor='k') # North Arrow
    ax4.add_artist(scalebar)
    # 2015
    scalebar = ScaleBar(50, location='lower right',units='km')
    combDf2015M.plot(column='avgAge', cmap = 'rainbow', edgecolors='black', ax = ax5, legend=True, vmin=28.5, vmax=32.5)
    ax5.set_title('Average age of first marriage in 2015', fontsize=10)
    ax5.text(x=152.215-0.85, y=40.7, s='N', fontsize=15) # North Arrow
    ax5.arrow(152.215, 39.36, 0, 1, length_includes_head=True, head_width=0.8, head_length=1.5, overhang=.1, facecolor='k') # North Arrow
    ax5.add_artist(scalebar)
    # Blank
    ax6.axis('off')
    # plt.tight_layout(pad=4)
    plt.show();

2015〜2019の5年間ねんかんで、傾向けいこうに大おおきな変化へんかがないことがわかります。

続つづけて、時とき系列けいれつ動画どうが（タイムラプス動画どうが）を作成さくせいしましょう。地図ちずの可視かし化かでは動画どうがを見みせる方ほうが理解りかいが早はやかったりします。今回こんかいは5年間ねんかんのデータですが、これが30年間ねんかんのような長ながいスケールになると、時間じかん変化へんかしていく様子ようすは動画どうがの方ほうが理解りかいしやすくなります。

動画どうが作成さくせい手順てじゅんとしては、png画像がぞうを作成さくせいし、ffmpegを利用りようします。

maleDf = combDf.loc[combDf.sex == 'male',:] # Extract males' values
dateMin = maleDf['year'].min()
n_years = maleDf['year'].nunique()

# 画像がぞうとアニメーションの参考さんこう記事きじ
## https://qiita.com/croquette0212/items/8ff251d5da77e803c253
## https://medium.com/tech-carnot/time-lapse-choropleth-map-visualization-using-geopandas-8adb77a7d14
for i in range(0,n_years):
    nyear = dateMin + i
    #Get cumulative df till that date
    dfYear = maleDf.loc[maleDf['year'] == nyear,:]

    fig, ax = plt.subplots(1, figsize=(10,8))
    dfYear.plot(column='avgAge',
                cmap='Blues', linewidth=0.8, ax=ax, edgecolor='0.8')
    # remove the axis
    ax.axis('off')
    # add a title
    ax.set_title('Average Age of First Marriage among Males', 
                 fontdict={'fontsize': '25', 'fontweight' : '3'})
    
    # Create colorbar as a legend
    sm = plt.cm.ScalarMappable(cmap='rainbow', 
            norm=plt.Normalize(vmin=dfYear['avgAge'].min(), vmax=dfYear['avgAge'].max()))
    # add the colorbar to the figure
    cbar = fig.colorbar(sm)
    fontsize = 20
    
    # Positions for the date
    date_x = 140
    date_y = 30
    syear = str(nyear)
    ax.text(date_x, date_y, 
            f"{syear}", 
            color='black',
            fontsize=fontsize)
    fig.savefig(f"/content/drive/MyDrive/Sorabatake/videoff/frame_{i:03d}.png", 
                dpi=100, bbox_inches='tight')
    plt.close()

画像がぞうの準備じゅんびができました。上うえの保存ほぞんフォルダについては、ご自身じしんの好すきなフォルダで問題もんだいありません。

この画像がぞうを用もちいて、ffmpegで動画どうがの作成さくせいを開始かいしします。今回こんかいはターミナルのコマンドを持もちますので、!を先頭せんとうにつけたコマンドを追加ついかしています。

imgDir = '/content/drive/MyDrive/Sorabatake/videoff' # 動画どうがの保存ほぞん場所ばしょ

if not os.path.exists(imgDir):
  os.makedirs(imgDir) # フォルダ作成さくせい

# 同おなじ動画どうが名めいにならないように注意ちゅうい
!ffmpeg -framerate 1 -i "$imgDir/frame_%03d.png" -c:v h264 -r 30 "$imgDir/avgAgevideo.mp4"

作成さくせいした動画どうがはvlcなどの動画どうがソフトで閲覧えつらんが可能かのうです。

Plotlyを使つかう

描画びょうがとして、さらにPlotlyを利用りようしてみましょう。こちらでは動的どうてきな可視かし化かが行おこなえるようになります。

fig = px.choropleth(combDf,                            # データフレーム
                     locations="NAME_1",           # 場所ばしょの名称めいしょうを取得しゅとく
                     color="avgAge",                     # 色付いろづけするデータ指定してい
                     hover_name="NAME_1",              # マウスホバーで表示ひょうじするデータ
                     animation_frame="year",        # 時間じかんデータ指定してい
                     projection="natural earth",        # 投影とうえいする面めん指定してい
                     color_continuous_scale = 'Peach',  # 色いろ指定してい
                     range_color=[28,33]            # 色付いろづけするデータの範囲はんいを指定してい
                     )        
fig.update_geos(
    center=dict(lon=136, lat=37), scope='asia',
    lataxis_range=[28,47], lonaxis_range=[125, 150]
)
fig.show()
# plt.close(fig)

と思おもったら、悲かなしい。日本にっぽんの行政ぎょうせい区域くいきは含ふくまれていないのですね。諦あきらめましょう。

仮かりにポイントデータを重かさねるのであれば、scatterを利用りようしてbubble mapを描えがくことができます。

こちらの記事きじをご参照さんしょうください。また、treemapであれば、地図ちずに描画びょうがするのと同おなじように分わかりやすく全体ぜんたいの違ちがいを捉とらえることができます。そちらを試ためしてみましょう。

df2019 = combDf.loc[combDf.year == 2019,:]
fig = px.treemap(df2019, path=['prefecture'], values='avgAge', color='avgAge', color_continuous_scale='magma')
fig.show()

同おなじように全体ぜんたいは掴つかみやすいのですが、地理ちり的てきな変異へんいを捉とらえることが難むずかしいため、基本きほん的てきは地図ちず上じょうで描画びょうができるのが望のぞましいと思おもいます。

最後さいごに、まとめて描画びょうがします。

表示ひょうじされるラベルは平均へいきん初婚しょこん年齢ねんれいにしてあります。

import plotly.graph_objects as go
from plotly.subplots import make_subplots

df2018 = combDf.loc[combDf.year == 2018,:]
df2017 = combDf.loc[combDf.year == 2017,:]
df2016 = combDf.loc[combDf.year == 2016,:]
df2015 = combDf.loc[combDf.year == 2015,:]

fig = make_subplots(
    cols = 2, rows = 3,
    column_widths=[0.5, 0.5],
    specs = [[{'type': 'treemap'}, {'type': 'treemap'}],
             [{'type': 'treemap'}, {'type': 'treemap'}],
             [{'type': 'treemap'}, {'type': 'treemap'}]],
    horizontal_spacing = 0.01,
    vertical_spacing = 0.01
)

fig.add_trace(go.Treemap(
    labels = df2019['prefecture'].values,
    parents = df2019['year'].values,
    values =  df2019['avgAge'].values,
    marker=dict(
        colors=df2018['avgAge'],
        colorscale='magma'),
    textinfo = "label+value",
    ),row = 1, col = 1)

fig.add_trace(go.Treemap(
    labels = df2018['prefecture'].values,
    parents = df2018['year'].values,
    values = df2018['avgAge'].values,
    marker=dict(
        colors=df2018['avgAge'],
        colorscale='magma'),
    textinfo = "label+value",
    ),row = 1, col = 2)

fig.add_trace(go.Treemap(
    labels = df2017['prefecture'].values,
    parents = df2017['year'].values,
    values =  df2017['avgAge'].values,
    marker=dict(
        colors=df2017['avgAge'],
        colorscale='magma'),
    textinfo = "label+value",
    ),row = 2, col = 1)

fig.add_trace(go.Treemap(
    labels = df2016['prefecture'].values,
    parents = df2016['year'].values,
    values = df2016['avgAge'].values,
    marker=dict(
        colors=df2016['avgAge'],
        colorscale='magma'),
    textinfo = "label+value",
    ),row = 2, col = 2)

fig.add_trace(go.Treemap(
    labels = df2015['prefecture'].values,
    parents = df2015['year'].values,
    values =  df2015['avgAge'].values,
    marker=dict(
        colors=df2015['avgAge'],
        colorscale='magma'),
    textinfo = "label+value",
    ),row = 3, col = 1)
fig.update_layout(height = 1400, width = 1400, paper_bgcolor="LightSteelBlue")
fig.show()

数字すうじが出でるので分わかりやすいです。結局けっきょく、微妙びみょうな差異さいはあるものの、30歳さいというのが一ひとつの目安めやすになっているようです。

平均へいきんですので、世よの中なかこれより遅おそく結婚けっこんする人ひとも早はやく結婚けっこんする人ひともいるわけです。いつ結婚けっこんするにしても、家庭かてい円満えんまんでありたいものです。

以上いじょうでGeoPandas入門にゅうもん（前編ぜんぺん）を終おわります。

公式こうしきのドキュメントには様々さまざまな情報じょうほうが記載きさいされており、かなり勉強べんきょうになる感かんじです。GISデータはRでも解析かいせきを行おこなうことができます。Rでの地理ちり空間くうかん情報じょうほう解析かいせきの方ほうが便利べんりなパッケージが揃そろっており、かゆいところに手てが届とどくという印象いんしょうです。一方いっぽうでPythonは高こう次元じげんな配列はいれつ情報じょうほうを効率こうりつよく解析かいせきできるライブラリがある、また専門せんもん性せいの高たかい特殊とくしゅなライブラリあり、そこがRに比くらべると強つよみかと思おもいます。