はじめに

国際連合経済社会局人口部(United Nations, Department of Economicand Social Affairs, Population Division(以下、国連人口部)は,世界各国の2100年までの人口を予測し, それをWorld Population Prospect(WPP)として発表している. 2015年版のWPPでは,1950-2015年までの人口推定値と, 8つのシナリオに基づく2100年までの人口予測に関する様々なデータが利用可能である.

WPPから主要なデータをダウンロードし, 研究室における研究および授業の演習用にSQLiteのデータベース・ファイルとして用意した.

データベース・ファイルのダウンロード

  1. wpp2015.db.zipをダウンロードする.ダウンロード開始
  2. ダウンロード・ファイルはzipファイルなので,ダウンロード後に解凍アプリでunzipする. Mac OSでは,zipファイルはダウンロード後に自動的に解凍される.Winodwsについては未確認.
  3. Unzip後は,wpp2015.dbというファイルになる.

ファイルが開けませんという質問をしばしば受ける. wpp2015.db|はSQLiteのデータベース・ファイルなので,このファイルの中身を直接開いても意味がないし, Windows エクスプローラやMac OS Finder上でwpp2015.dbをクリックしても開くことができないと思う.

wpp2015.dbからデータを抽出するには,Rなどの外部プログラムからSQLで命令を発行しなければならない. SQLとは,関係データベース管理システム(relational databese management system, RDBMS)へ外部プログラムから命令を発行する言語である.

将来人口予測の8つのシナリオについて

WPPは以下の8つのシナリオに基いて将来の人口を予測している. データベースでは,変数によって予測シナリオが識別される. 年次データには出生率中位推計(\verb|VarID = 2)の予測値のみが収録され, 5年間隔の期間データには全てのシナリオに関する予測値が収録されている.

VarID 予測名 出生率 死亡率 国際人口移動
4 Low 低位 通常 通常
2 Medium 中位 通常 通常
3 High 高位 通常 通常
5 Constant fertelity 2010-2015の水準で一定 通常 通常
6 Instant replacement 2015-2020に置換水準が1になる水準 通常 通常
7 Zero migration 中位 通常 2015−2020でゼロ
8 Constant mortality 中位 2010-2015で一定 通常
9 No change 2010-2015で一定 2010-2015で一定 2015−2020でゼロ

データベース使用例

RでWorld Population Prospect(WPP)を使う

データテーブル

テーブル名 期間 指標
pop_annual 1年 男女別総人口,人口成長率,人口密度
period_main 5年間隔期間 合計特殊出生率,純再生産率,粗出生率,出生数,平均寿命,乳児死亡率,
5歳未満児童死亡率,粗死亡率,死亡数,純国際人口移動率,年平均人口成長率,
自然増加率,出生時男女比,出産時平均年令,男女別総人口,人口密度
pop_age_sex_5y 5年間隔 男女別年齢階層別人口(全予測シナリオ)
pop_age_sex_1y 1年 男女別年齢階層別人口(出生率中位推計のみ)
death_age_sex_5y 5年間隔期間 男女別年齢階層別死亡数
life_table 5年間隔期間 簡易生命表
fertility 5年間隔期間 年齢階層別出生数,年齢特殊出生率
location 国,地域情報

テーブル定義

pop_annual

列名 内容
loc_id 国・地域コード
projection 予測コード
year 暦年
pop_male 総人口(男性,1000人)
pop_female 総人口(女性,1000人)
pop_total 総人口(男女計,1000人)
growth_rate 総人口の年平均成長率(%)
pop_density 人口密度(人/km\({}^2\))

period_main

列名 内容
loc_id 国・地域コード
projection 予測コード
period 5年間隔期間.1950-1955, …, 2095-2100
mid_period 期間中央年(1月1日)
tfr 合計特殊出生率
nrr 純再生産率(女性1人あたり生存女児)
cbr 粗出生率(人口1000人あたり出生数)
births 出生数(男女計,1000人)
lex_total 平均寿命(男女計,年)
lex_male 平均寿命(男性,年)
lex_female 平均寿命(女性,年)
imr 乳児死亡率\(q(1)\)(男女計,1000生存出生数あたり乳児死亡数)
q5 5歳未満児童死亡率\({}_5q_0\)(男女計,1000生存出生数あたり5歳未満死亡数)
cdr 粗死亡率(人口1000人あたり死亡数)
death_total 死亡数(男女計、1000人)
deaths_male 死亡数(男性、1000人)
deaths_female 死亡数(女性、1000人)
cnmr 純国際人口移動率(人口1000人あたり)
net_migrations 純国際人口移動数(男女計、1000人)
growth_rate 年平均人口成長率(%)
nat_incr 自然増加率(人口1000人あたり)
srb 出生時男女比(女児出生数あたり男児出生数)
mac 出産時平均年令(年)
pop_male 総人口(男性,1000人).pop_annualの期間中央年値.
pop_female 総人口(女性,1000人).pop_annualの期間中央年値.
pop_total 総人口(男女計,1000人).pop_annualの期間中央年値.
pop_density 人口密度(人/km\({}^2\)).pop_annualの期間中央年値.

pop_age_sex_5y

列名 内容
loc_id 国・地域コード
projection 予測コード
year 暦年(5年間隔)
sex 1 = 男性,2 = 女性,3 = 男女計.
age_grp 年齢階層
age_start 年齢階層開始年齢
age_span 年齢階層間隔
pop 人口(1000人)

pop_age_sex_1y

列名 内容
loc_id 国・地域コード
projection 予測コード = 2
year 暦年
sex 1 = 男性,2 = 女性,3 = 男女計.
age_grp 年齢階層
age_start 年齢階層開始年齢
age_span 年齢階層間隔
pop 人口(1000人)

death_age_sex_5y

列名 内容
loc_id 国・地域コード
projection 予測コード
period 5年間隔期間.1950-1955, …, 2095-2100
mid_period 期間中央年(1月1日)
sex 1 = 男性,2 = 女性,3 = 男女計.
age_grp 年齢階層
age_start 年齢階層開始年齢
age_span 年齢階層間隔
death 死亡数(1000人)

life_table

列名 内容
loc_id 国・地域コード
projection 予測コード
period 5年間隔期間.1950-1955, …, 2095-2100
mid_period 期間中央年(1月1日)
sex 1 = 男性,2 = 女性,3 = 男女計.
age_grp 年齢階層
age_start 年齢区間\((x, x + n)\)の開始年齢.\(n\)は区間の長さで,5年間である.幼児期は1年,子供は4年,最終区間はオープン・エンドである.
age_span 年齢階層間隔\(n\)
mx 区間\((x, x + n)\)に関する年央死亡率\({}_nm_x\)
qx 区間\((x, x + n)\)に関する死亡確率\({}_nq_x\)
px 区間\((x, x + n)\)に関する生存確率\({}_nq_x\)
lx 出生10万人のうち\(x\)歳における生存数\(l_x\)
dx 区間\((x, x + n)\)における死亡数\({}_nd_x\)
spx \(x\)歳の定常人口.\(x\)歳の生存人口が\(x + n\)歳に至るまでの延べ人年(静止人口).
sx 生存比率\({}_nS_x\).生命表人口における年齢階層\((x, x + n)\)の割合.
tx \(x\)歳以降の定常人口.\(T_x = \sum_{t \ge x} L_t\)
ex \(x\)歳における平均余命.\(e_x = T_x / l_x\)
ax \((x, x + n)\)の間に死亡した人口の平均生存年数\({}_na_x\)

fertility

列名 内容
loc_id 国・地域コード
projection 予測コード
period 5年間隔期間.1950-1955, …, 2095-2100
mid_period 期間中央年(1月1日)
age_grp 年齢階層
age_start 年齢階層開始年齢
age_span 年齢階層間隔
births 出生数(1000人)
asfr 年齢特殊出生率(女性1000人あたり)

location

列名 内容
loc_id 国・地域コード,SO-3166の3桁数値.
loc_name 国名,地域名
iso3 ISO3桁の国・地域コード
loc_type 国・地域タイプ
region 地域番号
major_area メジャー地域コード
ldr 1 = Less developed regions
0 = More developed regions
ldc 1 = 後発開発途上国(Leaste Developed Countries)
income HIC = 高所得国
UMIC = 高位中所得国
LMIC = 低位中所得国
LIC = 低所得国
hiv 1 = WPP2015においてHIV/AIDSによる死亡率を勘案した国
less90000 1 = 2015年央において人口が9万人以下の国・地域
note ノート番号

loc_type

列名 内容
code loc_typeコード = location.loc_type
name 国名,地域タイプ

region

列名 内容
code regionコード = location.region
name 地域名

major_area

列名 内容
code Major Areaコード = location.major_area
name メジャー地域名

loc_note

列名 内容
code Noteコード = location.note
name ノート内容