kilometer’s

a junk space

[研究関連]  [R関連] [書評] [その他]

home


書評:『Rによる地理空間データ解析入門』

Chris Brunsdon(著), Lex Comber(著), 湯谷 啓明(訳), 工藤 和奏(訳), 市川 太祐(訳),
共立出版, 2018年 [link]

@dichikaさんよりご恵贈いただきました

以下ご紹介しますが、僕は地統計の専門家ではない事をご承知ください。ただ、地統計分野で発展した空間的な自己相関構造を考慮した統計モデルの取り扱いについては高い応用可能性があるように思います。というのも地統計は基本的に2次元データを想定していますが、根本的なアイディアは高次元空間にも活かせるものが沢山あります。そういう意味で、(僕のような)非ジオ民族でもこの本を手に取る価値はあるかと思います。

まず全ページフルカラーで400ページという物量が凄いです。表紙の装丁から図表、見出し、コードブロックと全てに目が行き届いた丁寧な仕上がりでした。特にコードブロックの字体や、コメント・出力部分はグレーにするなど手がかかっています。とても読みやすかったです。僕は技術本を読むときには、何か学んだなというページの上端を折りながら進めるようにしています。この本の場合(初読時)は、写真右の様な結果になりました。これを元にピンときた点を紹介します。

第2章 データとプロット・第4章 Rとプログラミングでは、主に初心者向けに、本書に必要なRを用いたデータ操作やプログラミングの基礎知識がまとめられています。基本的にplotで図が構成されているのでエデュケーションも大変だろうなという印象でしたが素直な書き方で好印象でした。plotのXYアスペクト比を合わせるとかpointsを半透明で書き込むとか、地統計っぽい小技がなるほどと思いました(最近ではggplot2を使ってしまいますが)。さらりとですが関数のデバッグまで触れていて、充実した内容でした。

本書のメダマは、第6章 Rによるポイントパターン解析と、第7章 Rによる地理空間属性分析の2章かなと思います。この辺りの特に数学的取り扱いは、以前に『Statistics for Spatio-Temporal Data』 Noel Cressie, Christopher K. Wikleで勉強した事がありましたが詳細はそれなりに難しかったです(以前にQiitaに少し書きました; 確率場と定常性、Simple Kriging)。本書のような丁寧な日本語解説はそれだけで読む価値があると思います。ここで紹介されているカーネルやクリギングといったモデル表現の基礎知識の先には、カーネル多変量解析やガウス過程といった他分野でも多く使われる応用があるので、欲を言えばその辺りの広がりを予感させてもらえたら尚良かったように思います。もちろん話題を広げ過ぎるのもトレードオフで、本書では(補章のsfパッケージの紹介も含めて)実装に必要な知識に絞ったという事でしょう。

その他の章については、非ジオ民&非スクレイピング民には評価不能でしたが読み物としては面白かったです。位置ログのビックデータ化と産業応用がどんどん進む中、本書の様な(正に)地に足のついた統計的解説を含んだ良書を読む価値は高いと思います。

1つだけ難点を言うと、変数や関数のオブジェクト名にピリオドを含むもの(tree.heightsのように)がガンガン出てきて、お作法としてはあまり良くないなと思いました。この訳者の布陣でしたら当然お気づきの事と思われますので原書がそうなのでしょう。プログラミングの基礎パートでclassやmethodの紹介をされていただけに、アンダースコアで(tree_heightsのように)書いて欲しかったなと思います。原書の第2版が2019年に出版されるようなので、tidyverseを用いたデータ処理の組み込み、sfパッケージの最前線とあわせて注目したいと思います。


2018年12月26日