kilometer’s

a junk space

[研究関連]  [R関連] [書評] [その他]

home


書評:『AI・データ分析プロジェクトのすべて』

大城 信晃(監修・著者) (著), マスクド・アナライズ (著), 伊藤 徹郎 (著), 小西 哲平 (著), 西原 成輝 (著), 油井 志郎 (著)
技術評論社, 2020 [Amazon]

著者の1人、伊藤さんよりご恵贈いただきました。ありがとうございます。

本書はいわばデータサイエンティストの「標準脳」だと感じました。

写真左が表紙(格好いいバッテンは、掛け算マークなんですね!)で、右は恒例?の学びがあったページの端折り結果です。

本書は、一線級で活躍されるデータサイエンティスト・AI開発エンジニアの方々によるAIを用いたデータ分析プロジェクトにおいての標準的なマインドセットを網羅しています。話題は多岐にわたり、端折ったところから拾い上げると開発のワークフロー(p. 12)、データに関わる法律(p. 100)、KPIの設計と評価(p. 126)、本番運用までの流れ(p. 206)、メンバーの育成(p. 255)といった具合です。

ちょっと遠ざかりますが、Google Mapが上手いのは、地球が世界に1個しかないからMapは(1時点では)必ず1つに決まるはずという点です。神経科学者も脳の機能の局在や解剖学的構造を調べるうえで「脳地図」を作ります。ところが世界に78億個以上あるヒトの脳の地図はそれぞれ微妙に異なっていますので、代表的な1つを選んで調べればそれでOKというわけにはいきません。そこで研究者は大量の脳地図を集めてきて平均像を描き、この標準脳を基準として用いるということにしています。これは例えば、平均顔に似ています。何人も何百人も顔の写真を重ねていって平均的な顔を描くと「美しい顔」が出来上がるというあれです。本書も著者らそれぞれが持つ当該分野のマインドセットの重ね合わせ像になっており、現在の業界標準を知るには最適です(そして美しい仕上がりになっています)。

私は「ビジネス×技術」のうち、技術はともかくビジネス分野には全く門外漢なので、なるほどこういう目線でものを考えるのかとか、この用語(例えば「実験」や「研究」など)はビジネスの場ではこうした意味を持つのかと徒然と学ぶことができました。特に概念実証(Proof of Concept, PoC, p.16など)から先の話は神経科学の研究で携わることはありませんので、新鮮でした。How toに関する内容では、AutoML (p. 212)やクラウドサービス (p. 216)のサマリなどは現状の全体像を知る上でとても有効だと思います。

一点挙げるとすれば、私のようなお外のヒトには馴染みのない単語がいくつかあり、これは不勉強の至りなのですが、例えばベンダーやECサイトといった単語がもはや分からないという始末です。APIはフンワリ分かりますが、KPI、CVR、データウェアハウスといった言い回しもほぼ初見です。本書の主な読者層では常識なのだとは思いますが、ビジネス門外漢からすると時々ググりながら読むという感じでした(それはそれで良いことだと思います)。


2020年12月26日