読者です 読者をやめる 読者になる 読者になる

648 blog

kyamanekoです。IT、思想、哲学、心理学などの記事を書いています。

おすすめ書籍 改訂2版 データサイエンティスト養成読本

おすすめ書籍 改訂2版 データサイエンティスト養成読本

『改訂2版 データサイエンティスト養成読本』という本を買った。

データ分析初心者をはじめ、Rや統計のことを学んでみたいエンジニアにおすすめの良書だった。

そこで今回は、本書について紹介したい。

 

目次

「データサイエンティスト養成読本」の概要

全体としては

データサイエンスの実践に関して、広く様々なことを学べる書籍だった。

実際に動かせるRやPythonのコードが掲載されており、手を動かしながら学べる点がよかった。
社内で実務として取り組む際の、現実的な考察やアドバイスも参考になった。

キーワードを拾いながら読もう

本書のトピックが幅広いためか、展開が早かった。

統計の専門的なことやコマンドについてはあまり解説がないので、適宜調べながら読んでいく必要はありそうだ。

(検索すればわかることははしょって、流れの説明に集中されている感じだった。それはそれで、無駄がなくて読みやすかった)

エンジニアにもおすすめ

本書では座学的な要素もあったが、コードを書きながら学んでいく箇所が多かった。

個別の要素は初歩的なものだが、コンピュータ自体が苦手というレベルの方だと難しいかも知れない。

逆に、統計やRやPythonでのデータ解析を触ってみたいというエンジニアには、最適な書籍だと思う。

深層学習ブームの中で

最近は深層学習(ディープラーニング)が注目を浴びているが、そちらのキーワードから勉強をはじめると、たいてい、画像の分類などからスタートすることになる。

それはそれでよさそうだが、一方で本書で取り上げているような、データサイエンスやデータマイニングから入っていくことで、実務に近い部分から学んでいける気がする。

本書の構成

本書は以下のような構成になっていた。外観や構成は『ムック』といった感じだ。

巻頭企画 データサイエンティストの仕事術
 第1章 データサイエンティストに必要なスキル
 第2章 データサイエンスのプロセス
 第3章 「ビッグデータインフラ」入門

特集1 データ分析実践入門
 第1章 Rで統計解析をはじめよう
 第2章 RStudioでらくらくデータ分析
 第3章 Pythonによる機械学習
 第4章 データマイニングに必要な11のアルゴリズム

特集2 マーケティング分析本格入門
 第1章 Rによるマーケティング分析
 第2章 mixiによる大規模データマイニング事例
 第3章 ソーシャルメディアネットワーク分析

特別記事 Fluentd入門

特別企画 データ分析のためにこれだけは覚えておきたい基礎知識
 第1章 SQL入門
 第2章 Webスクレイピング入門
 第3章 Tableau実践入門

記事ごとのメモ

巻頭企画 データサイエンティストの仕事術

データサイエンスによって収益を上げるために、実務の中でどういった取り組みが必要になるかを解説していた。

『データサイエンティストは業務を深く理解する必要がある』
『チームの反発を受けないように配慮して取り組む必要がある』

といったアドバイスは実用的だった。

また、HadoopやRDBMSによるビッグデータの管理手法について概要が書かれており、ビッグデータの扱いについて俯瞰的に把握できた。

特集1 データ分析実践入門

RやPythonを使ったデータ分析を実習的に学べる記事になっている。

構成がよくできており、はじめから順番にサンプルコードを打ち込んでいけば、自然と作業の流れが頭に入ってくる。

統計と機械学習について、アルゴリズムの概要を広く学べる記事だった。

特集2 マーケティング分析本格入門

Rを中心に、分析したいケースごとの方法論が紹介されていた。

顧客アンケートに基づくポジショニング分析はわかりやすかった。

WebサイトのA/Bテスト結果のカイ二乗検定と多変量解析については、Webサイトの成果分析を定量化するヒントになりそうだ。

mixiのレコメンドシステムを構成する、Hadoopインフラの具体的な設計手法が書かれていた。

RによるSNS分析の方法論も、興味深い。

特別記事 Fluentd入門

データ解析の際に問題となるログ取得問題を解決する、Fluentdの紹介だ。ひとつの方法として、参考になった。

特別企画 データ分析のためにこれだけは覚えておきたい基礎知識

分析者向けのSQL解説は、ポイントが絞ってありわかりやすかった。

Pythonのimport.ioやscrapyを使用したWebスクレイピングの記事も、結構おもしろかったので、もっと個人的にも試してみたくなった。

有名なBIプラットフォームのTableau(タブロー)については、顧客データや売り上げデータを分析するサンプルがまとめられていた。

まとめ

今回は、『改訂2版 データサイエンティスト養成読本』についての紹介をさせてもらった。

データ解析に興味があったら、ぜひ入手して頂きたい。




Amazon.co.jpアソシエイト