本書(翻訳)の初版が2013年。まだdplyr/tidyverse革命が始まるまえだったのではないでしょうか。本書は「ggplot2によるグラフ作成レシピ集」というサブタイトルがついているように確かにggplot2を使っていくための「アイデア集」ではありますが、ggplot2を使うために必要なデータの前処理がいささかわかりにくかったという感想をもっています。第15章が「前処理」ですが、この部分が第2版になってdplyr/tidyverseになり、かなりスッキリしました。
そもそもggplot2は、tidyverseの重要な一部なわけですから、こうした構成になることですっきりしたということだと思います。tidyverseの基本は『Rではじめるデータサイエンス』で、だと思うので、この二冊が必携本となりますね。
で、初版で気になっていたmosaic plotの関連情報、どうなっているかみましたら、治ってません!
本書はggplto2を中心にしたレシピ集ですが、それ以外のツールも使います。その一つがMichael Friendly によるvcd::mosaic でした。本文ではvcd::mosaicの説明がされているのですが、「関連項目」に紹介されていたヘルプのリンクは、base::mosaicplot。これ、vcdのmosaic plot とは別なんですよね。第2版でもそのままではないですか。なんだろうなぁ(^^;)。原著の誤りなんですけど…。
あと、誤記ではないけど、現状versionでは解決されていることして、第2版のp369にあるshowtextの説明のこと。これggplot2でフォントを活用するパッケージなのですが、2019の時点では「RStudioのビューアーペインでは正しく動きません」だったようですが、私がFactoMineRのver2.0リリースあとで試した時はうまく動くようになっていました。本書の日本語版の付録Bとして日本語フォントの利用説明がありますが、実は、ここにある方法を使っても、散布図のplotエリア内のラベルに日本語が使えなかったのです。それを、このshowtextは可能にしてくれた、という優れものです。
この件は、このblogのここに書きました。
Tokyo.R#83 (2020/01)での報告スライドはここにあります(「ggplotのplotエリアで日本語ラベルを使う」)
あと、上で触れましたvcd::mosaicは、日本語を使うのにちょっと設定が必要です。それについてTokyo.R#69(2018/04)で報告したものがここにあります。
やっかいなことに、このvcd::mosaicで日本語を使うためには、showtext_auto =FALSEを設定しないといけないのですが、まあ、チャンクごとに意識すればなんとかなります。