Rを使ったデータ分析(実践編)1

データのダウンロード 厚生労働省のホームページの「(3)過去の食中毒事件一覧」から以下の3つのデータをダウンロードします。 令和元年(2019年)食中毒発生事例 平成30年(2018年)食中毒発生事例 平成29年(2017年)食中毒発生事例 ダウンロードする際、…

ggplotとjpndistrictで地図を書く①

まず必要となるパッケージをR studioに読み込みます。 library(tidyverse) #ggplot2などでグラフを作成する、データをきれいにするために使用 library(sf) #sf(simple features)のデータを扱うのに使用 library(jpndistrict) #元となるデータ 先ほど読み込ん…

maptoolsで日本の地図を描く

readShapePoly関数を使うため、maptoolsをlibraryで読み込みます。 library(maptools) 3種類の日本地図を描くため、GADM(https://gadm.org/index.html)から日本のデータ(shapefile)をダウンロード・展開し、使用しているdirectoryにデータを保存しておきます…

Rで地図を描いてみよう② 色分けする

USArrestsのデータを使って、アメリカの州ごとに殺人数で色分けします。 library(maps) library(plyr) USArrestsの先頭列にstateという新しい列を作り、そこに小文字にした州名を入れ、crimesとして保存します。同様にstateのデータをstates_mapに保存します…

Rで地図を描いてみよう

今回はRを使って地図を描いてみます。 # ggplot2、maps、mapdataをRに読み込み library(ggplot2) library(maps) library(mapdata) 次にアメリカ合衆国のデータをstate.mapに保存します。map_dataはggplot2に含まれている関数の一つで、データフレームをggplo…

データの部分集合化(subset関数)

今回はRにデフォルトで内蔵されているmtcarsのデータを使って、データの部分集合化を学びます。mtcarsは1973~1974年の車のモデルについてそのデザインとガソリンの消費量に対する性能を評価したデータです。まずmtcarsのデータがどのようなものか見てみまし…

vapplyとtapplyの使い方について

この記事はRstudioのSwirlの「11: vapplyとtapply」を参照しています。 まずFlagsというデータセットをRに読み込みます(Swirlを使用している場合、自動的に読み込まれます。)。 参考までにflagsのsummaryの結果を示します。 > summary(flags) name landmas…

lapplyとsapplyの使い方について

この記事はRstudioのSwirlの「10: lapply and sapply」を参照しています。 まずFlagsというデータセットをRに読み込みます(Swirlを使用している場合、自動的に読み込まれます。)。 データ名:Flags table { border-collapse: collapse; } th { border: sol…