tags: rBasicLearning
Summary()の使い方
使用するデータ
今回は, データとしてirisを使う.
library(datasets)iris
Summary()を使う場合
Summary()は, データの概観を数値で見たい時に使う.
質的データのSummary()
質的データのSummary()は, その変数ごとにどれくらいの度数が入っているかを数値で見ることができる.
視覚的に見たい時は, 棒グラフ(barplot)を使う.
summary(iris$Species)# Categorical variable>summary(iris$Species)# Categorical variablesetosaversicolorvirginica505050
irisSpecies<-table(iris$Species)barplot(irisSpecies)
量的データのSummary()
量的データのSummary()は, 最大値, 最小値, メジアン, 四分位数, 平均の数値を見ることができる.
これを視覚的に見たい時は, 箱ひげ図(boxplot)を使う.
summary(iris$Sepal.Length)# Quantitative variable>summary(iris$Sepal.Length)# Quantitative variableMin.1stQu.MedianMean3rdQu.Max.4.3005.1005.8005.8436.4007.900
boxplot(iris$Sepal.Length)
全体のSummary()
全体でSummary()を見ると, 以下のようになる.
今回は, 最大値, 最小値, メジアン, 四分位数, 平均の数値を見ることができる.
summary(iris)# Entire data frame>summary(iris)# Entire data frameSepal.LengthSepal.WidthPetal.LengthPetal.WidthSpeciesMin.:4.300Min.:2.000Min.:1.000Min.:0.100setosa:501stQu.:5.1001stQu.:2.8001stQu.:1.6001stQu.:0.300versicolor:50Median:5.800Median:3.000Median:4.350Median:1.300virginica:50Mean:5.843Mean:3.057Mean:3.758Mean:1.1993rdQu.:6.4003rdQu.:3.3003rdQu.:5.1003rdQu.:1.800Max.:7.900Max.:4.400Max.:6.900Max.:2.500