March 17, 2018

Rで統計学入門 記録3

はじめに 前回は以下の学習をしました。 相関係数 今回は統計学入門の 2.2 代表値で挙げられている以下の平均について学習します。 算術平均 幾何平均 調和平均 算術平均 算術平均は相加平均とも呼ばれます。 観測値が連続的なデータ (例: 試験の得点) の場合に使います。 下記の数式で\(\overline{x}\) (エックスバー) を求めます。 \[ \overline{x} = \frac{x_1 + x_2 + \cdots + x_n}{n} \] あるいは、このように表すと便利かもしれません。 \[ \overline{x} = \frac{1}{n} \sum_{i=1}^n x_i \] 算術平均は全てのデータを考慮できる反面、外れ値(異常に大きい値,小さい値)に弱いことが挙げられます。 例題1 国語テストの点数 六人の国語のテストの点数はそれぞれ 52,52,70,72,80,100 点であった。テストの点数の平均を求めよ。 平均値,中央値,最頻値の求め方といくつかの例 | 高校数学の美しい物語 https://mathtrain.jp/daihyochi これを先述の数式に当てはめると以下になります。 \[ \overline{x} = \frac{52 + 52 + 70 + 72 + 80 + 100}{6} = \frac{426}{6} = 71 \] Read more

March 13, 2018

Rで統計学入門 記録2

はじめに 前回は以下の学習をしました。 R Studioの環境構築 R Studioの基本操作 線形回帰 (浅め) 今回は相関係数について学習します。 相関係数 データサイエンティスト養成読本 (2016年の第2版) の「特集1 第1章 Rで統計解析をはじめよう」によると、 2つの変数の相関の度合いを表す相関係数があります。この値の意味するところは以下のようになっています。 |r| = 0.7 ~ 1 : 強い相関あり |r| = 0.4 ~ 0.7 : やや相関あり |r| = 0 ~ 0.2 : ほとんど相関なし 前回の「例題2 体重と身長」を使って相関係数を求めてみます。 # コード body_data <- read.csv("body_sample.csv", header = T, stringsAsFactors = F) men <- body_data[body_data$gender=="M",] female <- body_data[body_data$gender=="F",] cor(body_data$height, body_data$weight) cor(men$height, men$weight) cor(female$height, female$weight) # 結果 > cor(body_data$height, body_data$weight) [1] 0. Read more

March 11, 2018

Rで統計学入門 記録1

はじめに タイトルに統計学入門とありますが、何か新しいことを覚えようかなと思い、近くの本屋でぶらぶらしていたら、データサイエンティスト養成読本 (2016年の第2版) のこの辺りを読み始め、気がついたら購入していたので、記録をつけることにしました。 特集1 第1章 Rで統計解析をはじめよう 特集2 第1章 Rによるマーケティング分析 読み進めていくと、いくつか理解が追いつかない部分があったので、以下の資料で補うことにしました。 統計用言語Rの使い方 インストール MacにRとR Studioをインストールします。私のmacOS環境は以下の通りです。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.12.6 BuildVersion: 16G1212 $ echo $SHELL /usr/local/bin/zsh $ zsh --version zsh 5.3.1 (x86_64-apple-darwin16.6.0) RとR Studioのインストーラーを以下から入手します。 R (執筆当時、R-3.4.3.pkg を使用しました。MD5: d51d0869f3cbe0d782eede113897393a) R Studio (執筆当時、RStudio 1.1.423 - Mac OS X 10.6+ (64-bit) を使用しました。MD5: 3e3e3db076b44f3c5276eb008614b4cf) 必須ではありませんが、配布サイトがインストーラーのハッシュを掲載していますので、ダウンロードしたファイルのハッシュを以下のように取得すれば照らし合わすことができます。 $ openssl md5 ./RStudio-1.1.423.dmg $ openssl md5 ./R-3.4.3.pkg インストール自体は画面の指示に従って進めます。 Read more