就活生のみなさん、こんにちは!
ディーネット新卒採用チームのつっちゃんです。
今回は、ディーネットで行われている勉強会について、ご報告します。
ディーネットでは、AWSを中心にクラウドビジネス事業を推進していますが、そもそも「ものつくりの心」というエンジニアとして一番大切な部分を重要視しています。その「ものつくりの心」のエンジニアとして、開発メンバーも就業しており、今回は、その開発メンバーが取り組む『統計学』の勉強会について、ご報告します。
============================================================
目標(ゴール):統計検定3級に合格
データの種類(
量的変数 = 身長・体重(数値データ)
質的変数 = 性別・趣味(数値化できない)
名義尺度 = 血液型(区別するだけ)
順序尺度 = 金メダル・銀メダル・銅メダル(銅メダルを何個あっても、金銀メダルの代わりにはならない)
間隔尺度 = 温度・時間・日付
)
標本調査と実験(
母集団 = 全てのデータ
標本 = ランダムに選んだ一部のデータ
実験の基本的な考え方
国勢調査 = 一部のデータから全体を推測する
)
時系列データ(
時系列グラフ = 横軸が時間、縦軸が値のグラフ
指数(指標)= 割合・比率を定義して使う。就職率・成婚率など
移動平均 = 複数のデータの平均をグラフ化
)
データの散らばりの指標(
四分位数 = データを小さい順に並べて25%(Q1=第1四部位数),50%(Q2=中央値),75%(Q3=第3四分位数)の区切り値の事。
四分位範囲 = Q3 マイナス Q1 で表される。データの散らばり具合・ばらつきを見る。
偏差 = 個々のデータの平均からの差
分散 = 個々のデータの平均からの差分を二乗(平均以下もプラスの値)して、全て足して個数で割る。
平均からの個々のデータのばらつきを表す
標準偏差 = 分散だと2乗しているので平方根をとって、元の単位に戻す。平均値±標準偏差の値に68%のデータが収まる
変動係数 = 標準偏差/平均値。これもばらつきを表す。
)
データの散らばりのグラフ表現(
箱ひげ図 = 最大値・最小値・中央値・平均値・Q1・Q3を一度に表せるグラフの書き方。
はずれ値 = 異常値の事。年収一億円の人が居たら平均値が引き上げられてしまうので、除外する異常値の事
)
確率(
独立な試行 = コイントスがずっと表が出続けても、次回に影響を及ぼさない
条件付き確率 = 前提条件がある確率。学生をランダムに選んで、男だったら、運動部の確率は?
)
確率分布(
確率変数 = いわゆる確率。サイコロで6が出る確率は、1/6
確率変数の平均 = 期待値。サイコロの1個の期待値は3.5
確率変数の分散
二項分布 = 成功・失敗やコイントスの裏表など、結果が2種類しかない
正規分布 = 平均値・中央値・最頻値が同じ、最も多い分布
二項分布の正規近似 = 二項分布も回数が多くなってくると正規分布と同じになる
)
============================================================
ディーネットでは、このような社内勉強会を実施しています。ぜひ、もっと勉強したい方がいれば、会社説明で、その旨、担当者へお伝えください。
それでは、そんなディーネットへのエントリーお待ちしております。
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
ディーネットCOO谷がディーネットについて語っていますので、こちらも合わせてご一読ください。