4.3. 基本統計量の確認方法#
pandas以外でも平均値・中央値・最頻値・偏差・分散を確認してみましょう
ここでは、numpy
とstatistics
、scipy
を紹介します。
from statistics import mean, median, mode, stdev, variance
import numpy as np
from scipy import stats
まずはstatistics
を用いて求めます。
new_list = [1, 3, 5, 8, 15, 15, 16, 120, 500] #list
print('new_list')
print('mean\t:', mean(new_list))
print('median:', median(new_list))
print('mode\t:', mode(new_list))
print('var\t:', variance(new_list)) # statisticsのvarとstdはdefaultで`n-1`で割っています
print('std\t:', stdev(new_list))
new_list
mean : 75.88888888888889
median: 15
mode : 15
var : 26671.61111111111
std : 163.31445469128295
次にnumpy
などを用いて求めます。
print('mean\t:', np.mean(new_list))
print('median\t:', np.median(new_list))
print('mode\t:', stats.mode(new_list))
print('var\t:', np.var(new_list)) # numpyのvarとstdは`n`で割っています 上のcellの結果と比べてみてください。
print('std\t:', np.std(new_list))
mean : 75.88888888888889
median : 15.0
mode : ModeResult(mode=15, count=2)
var : 23708.098765432096
std : 153.97434450398578