基本統計量の確認方法

4.3. 基本統計量の確認方法#

pandas以外でも平均値・中央値・最頻値・偏差・分散を確認してみましょう

ここでは、numpystatisticsscipyを紹介します。

from statistics import mean, median, mode, stdev, variance
import numpy as np
from scipy import stats

まずはstatisticsを用いて求めます。

new_list = [1, 3, 5, 8, 15, 15, 16, 120, 500] #list


print('new_list')
print('mean\t:', mean(new_list))
print('median:', median(new_list))
print('mode\t:', mode(new_list))
print('var\t:', variance(new_list)) # statisticsのvarとstdはdefaultで`n-1`で割っています
print('std\t:', stdev(new_list))
new_list
mean	: 75.88888888888889
median: 15
mode	: 15
var	: 26671.61111111111
std	: 163.31445469128295

次にnumpyなどを用いて求めます。

print('mean\t:', np.mean(new_list)) 
print('median\t:', np.median(new_list))
print('mode\t:', stats.mode(new_list))
print('var\t:', np.var(new_list)) # numpyのvarとstdは`n`で割っています 上のcellの結果と比べてみてください。
print('std\t:', np.std(new_list))
mean	: 75.88888888888889
median	: 15.0
mode	: ModeResult(mode=15, count=2)
var	: 23708.098765432096
std	: 153.97434450398578