如何从python中的正态分布计算百分位数?

问题陈述 - 随机变量 X 是 N(25, 4)。求 X 的指定百分位数:

一个。第 10 个百分位

湾。第 90 个百分位

C。第 80 个百分位

d。第 50 个百分位

尝试 1

我的代码:

import numpy as np
import math
import scipy.stats
mu=25
sigma=4
a=mu-(1.282*4)
b=mu+(1.282*4)

... 像那样。我从 https://sphweb.bumc.bu.edu/otlt/mph-modules/bs/bs704_probability/bs704_probability10.html 中给出的 Zscore 表中得到了值

尝试 2

X=np.random.normal(25,4,10000) # sample size not mentioned in 
                                 problem. I just assumed it
a_9 = np.percentile(X,10)
b_9 = np.percentile(X,90)
c_9 = np.percentile(X,80)
d_9 = np.percentile(X,50)

但是根据实践平台的隐藏测试用例,答案是不正确的。谁能告诉我计算答案的正确方法?是否有任何 scipy.stats 功能?

stack overflow How to compute the percentiles from a normal distribution in python?
原文答案

答案:

作者头像

您可以使用 scipy.stats 和内置的 ppf 函数(看 documentation

import numpy as np
import scipy.stats as sps
import matplotlib.pyplot as plt

mu = 25
sigma = 4

# define the normal distribution and PDF
dist = sps.norm(loc=mu, scale=sigma)
x = np.linspace(dist.ppf(.001), dist.ppf(.999))
y = dist.pdf(x)

# calculate PPFs
ppfs = {}
for ppf in [.1, .5, .8, .9]:
    p = dist.ppf(ppf)
    ppfs.update({ppf*100: p})

# plot results
fig, ax = plt.subplots(figsize=(10, 4))
ax.plot(x, y, color='k')
for i, ppf in enumerate(ppfs):
    ax.axvline(ppfs[ppf], color=f'C{i}', label=f'{ppf:.0f}th: {ppfs[ppf]:.1f}')
ax.legend()
plt.show()

这给出了 enter image description here

作者头像

使用 scipy.stats.norm 中的 ppf 方法(正态分布)。

scipy.stats.norm.ppf(0.1, loc=25, scale=4)

该函数类似于 r 中的 qnorm 函数。 ppf 方法给出给定百分位的随机变量的值。

作者头像
a_9 = 19.88
b_9 = 30.12
c_9 = 28.36
d_9 = 25.00

X = np.random.normal(25,4,10000000)