重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
Python正态分布概率计算方法,喜欢算法的伙伴们可以参考学习下。需要用到math模块。先了解一下这个模块方法,再来写代码会更好上手。
盘锦ssl适用于网站、小程序/APP、API接口等需要进行数据传输应用场景,ssl证书未来市场广阔!成为创新互联的ssl证书销售渠道,可以享受市场价格4-6折优惠!如果有意向欢迎电话联系或者加微信:13518219792(备注:SSL证书合作)期待与您的合作!
def st_norm(u):
'''标准正态分布'''
import math
x=abs(u)/math.sqrt(2)
T=(0.0705230784,0.0422820123,0.0092705272,
0.0001520143,0.0002765672,0.0000430638)
E=1-pow((1+sum([a*pow(x,(i+1))
for i,a in enumerate(T)])),-16)
p=0.5-0.5*E if u0 else 0.5+0.5*E
return(p)
def norm(a,sigma,x):
'''一般正态分布'''
u=(x-a)/sigma
return(st_norm(u))
while 1:
'''输入一个数时默认为标准正态分布
输入三个数(空格隔开)时分别为期望、方差、x
输入 stop 停止'''
S=input('please input the parameters:\n')
if S=='stop':break
try:
L=[float(s) for s in S.split()]
except:
print('Input error!')
continue
if len(L)==1:
print('f(x)=%.5f'%st_norm(L[0]))
elif len(L)==3:
print('f(x)=%.5f'%norm(L[0],L[1],L[2]))
else:
print('Input error!')
c(下面是总数,上面是出现的次数)。看式子比较容易明白。如:c(上面是2,下面是3)=(3*2)/(2*1)=3。上面的数规定几个数相乘,数是从大往小
R编程语言已经成为统计分析中的事实标准。但在这篇文章中,我将告诉你在Python中实现统计学概念会是如此容易。我要使用Python实现一些离散和连续的概率分布。虽然我不会讨论这些分布的数学细节,但我会以链接的方式给你一些学习这些统计学概念的好资料。在讨论这些概率分布之前,我想简单说说什么是随机变量(random variable)。随机变量是对一次试验结果的量化。
举个例子,一个表示抛硬币结果的随机变量可以表示成
Python
1
2
X = {1 如果正面朝上,
2 如果反面朝上}
随机变量是一个变量,它取值于一组可能的值(离散或连续的),并服从某种随机性。随机变量的每个可能取值的都与一个概率相关联。随机变量的所有可能取值和与之相关联的概率就被称为概率分布(probability distributrion)。
我鼓励大家仔细研究一下scipy.stats模块。
概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布。
离散概率分布也称为概率质量函数(probability mass function)。离散概率分布的例子有伯努利分布(Bernoulli distribution)、二项分布(binomial distribution)、泊松分布(Poisson distribution)和几何分布(geometric distribution)等。
连续概率分布也称为概率密度函数(probability density function),它们是具有连续取值(例如一条实线上的值)的函数。正态分布(normal distribution)、指数分布(exponential distribution)和β分布(beta distribution)等都属于连续概率分布。
若想了解更多关于离散和连续随机变量的知识,你可以观看可汗学院关于概率分布的视频。
实验室室间质评项目绕不开的大佬——李金明,前一段时间看基因谷发了他的PPT(但是水印怎么是基因狐啊喂),正好从中了解些的临床的相关规范(其实我想找生信相关要点,但好像并没有...)。
说实话,之前在上家做微生物多样性相关科研服务时候,对参数这块定的不是特别死,有时候流程固定参数达不到合同要求交付的测序量,经常会改改overlap,改改最大错配。可能也是因为这种比较低端,pipeline不断,每天流水线式的能交100来个,颇有种来测序、送分析的意思。
简单记录下其中几个概率的计算
题为:平常病人阳性率为10%,一次检测25个标本,求获得6个阳性或6个以上结果的概率,概率为1-(获得0个或1个或2个或3个或4个或5个阳性结果的概率)
注:细看ppt其实是有些小问题的,没有写P(5)
题为:一个实验室中,一个项目每次检测结果阳性率为2%,100个样本中出现8个阳性结果概率
题为:一次检测100个标本的项目中,2个阳性结果连续出现的概率
题为:一次检测100个标本的项目中,3个阳性结果连续出现的概率
注:样本间交叉污染的概率解读
首先假设每次检测样本,是阴性或是阳性都是独立的事件,那么
做n个样本,任意取其中r个,相邻的情况有 n-r+1 种
做n个样本,任意取其中r个,所有情况有 种
P=
假定检测样本的结果都是独立的,那么其r个阳性连续出现概率大于P,则说明r次连续的阳性结果存在正相关,可能是样本间污染(小概率事件在小规模样本数中发生)
那么,当样本数极大时候,如果其r个阳性连续出现概率小于P,那么也能说明r次连续的阳性结果存在负相关,相邻样本间结果存在拮抗(小概率事件在大规模样本数中仍不发生)
李金明:临床基因扩增检测质量保证(PPT全文)