博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
R概率分布函数使用小结
阅读量:6300 次
发布时间:2019-06-22

本文共 713 字,大约阅读时间需要 2 分钟。

记要
今天在计算分类模型自行区间时,用到了R中正太分布的qnorm函数,这里做简单记要,作为备忘。
R中自带了很多概率分布的函数,如正太分布,二次分布,卡放分布,t分布等,这些分布的函数都有一个共性,每个分布拥有4个带有d,p,q,r前缀的函数。比如正太分布,有dnorm,pnorm,qnorm和rnorm。这几个前缀的意义如下:
  • d  Density的缩写,表示密度函数。举个例子,标准正太分布x=0对应的值可以用dnorm(0)计算
  • p  Probability的缩写,表示概率函数。举个例子,标准正太分布从负无穷大到0的概率,可以用pnorm(0)计算
  • q  Quantile的缩写,表示分位函数。举个例子,如果知道标准正太分布从负无穷大到x的概率是0.9678,想要知道这个x的值,可以通过qnorm(0.9678)计算。
  • r Random的缩写,表示随机函数。用于随机生成符合正太分布的数值,举个例子,如果想随机生成10个符合标准正太分布的函数,可以用rnorm(10)来获得。
在R命令行中输出“?pnorm”,可以了解更多详细情况。
 
心得体会
最近在学习数据挖掘中的一些分类模型,由于才入门不久,以前总认为概率在数据挖掘在没多大用处,直到昨天才知道原来挖掘模型的精度评估和比较可以
建立在统计学分析框架上。比如评估一个分类模型,计算其准确度的自行区间就是通过二项分布近似到正太分布计算。再比如,评估两个模型是否有差异,这个通过假设检验和卡放分布验证。
 
参考:《数据挖掘导论》 Pang-Ning Tan 4.6节

转载于:https://www.cnblogs.com/bourneli/p/3163437.html

你可能感兴趣的文章
Swift 5进入发布倒计时
查看>>
从把事做对到做对的事
查看>>
Kubernetes 1.14 版本发布:正式支持Windows 节点,持久化本地卷进入GA
查看>>
回顾小程序2018年三足鼎立历程,2019年BAT火力全开
查看>>
IPv6新形势下的安全解决方案
查看>>
有赞搜索系统的架构演进
查看>>
何时该用无服务器,何时该用Kubernetes?
查看>>
支持多种小程序!阿里云ARMS推出小程序监控
查看>>
你不知道的 JS 错误和调用栈常识
查看>>
微服务架构适用场景分析
查看>>
基于requirejs的vue2项目 (一)
查看>>
上学还是坐牢?百年老校“监控”学生惹争议
查看>>
关于HTTPOXY漏洞的分析说明
查看>>
最重要的就是做正确的事
查看>>
敏捷和架构设计分道而行,又最终拥抱彼此成为朋友
查看>>
用户故事 | 刷算法面试题的4种思考方式
查看>>
书评:《All About Java 8 Lambdas》
查看>>
在市场营销中使用敏捷方法:过程、团队与成功案例
查看>>
新书问答:Agile Management
查看>>
苹果将iOS应用带入macOS
查看>>