EXCEL生成任意二级比例分布随机数_随机数_学院_累计

现有某大学各学院学生人数信息表如下:

图1:各学院学生人数信息表

每个学院下属不同专业及学生比重如下:

图2:学院下属专业名称和学生人数比例

随机抽取一名学生,他(她)属于会计学院的概率为0.16,属于会计学院且审计学专业的概率为0.16 X 0.2 = 0.032,如果大学共有5000名学生,会计学院审计学专业学生数为0.032 X 5000 = 160人。

由此,构造学院及专业人数二级比重学生人数(5000人)表如下:

展开全文

图3:学院及专业人数二级比重学生人数

【图3】中,【E3=D3*INDEX(Sheet1!B$2:B$9,MATCH(Sheet2!B3,Sheet1!A$2:A$9,0))】根据学院及专业人数二级比重和总人数(5000人)计算出各专业学生数。

任何通过下面四个步骤,按各专业学生人数模拟5000名学生所属学院和专业。

第一步:计算累计学生数

图4:F列计算累计学生人数

第二步:运用公式【RANDBETWEEN(1,5000)】生成5000个1-5000的随机整数

图5:在H列生成5000个1-5000的随机整数

第三步:运用公式【I2=COUNTIF(F$2:F$25,"<"&H2)+1】确定每个【随机数】在【累计人数】中的【区间序号】

图6:I列为每个随机数的【区间序号】

提示:图6中单元格【I2】中公式【=COUNTIF(F$2:F$25,"<"&H2)+1】根据相邻H列随机数大小,利用COUNTIF函数统计随机数在累计比例中的排序位置做为成绩序号。例如,第5个随机数值为750,在累计人数中比750小的数有三个(240、480、600),所以随机数750区间序号为3+1=4。

基本原理:“分组比例越大、累计比例区间越宽,随机数落入的概率越大”。

第四步:根据【区间序号】运用INDEX提取学院和专业名称

图7:J列和K列分别为5000名学生的【学院】名称和【专业名称】

根据二次分组样本比例(概率)生成随机数的基本技巧为:

I、构造累计二级比例(概率)序列;

II、生成随机数;

III、根据累计二级比例(概率)序列确定随机数序号;

IV、根据随机数序号提取分组名称。

最后需要强调的是,统计数据模拟不是统计数据造假,统计数据模拟的主要用途是在缺乏真实数据或实验条件受限的情况下,通过模拟生成大量逼真的数据样本,以便进行数据分析和建模。

特别声明

本文仅代表作者观点,不代表本站立场,本站仅提供信息存储服务。

分享:

扫一扫在手机阅读、分享本文