本文由 chengwujiaoyanshi 收集发布,转载请注明出处,如有问题请联系我们!高中数学选修1-2学业分层测评回归分析的基本思想及其初步应用 Word版含解析
学业分层测评
(建议用时:45分钟)
[学业达标]
一、选择题
1.在画两个变量的散点图时,下面叙述正确的是( )
A.预报变量在x轴上,解释变量在y轴上
B.解释变量在x轴上,预报变量在y轴上
C.可以选择两个变量中任意一个变量在x轴上
D.可以选择两个变量中任意一个变量在y轴上
【解析】 结合线性回归模型y=bx+a+e可知,解释变量在x轴上,预报变量在y轴上,故选B.
【答案】 B
2.(2016·泰安高二检测)在回归分析中,相关指数R2的值越大,说明残差平方和( )
A.越大 B.越小
C.可能大也可能小 D.以上均错
【解析】 ∵R2=1-,∴当R2越大时,
(yi-i)2越小,即残差平方和越小,故选B.
【答案】 B
3.(2016·西安高二检测)已知x和y之间的一组数据
x
0
1
2
3
y
1
3
5
7
则y与x的线性回归方程=x+必过点( )
A.(2,2) B.
C.(1,2) D.
【解析】 ∵=(0+1+2+3)=,=(1+3+5+7)=4,
∴回归方程=x+必过点.
【答案】 D
4.已知人的年龄x与人体脂肪含量的百分数y的回归方程为=0.577x-0.448,如果某人36岁,那么这个人的脂肪含量( )
【导学号:19220003】
A.一定是20.3%
B.在20.3%附近的可能性比较大
C.无任何参考数据
D.以上解释都无道理
【解析】 将x=36代入回归方程得=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.
【答案】 B
5.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
【解析】 样本点的中心是(3.5,42),则=-=42-9.4×3.5=9.1,所以回归直线方程是=9.4x+9.1,把x=6代入得=65.5.
【答案】 B
二、填空题
6.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为________.
【解析】 根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.
【答案】 1
7.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________.
【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得-5=1.23(x-4),即=1.23x+0.08.
【答案】 =1.23x+0.08
7.某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:
x
10
20
30
40
50
y
62
■
75
81
89
由最小二乘法求得回归方程为=0.67x+54.9,现发现表中有一个数据模糊不清,请推断该点数据的值为________.
【解析】 由题意可得=(10+20+30+40+50)=30,
设要求的数据为t,则有=(62+t+75+81+89)=,因为回归直线=0.67x+54.9过样本点的中心(,),所以=0.67×30+54.9,
解得t=68.
【答案】 68
8.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
【解析】 以x+1代x,得=0.254(x+1)+0.321,与=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.
【答案】 0.254
三、解答题
9.(2016·包头高二检测)关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
如由资料可知y对x呈线性相关关系.试求:
(1)线性回归方程:
(2)估计使用年限为10年时,维修费用是多少?
【解】 (1)==4,
==5,
=90,iyi=112.3,
===1.23.
于是=-x=5-1.23×4=0.08.
所以线性回归方程为=1.23x+0.08.
(2)当x=10时,=1.23×10+0.08=12.38(万元),
即估计使用10年时维修费用是12.38万元.
10.关于x与y有如下数据:
x
2
4
5
6
8
y
30
40
60
50
70
为了对x,y两个变量进行统计分析,现有以下两种线性模型:甲模型=6.5x+17.5,乙模型=7x+17,试比较哪一个模型拟合的效果更好.
【解】 R=1-=1-=0.845,
R=1-=1-=0.82,
因为84.5%>82%,所以甲模型拟合效果更好.
[能力提升]
1.某学生四次模拟考试时,其英语作文的减分情况如下表:
考试次数x
1
2
3
4
所减分数y
4.5
4
3
2.5
显然所减分数y与模拟考试次数x之间有较好的线性相关关系,则其线性回归方程为( )
A.y=0.7x+5.25
B.y=-0.6x+5.25
C.y=-0.7x+6.25
D.y=-0.7x+5.25
【解析】 由题意可知,所减分数y与模拟考试次数x之间为负相关,所以排除A.考试次数的平均数为=×(1+2+3+4)=2.5,所减分数的平均数为=×(4.5+4+3+2.5)=3.5.即直线应该过点(2.5,3.5),代入验证可知直线y=-0.7x+5.25成立,选D.
【答案】 D
2.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,C.a′ D.【解析】 根据所给数据求出直线方程y=b′x+a′和回归直线方程的系数,并比较大小.
由(1,0),(2,2)求b′,a′.
b′==2,
a′=0-2×1=-2.
求,时,
iyi=0+4+3+12+15+24=58,
=3.5,=,
=1+4+9+16+25+36=91,
∴==,
=-×3.5=-=-,
∴a′.
【答案】 C
3.(2016·江西吉安高二检测)已知x,y的取值如下表所示,由散点图分析可知y与x线性相关,且线性回归方程为y=0.95x+2.6,那么表格中的数据m的值为________.
x
0
1
3
4
y
2.2
4.3
4.8
m
【解析】 ==2,==,把(,)代入回归方程得=0.95×2+2.6,解得m=6.7.
【答案】 6.7
4.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100棵种子中的发芽数,得到如下资料:
日期
12月
1日
12月
2日
12月
3日
12月
4日
12月
5日
温差x(℃)
10
11
13
12
8
发芽y(颗)
23
25
30
26
16
该农科所确定的研究方案是:先从这5组数据中选取3组数据求线性回归方程,剩下的2组数据用于回归方程检验.
(1)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程=x+;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?
(3)请预测温差为14 ℃的发芽数.
【解】 (1)由数据求得,=12,=27,
=434,iyi=977.
由公式求得,=,=-=-3.
所以y关于x的线性回归方程为=x-3.
(2)当x=10时,=×10-3=22,|22-23|<2;
当x=8时,=×8-3=17,|17-16|<2.
所以该研究所得到的线性回归方程是可靠的.
(3)当x=14时,有=×14-3=35-3=32,
所以当温差为14 ℃时的发芽数约为32颗.
(建议用时:45分钟)
[学业达标]
一、选择题
1.在画两个变量的散点图时,下面叙述正确的是( )
A.预报变量在x轴上,解释变量在y轴上
B.解释变量在x轴上,预报变量在y轴上
C.可以选择两个变量中任意一个变量在x轴上
D.可以选择两个变量中任意一个变量在y轴上
【解析】 结合线性回归模型y=bx+a+e可知,解释变量在x轴上,预报变量在y轴上,故选B.
【答案】 B
2.(2016·泰安高二检测)在回归分析中,相关指数R2的值越大,说明残差平方和( )
A.越大 B.越小
C.可能大也可能小 D.以上均错
【解析】 ∵R2=1-,∴当R2越大时,
(yi-i)2越小,即残差平方和越小,故选B.
【答案】 B
3.(2016·西安高二检测)已知x和y之间的一组数据
x
0
1
2
3
y
1
3
5
7
则y与x的线性回归方程=x+必过点( )
A.(2,2) B.
C.(1,2) D.
【解析】 ∵=(0+1+2+3)=,=(1+3+5+7)=4,
∴回归方程=x+必过点.
【答案】 D
4.已知人的年龄x与人体脂肪含量的百分数y的回归方程为=0.577x-0.448,如果某人36岁,那么这个人的脂肪含量( )
【导学号:19220003】
A.一定是20.3%
B.在20.3%附近的可能性比较大
C.无任何参考数据
D.以上解释都无道理
【解析】 将x=36代入回归方程得=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.
【答案】 B
5.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
【解析】 样本点的中心是(3.5,42),则=-=42-9.4×3.5=9.1,所以回归直线方程是=9.4x+9.1,把x=6代入得=65.5.
【答案】 B
二、填空题
6.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为________.
【解析】 根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.
【答案】 1
7.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________.
【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得-5=1.23(x-4),即=1.23x+0.08.
【答案】 =1.23x+0.08
7.某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:
x
10
20
30
40
50
y
62
■
75
81
89
由最小二乘法求得回归方程为=0.67x+54.9,现发现表中有一个数据模糊不清,请推断该点数据的值为________.
【解析】 由题意可得=(10+20+30+40+50)=30,
设要求的数据为t,则有=(62+t+75+81+89)=,因为回归直线=0.67x+54.9过样本点的中心(,),所以=0.67×30+54.9,
解得t=68.
【答案】 68
8.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
【解析】 以x+1代x,得=0.254(x+1)+0.321,与=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.
【答案】 0.254
三、解答题
9.(2016·包头高二检测)关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
如由资料可知y对x呈线性相关关系.试求:
(1)线性回归方程:
(2)估计使用年限为10年时,维修费用是多少?
【解】 (1)==4,
==5,
=90,iyi=112.3,
===1.23.
于是=-x=5-1.23×4=0.08.
所以线性回归方程为=1.23x+0.08.
(2)当x=10时,=1.23×10+0.08=12.38(万元),
即估计使用10年时维修费用是12.38万元.
10.关于x与y有如下数据:
x
2
4
5
6
8
y
30
40
60
50
70
为了对x,y两个变量进行统计分析,现有以下两种线性模型:甲模型=6.5x+17.5,乙模型=7x+17,试比较哪一个模型拟合的效果更好.
【解】 R=1-=1-=0.845,
R=1-=1-=0.82,
因为84.5%>82%,所以甲模型拟合效果更好.
[能力提升]
1.某学生四次模拟考试时,其英语作文的减分情况如下表:
考试次数x
1
2
3
4
所减分数y
4.5
4
3
2.5
显然所减分数y与模拟考试次数x之间有较好的线性相关关系,则其线性回归方程为( )
A.y=0.7x+5.25
B.y=-0.6x+5.25
C.y=-0.7x+6.25
D.y=-0.7x+5.25
【解析】 由题意可知,所减分数y与模拟考试次数x之间为负相关,所以排除A.考试次数的平均数为=×(1+2+3+4)=2.5,所减分数的平均数为=×(4.5+4+3+2.5)=3.5.即直线应该过点(2.5,3.5),代入验证可知直线y=-0.7x+5.25成立,选D.
【答案】 D
2.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,C.a′ D.【解析】 根据所给数据求出直线方程y=b′x+a′和回归直线方程的系数,并比较大小.
由(1,0),(2,2)求b′,a′.
b′==2,
a′=0-2×1=-2.
求,时,
iyi=0+4+3+12+15+24=58,
=3.5,=,
=1+4+9+16+25+36=91,
∴==,
=-×3.5=-=-,
∴a′.
【答案】 C
3.(2016·江西吉安高二检测)已知x,y的取值如下表所示,由散点图分析可知y与x线性相关,且线性回归方程为y=0.95x+2.6,那么表格中的数据m的值为________.
x
0
1
3
4
y
2.2
4.3
4.8
m
【解析】 ==2,==,把(,)代入回归方程得=0.95×2+2.6,解得m=6.7.
【答案】 6.7
4.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100棵种子中的发芽数,得到如下资料:
日期
12月
1日
12月
2日
12月
3日
12月
4日
12月
5日
温差x(℃)
10
11
13
12
8
发芽y(颗)
23
25
30
26
16
该农科所确定的研究方案是:先从这5组数据中选取3组数据求线性回归方程,剩下的2组数据用于回归方程检验.
(1)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程=x+;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?
(3)请预测温差为14 ℃的发芽数.
【解】 (1)由数据求得,=12,=27,
=434,iyi=977.
由公式求得,=,=-=-3.
所以y关于x的线性回归方程为=x-3.
(2)当x=10时,=×10-3=22,|22-23|<2;
当x=8时,=×8-3=17,|17-16|<2.
所以该研究所得到的线性回归方程是可靠的.
(3)当x=14时,有=×14-3=35-3=32,
所以当温差为14 ℃时的发芽数约为32颗.
- 10-19高中数学选修1-1课堂10分钟达标练 1.1.3 四种命题间的相互关系Word版含答案
- 10-19高中数学人教选修1-2同步练习:第1章 统计案例 章末检测 Word版含解析
- 10-16高中数学选修1-1 第三章导数及其应用 学业分层测评14 Word版含答案
- 10-16高中数学(人教版必修2)配套练习 第二章2.3.2
- 10-16高中数学选修1-1课时自测3.3.3 函数的最大(小)值与导数Word版含答案
- 10-13高中数学选修1-2学业分层测评13 结构图 Word版含解析
- 10-13高中数学必修一配套课时作业集合与函数的概念 1.3.1第2课时 Word版含解析
- 10-09高中数学选修1-1课时自测2.3.2 抛物线的简单几何性质 第1课时 抛物线的简单几何性质Word版含答案
- 10-09高中数学选修1-2课时提升作业(四)1.2 演绎推理 探究导学课型 Word版含答案
- 10-08高中数学选修1-2学业分层测评7 反证法 Word版含解析