《統計學》期末考試試題
2007 ~2008學年第壹學期
課程所在學院:經濟管理學院
壹、單項選擇題(本大題***15小題,每小題1分,***15分)
在每小題列出的四個備選項中只有壹個是符合題目要求的,請將其代碼填寫在題後的括號內。錯選、多選或未選均無分。
1.下列哪個不屬於壹元回歸中的基本假定( D )。
A.對於所有的X,誤差項的方差都相同
B.誤差項 服從正態分布
C.誤差項 相互獨立
D.
2.某組數據分布的偏度系數為負時,該數據的眾數、中位數、均值的大小關系是( A )。
A.眾數>中位數>均值
B.均值>中位數>眾數
C.中位數>眾數>均值
D.中位數>均值>眾數
3.壹元回歸方程為y=11.64壹0.25x,則下列說法中正確的是( C )。
A.自變量平均增長壹個單位,因變量減少0.25個單位
B.自變量和因變量之間成正相關關系
C.
D.
4.有甲乙兩組數列,則( A )數列平均數的代表性高。
A. 1< 2 1> 2,則乙數列平均數的代表性高
B. 1< 2 1> 2,則乙數列平均數的代表性低
C. 1= 2 1> 2,則甲數列平均數的代表性高
D. 1= 2 1< 2,則甲數列平均數的代表性低
5.某連續變量數列,其末組為開口組,下限為500,相鄰組的組中值為480,則末組的組中值為( A )。
A.520 B.510 C.500 D.540
6.不受極端變量值影響的平均數是( D )。
A.算術平均數 B.調和平均數
C.幾何平均數 D.眾數
7.有20個工人看管機器臺數資料如下:2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4,如按以上資料編制頻數分布數列應采用( A )。
A.單項式分組 B.等距分組 C.不等距分組 D.以上幾種分組均可以
8.若無季節變動,則季節比率應為( B )。
A.0 B. 1 C. 大於1 D. 小於1
9.如果壹個定性的變量有m類,則要引進( C )個虛擬變量。
A.m B.m+1
C.m-1 D.無法判斷
10.第壹組工人的平均工齡為5年,第二組為7年,第三組為10年,第壹組工人數占總數的20%,第二組占60%,則三組工人的平均工齡為( B )
A.8年 B.7.2年 C.5年 D.7.8年
11.某企業2007年各種產品的產量比2006年增長了8%,總生產費用增長了12%,則該廠2007年單位成本( D )
A.減少了0.62% B.增加了0.62%
C.減少了3.7% D.增加了3.7%
12.相關系數r與斜率b2的符號( A )。
A.相同 B.不同
C.無法判斷
13.已知小姜買的兩種股票的綜合價格指數上漲了24點,本日股票的平均收盤價格為14元,前日股票的平均收盤價格為( C )
A.10.64 B.10.5
C.11.29 D.無法計算
14.若今年比去年的環比發展速度為112%,去年比前年的環比增長率為3%,那麽今年比前年的平均增長率為( D )。
A.9.0% B.7.4%
C.7.5% D.15.4%
15.已知今年增長1%的絕對值為0.54,去年比前年增長的絕對值為5,則去年比前年的增長率為( C )。
A.9.3% B.8.7%
C.10.2% D.無法計算
二、多項選擇題(每小題2分,***16分)
在每小題列出的若幹選項中有多個選項是符合題目要求的,請將正確選項前的字母填在題後的括號內。多選、少選、錯選均無分。
1.下列變量,屬於離散變量的有( A D E F )。
A.庫存產品數量 B.流動資產對流動負債的比率
C.貨物總重量 D.按個計量的貨物數量
E.壹條收費公路上的交通量 F.公司年會的出席人數
2.指出下列數據收集屬於通過實驗的方法收集數據的有(A B E )
A.培訓航空機票代理人的新方法與傳統方法的比較結果
B.通過讓兩組可以比較的孩子分別使用兩種不同的組裝說明組裝玩具來比較這兩種組裝說明
C.壹份產品評價雜誌給它的訂閱者郵寄調查問卷,請他們為近期購買的產品排名
D.采訪壹個購物中心的顧客,詢問他們為什麽在那裏購物
E.通過在兩個可比較地區分別采用不同的方法,比較兩種不同的養老金促銷方法
3.下列組限的表示方法哪些是對的( A B D )。
A.按職工人數分組,相鄰組的組限可以重疊,也可以間斷
B.職工按工資分組,其組限必須重疊
C.學生按成績分組,其組限必須間斷
D.人按身高分組,其組限必須重疊
4.下列屬於質量指標指數的有( A B D E )。
A.價格指數 B.單位成本指數
C.銷售量指數 D.工資水平指數
E.勞動生產率指數
5.具體地說,如果出現下列( A B C )情況,暗示多元回歸模型有可能存在多重***線性。
A.模型中各對自變量之間顯著相關
B.線形關系顯著,回歸系數 的t檢驗卻不顯著
C.回歸系數的正負號與預期相反
D.
6.算術平均數具有下列哪些性質( B C )。
A. (X- )=最小值 B. (X- )=0
C. (X- )2=最小值 D. (X- )2=0
E. (X- )=1
7.在頻數分布數列中( C D E )。
A.總次數壹定,頻數和頻率成反比 B.各組的頻數之和等於100
C.各組頻率大於0,頻率之和等於1 D.頻率越小,則該組數值所起作用越小
E.頻率表明各組變量值對總體的相對作用程度
8.標準差( C E )。
A.表明總體單位標誌值的壹般水平 B.反映總體單位的壹般水平
C.反映總體單位標誌值的離散程度 D.反映總體分布的集中趨勢
E.反映總體分布的離中趨勢
三、簡答題(本大題***2題,每題5分,***10分)
1.什麽是年度化增長率?它有何用途?
2.數值型數據的分組方法有哪些?簡述組距分組的步驟。
(1)可分為單變量值分組和組距分組兩種分組方法。
單變量值分組:將壹個變量值作為壹組;適合於離散變量;適合於變量值較少的情況(+1)
組距分組:將變量值的壹個區間作為壹組;適合於連續變量;適合於變量值較多的情況;需要遵循“不重不漏”的原則;可采用等距分組,也可采用不等距分組。(+1)
(2)A.確定組數:
(+1)
B.確定組距:組距(class width)是壹個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定(+1)
C.統計出各組的頻數並整理成頻數分布表。(+1)
四、判斷題(本大題***5小題,每小題1分,***5分)
1.相關系數為+1時,說明兩變量完全相關,相關系數為-1時,說明兩個變量不相關。( 錯 )
2.如果各種商品價格平均上漲5%,銷售量平均下降5%,則銷售額指數不變。( 錯 )
3.連續型變量和離散型變量在進行組距式分組時,均可采用相鄰組組距重疊的方法確定組限。( 對 )
4.根據建立的直線回歸方程,不能判斷出兩個變量之間相關的密切程度。( 對 )
5.設P表示單位成本,q表示產量,則∑p1q1—∑p0q1表示由於產品單位成本的變動對總產量的影響。( 錯 )
四、計算分析題(***54分)
1.將某郵局中外發郵包樣本的重量近似到盎司為:21,18,30,12,14,17,28,10,16,25。計算這組數據的均值,中位數,眾數,極差,四分位間距,從偏斜度的角度描述數據的分布形狀(10分)。
2.表1中列出了在壹個為期三周的商務統計課程中學生課外學習的小時數和他們在課程結束時的測試分數的樣本數據如下:
表1 學生課外學習時間及考試分數統計表
學生樣本 1 2 3 4 5 6 7 8
學習時間,X 20 16 34 23 27 32 18 22
考試分數,Y 64 61 84 70 88 92 72 77
利用EXCEL進行回歸,結果如下表:(***15分)
SUMMARY OUTPUT
回歸統計
Multiple R 0.862109
R Square 0.743232
Adjusted R Square 0.700437
標準誤差 6.157605
觀測值 8
方差分析
df SS MS F Significance F
回歸分析 1 658.5034 658.5034 17.36738233 0.005895457
殘差 6 227.4966 37.9161
總計 7 886
Coefficients 標準誤差 t Stat P-value
Intercept 40.08163265 8.889551 4.50884785 0.004065471
X Variable 1 1.496598639 0.359119 4.16741915 0.005895457
分析並回答下列問題:
(1)學習時間與考試分數之間的相關系數是多少,考試分數的變差中有多少是由於學習時間的變動引起的? 86.21% 74.32%
(2) 根據EXCEL回歸輸出結果,寫出估計的回歸方程並解釋回歸系數的實際意義。
(3) 檢驗線性關系的顯著性 。
(4) 根據標準化殘差圖判斷關於隨機誤差項正態分布的假定是否成立。
標準化殘差分布在-2~2之間,因此關於隨機誤差項服從正態分布的假定成立
3.隨機抽取了15家大型商場銷售的同類產品的有關數據(單位:元),利用EXCEL進行回歸,結果如下表:(***15分)
SUMMARY OUTPUT
回歸統計
Multiple R 0.593684
R Square 0.35246
Adjusted R Square 0.244537
標準誤差 69.75121
觀測值 15
方差分析
df SS MS F Significance F
回歸分析 2 31778.15 15889.08 3.265842 0.073722186
殘差 12 58382.78 4865.232
總計 14 90160.93
Coefficients 標準誤差 t Stat P-value
Intercept 375.6018288 339.410562 1.10662976 0.290145025
X Variable 1 0.537840951 0.21044674 2.55571054 0.02519961
X Variable 2 1.457193542 0.667706586 2.18238606 0.049681066
相關系數矩陣
Y X1 X2
Y 1
X1 0.308952067 1
X2 0.001214062 -0.8528576 1
註:X Variable 1為購進價格/元
X Variable 2為銷售費用/元
因變量Y為銷售價格/元
(1)指出Y與X1,Y與X2之間的相關系數,是否有證據表明購進價格、銷售價格與銷售費用之間存在線性關系? 0.3089 0.0012 沒有,因為相關系數較小
(2)根據上訴結果,妳認為用購進價格與銷售費用來預測是否有用?沒用
(3)根據EXCEL回歸輸出結果,寫出估計的回歸方程並檢驗線性關系是否顯著( )。不顯著
(4)解釋判定系數R2,所得結論與問題(2)中是否壹致? R2=35.25% , 在銷售價價格的總變差中,被估計的回歸方程所解釋的比例是35.25%,壹致。(+3)
(5)X1與X2之間的相關系數是什麽?意味著什麽?高度相關
(6)模型中是否存在多重***線性?妳對模型有何特長建議?可能存在多重***線性;進壹步檢驗是否存在多重***線性,對X1與X2的樣本相關系數進行顯著性檢驗(rx1x2=-0.8529),如果是顯著,即可確定為存在多重***線性。(+2)
對模型有何特長建議:根據研究目的,刪掉相對次要的解釋變量。(+1)
4.壹公司生產的三種產品的有關如下數據如下表所示 (***14分):
商品 計量單位 銷售量 單價(萬元)
2005年 2006年 2005年 2006年
甲 公斤 400 480 0.8 0.82
乙 噸 80 88 1.15 1.05
丙 件 50 60 1.20 1.38
(1)計算三種產品的銷售額指數;
(2)計算三種產品的銷售量指數;
(3)計算三種產品的單位價格指數;
(4)計算分析產量和單位價格的變動對銷售額影響的相對數和絕對數。
北京信息科技大學
2007 ~2008學年第壹學期
《統計學》課程期末考試試卷標準答案(A卷)
壹、 單項選擇題(本大題***15小題,每小題1分,***15分)
在每小題列出的四個備選項中只有壹個是符合題目要求的,請將其代碼填寫在題後的括號內。錯選、多選或未選均無分。
1.(A) 2.(A) 3.( C) 4.(A) 5.(D)
6.(D) 7(A) 8( B) 9.(C) 10.(B)
11.(D) 12.(A) 13.(C) 14.(D) 15.(C)
二、 多項選擇題(每小題2分,***16分)
在每小題列出的五個選項中有二至五個選項是符合題目要求的,請將正確選項前的字母填在題後的括號內。多選、少選、錯選均無分。
1.(ADEF) 2.(ABE ) 3. (ABD ) 4.(ABDE) 5.(ABC)
6.(BC ) 7.(CDE) 8.(CE)
三、 簡答題(本大題***2題,每題5分,***10分)
1. 什麽是年度化增長率?它有何用途?
(1)增長率以年來表示時,稱為年度化增長率或年率,(+2)
其計算公式為:
m 為壹年中的時期個數;n 為所跨的時期總數
季度增長率被年度化時,m =4
月增長率被年度化時,m =12
當m = n 時,上述公式就是年增長率 (+2)
(2)可將月度增長率或季度增長率轉換為年度增長率,實現增長率之間的可比性。(+1)
2. 數值型數據的分組方法有哪些?簡述組距分組的步驟。
(1)可分為單變量值分組和組距分組兩種分組方法。
單變量值分組:將壹個變量值作為壹組;適合於離散變量;適合於變量值較少的情況(+1)
組距分組:將變量值的壹個區間作為壹組;適合於連續變量;適合於變量值較多的情況;需要遵循“不重不漏”的原則;可采用等距分組,也可采用不等距分組。(+1)
(2)A.確定組數:
(+1)
B.確定組距:組距(class width)是壹個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定(+1)
C.統計出各組的頻數並整理成頻數分布表。(+1)
四、判斷題(本大題***5小題,每小題1分,***5分)
1.相關系數為+1時,說明兩變量完全相關,相關系數為-1時,說明兩個變量不相關。(×)
2.如果各種商品價格平均上漲5%,銷售量平均下降5%,則銷售額指數不變。(×)
3.連續型變和離散型變量在進行組距式分組時,均可采用相鄰組組距重疊的方法確定組限。(√)
4.根據建立的直線回歸方程,不能判斷出兩個變量之間相關的密切程度。(√)
5.設P表示單位成本,q表示產量,則∑p1q1—∑p0q1表示由於產品單位成本的變動對總產量的影響。(×)
五、計算分析題(***55分)
中位數的位置:(10+1)/2=5.5
中位數
從偏斜度的角度描述數據的分布形狀:均值>中位數,正向(右)偏
(+2)
2.(1)學習時間與考試分數之間的相關系數是多少,考試分數的變差中有多少是由於學習時間的變動引起的?
r=0.862109, (+1)
R2=0.743232, 考試分數的變差中有74.3232%是由於學習時間的變動引起的。(+2)
(2) 根據EXCEL回歸輸出結果,寫出估計的回歸方程並解釋回歸系數的實際意義。
(+3)
回歸系數的含義表明學習時間每增加壹個小時, 考試分數平均增加1.497分。(+2)
(3) 檢驗線形關系的顯著性
Significance F=0.005895457〈 =5%
線性關系顯著。(+3)
(4) 根據標準化殘差圖判斷關於隨機誤差項服從正態分布的假定是否成立。
標準化殘差分布在-2~2之間,因此關於隨機誤差項服從正態分布的假定成立。(+4)
3. (1)指出Y與X1,Y與X2之間的相關系數,是否有證據表明購進價格、銷售價格與銷售費用之間存在線性關系
(1)ryxi =0.308952067 ryx2=0.001214062,
沒有證據。(+2)
(2)根據上述結果,妳認為用購進價格與銷售費用來預測是否有用?
沒有用。(+2)
(3)根據EXCEL回歸輸出結果,寫出估計的回歸方程並檢驗線性關系是否顯著( )。
Significance F=0.073722> =5%
線性關系不顯著。(+3)
(4)解釋判定系數R2,所得結論與問題(2)中是否壹致
R2=35.25% , 在銷售價價格的總變差中,被估計的回歸方程所解釋的比例是35.25%,壹致。(+3)
(5)X1與X2之間的相關系數是什麽?意味著什麽?
rx1x2=-0.8529,高度相關(+2)
(6)模型中是否存在多重***線性?妳對模型有何特長建議?
可能存在多重***線性;進壹步檢驗是否存在多重***線性,對X1與X2的樣本相關系數進行顯著性檢驗(rx1x2=-0.8529),如果是顯著,即可確定為存在多重***線性。(+2)
對模型有何特長建議:根據研究目的,刪掉相對次要的解釋變量。(+1)
4. (1)三種產品的銷售額指數; (+3)
三種產品的銷售額指數=∑q1p1/∑q0p0
=568.8/472=120.51%
∑q1p1-∑q0p0==568.8-472=96.8萬元
(2)三種產品的銷售量指數; (+3)
Iq=∑q1p01/∑q0p0
=557.2/472=118.05%
∑q1p0-∑q0p0
=557.2-472=85.2萬元
(3)三種產品的價格指數; (+3)
Ip=∑q1p1/∑q1p0
=568.8/557.2=1.0208=12.08%
∑q1p1-∑q1p0
=568.8-557.2=11.6萬元
(4) 分析產量和單位價格的變動對銷售額影響的相對數和絕對數。(+5)
120.51%=118.05%*102.08% (+3)
96.8萬元萬元=85.2萬元+11.6萬元 (+2)