Xem mẫu

  1. Đáp án – Nguyên lý thống kê ĐÁP ÁN Bài 2 Bài tập 1 Sắp xếp số liệu theo thứ tự từ nhỏ đến lớn, xác định được Xmax = 145, Xmin = 50. Với khoảng cách tổ bằng nhau và bằng 10, bảng tần số phân bố được xây dựng như sau: Năng lượng tiêu dùng Tần số (hộ) Tần suất (lần) (triệu BTU) 50 – 60 8 0,16 60 – 70 7 0,14 70 – 80 3 0,06 80 – 90 6 0,12 90 – 100 10 0,20 100 – 110 5 0,10 110 – 120 4 0,08 120 – 130 2 0,04 130 – 140 3 0,06 140 – 150 2 0,04 Tổng 50 1,00 fi Từ đó tính được tần suất theo công thức: d i  (kết quả như ở bảng trên). f i Bài tập 2 Sắp xếp số liệu theo thứ tự từ nhỏ đến lớn. a) Tổ đầu tiên bắt đầu từ 6 – 8. Biết khoảng cách các tổ bằng nhau và bằng 2, dãy số phân phối được xây dựng như sau: Lượng sắt dung nạp trong 24 giờ (mg) Số người 6–8 1 8 – 10 1 10 – 12 7 12 – 14 9 14 – 16 9 16 – 18 9 18 – 20 8 20 – 22 1 Tổng 45 b) Biết hàm lượng sắt cho phép dung nạp hàng ngày của phụ nữ dưới 51 tuổi là không vượt quá 18mg. Vậy với mẫu ở trên, tỷ lệ phần trăm số phụ nữ đã dung nạp quá mức lượng sắt cho phép (tức có x ≥ 18) là: (8 + 1)/45 = 0,2 (tức 20%) v1.0 161
  2. Đáp án – Nguyên lý thống kê Bài tập 3 Sắp xếp số liệu theo thứ tự từ nhỏ đến lớn ta có: Xmax = 100, Xmin = 34. a) Với khoảng cách tổ bằng nhau và bằng 10, bảng tần số phân bố như sau: Điểm Tần số (số sinh viên) Tần suất (lần) Tần số tích luỹ 30 – 40 2 0,10 2 40 – 50 0 0,00 2 50 – 60 0 0,00 2 60 – 70 3 0,15 5 70 – 80 3 0,15 8 80 – 90 8 0,40 16 90 – 100 4 0,20 20 Tổng 20 1,00 b) Biểu đồ tần số: 9 8 7 6 Số sinh viên 5 4 3 2 1 0 30-40 40-50 50-60 60-70 70-80 80-90 90-100 Điểm Biểu đồ tần suất: 0.1 0 0.2 0 30-40 0.15 40-50 50-60 60-70 70-80 0.15 80-90 90-100 0.4 (Lưu ý: có thể sử dụng biểu đồ hình cột hoặc biểu đồ hình tròn đều được). c) Đồ thị tần số 9 8 7 6 Số sinh viên 5 4 3 2 1 0 30-40 40-50 50-60 60-70 70-80 80-90 90-100 Điểm 162 v1.0
  3. Đáp án – Nguyên lý thống kê Đồ thị tần số tích luỹ 25 20 Tần số tích luỹ 15 10 5 0 0 20 40 60 80 100 120 Điểm Bài tập 4 fi a) Tần suất được tính theo công thức: d i  f i Số ngày đến hạn Số khoản đầu tư Tần suất (lần) Tần số tích luỹ thanh toán ngắn hạn (f) 30 – 40 3 0,075 3 40 – 50 1 0,025 4 50 – 60 8 0,200 12 60 – 70 10 0,250 22 70 – 80 7 0,175 29 80 – 90 7 0,175 36 90 – 100 4 0,100 40 Tổng 40 b) Để biết khoản đầu tư thứ 23 có số ngày đến hạn thanh toán là bao nhiêu, ta phải tính tần số tích luỹ. Nhìn vào bảng tần số tích lũy ở trên thì khoản đầu tư thứ 23 nằm ở tổ thứ 5 và do đó có số ngày đến hạn thanh toán là 70 – 80 ngày. c) Cũng theo bảng tần số tích lũy ở trên thì số khoản đầu tư có ngày đến hạn thanh toán dưới 70 ngày là 22 khoản. d) Đồ thị biểu diễn mối liên hệ: 12 Số khoản đầu tư ngắn hạn 10 8 6 4 2 0 30-40 40-50 50-60 60-70 70-80 80-90 90-100 Số ngày đến hạn thanh toán Bài tập 5 fi a) Tính tần suất theo công thức: d i  f i v1.0 163
  4. Đáp án – Nguyên lý thống kê Quê quán Số người Tần suất (lần) Thái Nguyên 2 0,077 Hải Dương 4 0,154 Hà Nội 7 0,269 Lai Châu 1 0,038 Cao Bằng 11 0,423 Nam Định 1 0,038 Tổng 26 1,000 b) Vẽ biểu đồ hình cột (bar chart) cho tần suất. 0.038 1 Nam Định 0.423 0.8 Cao Bằng Lai Châu 0.038 0.6 Hà Nội 0.269 0.4 Hải Dương 0.154 Thái Nguyên 0.2 0.077 0 1 c) Vẽ biểu đồ hình bánh (pie chart) cho tần suất. Thái Nguyên Thái (0.077) Nguyên, Thái Nguyên Hải Hải Dương, Dương 0.077 (0.154) Nam Nam Định (0.038) Định, 0.038 Hải Dương 0.154 Hà Nội Cao Bằng Cao Bằng,(0.423) 0.423 Lai Châu HàHà Nội, Nội 0.269 (0.269) Cao Bằng Lai Châu,(0.038) Lai Châu 0.038 Nam Định Bài 3 Bài tập 1 a) Bảng tần số phân bố với các tổ không có khoảng cách tổ (chỉ có cột NSLĐ và số công nhân) 164 v1.0
  5. Đáp án – Nguyên lý thống kê NSLĐ (sản phẩm) (xi) Số công nhân (fi) xifi Tần số tích luỹ 36 1 36 1 37 3 111 4 38 5 190 9 39 8 312 17 40 5 200 22 41 3 123 25 42 1 42 26 43 4 172 30 Tổng 30 1.186 b) Tính năng suất lao động bình quân của công nhân toàn phân xưởng. x x f i i  1.186  39,53 (sản phẩm) f i 30 c) Tính Mốt về năng suất lao động của công nhân toàn phân xưởng. Đây là dãy số phân tổ không có khoảng cách tổ, khi đó M0 là lượng biến của tổ có tần số lớn nhất (fmax = 8), vậy M0 = 39 sản phẩm. d) Tính trung vị về năng suất lao động của công nhân toàn phân xưởng. Trung vị là lượng biến của đơn vị đứng ở vị trí chính giữa trong dãy số lượng biến. Có 30 công nhân, vậy vị trí chính giữa là 15 và 16. Tính tần số tích lũy để xác định vị trí thứ 15 và 16, đó là tổ có lượng biến bằng 39. Me = (x15 + x16)/2 = (39 + 39)/2 = 39 (sản phẩm) Bài tập 2 Số trẻ em Tần số tích luỹ IQ xi xifi (người) (fi) (di) 60 – 70 1 65 65 1 70 – 80 5 75 375 6 80 – 90 13 85 1.105 19 90 – 100 22 95 2.090 41 100 – 110 28 105 2.940 69 110 – 120 23 115 2.645 92 120 – 130 14 125 1.750 106 130 – 140 3 135 405 109 140 – 150 2 145 290 111 150 – 160 1 155 155 112 112 11.820 a) Đây là dãy số phân tổ có khoảng cách tổ, lượng biến được xác định là trị số giữa của từng tổ (xi). Khi đó chỉ số IQ bình quân của 112 trẻ em nói trên được tính như sau: x x f i i  1.1820  105,54 f i 112 v1.0 165
  6. Đáp án – Nguyên lý thống kê b) Tổ có tần số lớn nhất là tổ 100 – 110, đây cũng là tổ chứa M0. Mốt về chỉ số IQ của 112 trẻ em nói trên được tính: f M0  f M0  1 28  22 M 0  x M0 min  h M0  100  10   105, 46 (f M0  f M0  1 )  (f M0  f M0  1 ) 28  22  28  23 c) Theo bảng tần số tích lũy, tổ chứa trung vị là tổ chứa đơn vị thứ 56 và 57, tức tổ 100 – 110. Khi đó trung vị về chỉ số IQ của 112 trẻ em nói trên được tính: f i  SMe 1 112  41 M e  x Me min  h Me 2  100  10  2  105,36 f Me 28 Bài tập 3 a) Bảng tần số phân bố được xây dựng như sau: Tuổi Số sinh viên 15 – 19 10 20 – 24 9 25 – 29 3 30 – 34 4 35+ 4 b) Tổ chứa M0 là tổ 15 – 19. Mốt về tuổi của sinh viên được tính: f M0  f M0  1 10  0 M 0  x M0 min  h M0  15  4   18, 64 (tuổi) (f M0  f M0  1 )  (f M0  f M0  1 ) 10  0  10  9 c) Tuổi trung bình của sinh viên từ số liệu ban đầu: n x 757 i x i 1   25, 23 (tuổi) n 30 d) x > M0, x là tham số đo xu hướng trung tâm tốt hơn, vì nó đã tính đến tất cả các lượng biến chứ không như M0, chỉ quan tâm tới lượng biến có tần số lớn nhất. Bài tập 4 a) Xây dựng bảng tần số phân bố với các tổ có khoảng cách tổ bằng nhau: Tuổi Số người (fi) xi xifi 30 – 40 4 35 140 40 – 50 7 45 315 50 – 60 7 55 385 60 – 70 10 65 650 70 – 80 8 75 600 Tổng 36 2.090 b) Tính tuổi trung bình từ số liệu ban đầu: n x i 2.107 x i 1   58,53 (tuổi) n 36 166 v1.0
  7. Đáp án – Nguyên lý thống kê Tính tuổi trung bình từ tài liệu phân tổ: x x f i i  2.090  58, 06 (tuổi) f i 36 Tính bình quân từ tài liệu ban đầu chính xác hơn vì cách tính thứ hai mang tính giả định các lượng biến trong tổ đều bằng với trị số giữa của nó. c) Sắp xếp dãy số ban đầu theo thứ tự tăng dần từ nhỏ đến lớn, khi đó trung vị được xác định như sau: Me = (x18 + x19)/2 = (59 + 60)/2 = 59,5 (tuổi) d) Tính khoảng tứ phân vị về tuổi: Dãy số được chia thành 4 phần bằng nhau, như sau: 31 38 39 39 42 42 45 47 48 48 48 52 52 53 54 55 57 59 60 61 64 64 66 66 67 68 68 69 71 71 74 75 77 79 79 79 Q1 = (48 + 48)/2 = 48 Q2 = (59 + 60)/2 = 59,5 Q3 = (68 + 59)/2 = 68,5 Bài tập 5 a) Tốc độ phát triển bình quân về tiền lương bình quân của công nhân trong giai đoạn 2004 – 2008 là: x  n x1x 2 ...x n  5 x 04 / 03 x 05/ 04 x 06 / 05 x 07 / 06 x 08/ 07  1, 0707 (lần) hay 107,07% b) Tốc độ phát triển bình quân về tiền lương bình quân của công nhân trong giai đoạn 1995 – 2008 là:  fi f1 f2 f n 13 x x x ...x  1, 0875  1, 052  1, 051  1, 07075  1, 0721 (lần) hay 107,21%. Bài tập 6 a) Tính tốc độ phát triển lợi nhuận hàng năm của doanh nghiệp. Năm 2002 2003 2004 2005 2006 2007 2008 Lợi nhuận trước thuế 12,3 13,5 13,8 15,2 16,4 16,9 15,0 (tỷ đồng) Tốc độ phát triển hàng 109,76 102,22 110,14 107,89 103,05 88,76 năm (%) Tốc độ phát triển bình quân về lợi nhuận của doanh nghiệp trong giai đoạn 2002 – 2008: x n x1x 2 ...x n  6 x 03/ 02. x 04 / 03 x 05/ 04 x 06 / 05 x 07 / 06 x 08/ 07  1, 0336 (lần) hay 103,36%. b) Tính tốc độ phát triển bình quân về lợi nhuận của doanh nghiệp trong giai đoạn 1998 – 2008.  fi x x f1 x f2 ...x fn  10 1, 0562  1, 0382  1, 03366  1, 0389 (lần) hay 103,89%. Bài tập 7 Xuất phát từ mối liên hệ: Tổng thời gian sản xuất Thời gian hao phí bình quân = Tổng số sản phẩm sản xuất v1.0 167
  8. Đáp án – Nguyên lý thống kê Thời gian hao phí bình quân để sản xuất ra 1 sản phẩm của công nhân 3 phân xưởng trên được tính theo công thức: _  x i f i  x i f i  Mi x    f i  x i f i  Mi xi xi Trong đó:  x : thời gian hao phí bình quân để sản xuất 1 sản phẩm (phút).  xi: mức thời gian hao phí để sản xuất 1 sản phẩm của từng phân xưởng (phút).  fi: số sản phẩm được sản xuất ra của từng phân xưởng (sản phẩm).  Mi: tổng thời gian lao động của từng phân xưởng (phút). Thay số vào công thức trên ta có: 8  5  60  6  5  60  9  5  60 x  3, 03 (phút) 8  5  60 6  5  60 9  5  60   5 2 3 Bài tập 8 Xuất phát từ mối liên hệ: Thời gian phục vụ Tổng thời gian phục vụ khách 1 khách bình quân = Tổng số khách phục vụ Thời gian phục vụ 1 khách bình quân của 3 cửa hàng nói trên được tính theo công thức: _  x i f i  x i f i  Mi x    f i  x i f i  Mi xi xi Trong đó:  x : thời gian bình quân để phục vụ 1 khách của 3 cửa hàng (phút).  xi: mức thời gian phục vụ 1 khách của từng cửa hàng (phút).  fi: số khách được phục vụ của từng cửa hàng (người).  Mi: tổng thời gian phục vụ khách của từng cửa hàng (phút). Thay số vào công thức trên ta có: 10  3  60  12  3,5  60  8  3  60 x  5, 05 (phút) 10  3  60 12  3,5  60 8  3  60   5 6 4 Bài tập 9 Xuất phát từ mối liên hệ: Doanh thu = Giá bán  lượng tiêu thụ a) Tính giá bán đơn vị bình quân của 3 mặt hàng trên trong quý I. Quý I Lượng hàng tiêu thụ Mặt hàng Doanh thu Giá bán đơn vị (sản phẩm) (nghìn đồng) Mi (nghìn đồng) xi fi = Mi/xi A 3.850 35 110 B 7.200 50 144 C 6.300 70 90 Tổng 17.350 344 168 v1.0
  9. Đáp án – Nguyên lý thống kê _ x M i  1.7350  50, 44 (nghìn đồng) M 344 x i i b) Tính giá bán đơn vị bình quân của 3 mặt hàng trên trong quý II. Quý II Doanh thu Mặt hàng Lượng hàng tiêu thụ Giá bán đơn vị (nghìn đồng) (sản phẩm) fi (nghìn đồng) xi Mi = xifi A 135 40 5.400 B 180 45 8.100 C 120 68 8.160 Tổng 435 21.660 _  x i fi 21.660 x   49,79 (nghìn đồng)  fi 435 c) Tính giá bán đơn vị bình quân của 3 mặt hàng trên trong cả hai quý. x M M I II  17.350  21.660  50, 08 (nghìn đồng) f  f I II 344  435 Bài tập 10 Xuất phát từ mối liên hệ: Tổng GTSX thực tế % HTKH về GTSX =  100 Tổng GTSX kế hoạch a) Tính tỷ lệ phần trăm hoàn thành kế hoạch về GTSX của toàn doanh nghiệp trong quý I. Quý I Giá trị sản xuất Tỷ trọng giá trị Phân xưởng Giá trị sản xuất % hoàn thành kế KH (triệu đồng) sản xuất từng (triệu đồng) Mi hoạch về GTSX xi fi = Mi/xi phân xưởng (%) A 500 102 490,20 35,46 B 480 97 494,85 34,04 C 430 115 373,91 30,50 Tổng 1.410 1.358,95 100,00 _ x M i  1.410  1,0376 lần (hay 103,76%) M 1.358,95 x i i b) Tính tỷ lệ phần trăm hoàn thành kế hoạch về GTSX của toàn doanh nghiệp trong quý II. Quý II Giá trị sản xuất Tỷ trọng giá trị Phân xưởng Kế hoạch về GTSX % hoàn thành kế (triệu đồng) sản xuất từng (triệu đồng) fi hoạch về GTSX xi Mi = xi.fi phân xưởng (%) A 520 108 561,6 34,31 B 500 105 525,0 32,08 C 500 110 550,0 33,61 Tổng 1.520 1.637 100,00 v1.0 169
  10. Đáp án – Nguyên lý thống kê _  x i fi 1.637 x   1,0767 lần (hay 107,67%)  fi 1.520 c) Tính tỷ lệ phần trăm hoàn thành kế hoạch về GTSX của toàn doanh nghiệp trong cả hai quý. x M  M I II  1.410  1.637  1, 0582 lần (hay 105,82%) f  f I II 1.358,95  1.520 d) Tính tỷ trọng giá trị sản xuất của từng phân xưởng trong quý I, quý II (như bảng trên), cả hai quý: 34,84 % – 32,99% – 32,17 %. Lưu ý: Khi tính nên đổi tỷ lệ % hoàn thành kế hoạch về đơn vị lần để đảm bảo ý nghĩa kinh tế của các chỉ tiêu liên quan. Khi tính tỷ trọng, tính theo giá trị sản xuất thực tế. Bài tập 11 Tính trị số giữa của mỗi tổ làm lượng biến của tổ đó. Số lao động Thu nhập (người) xi xifi x i - x fi xi2fi (triệu đồng) fi 4,7 – 5,2 4 4,95 19,80 6,92 98,01 5,2 – 5,7 9 5,45 49,05 11,07 267,32 5,7 – 6,2 13 5,95 77,35 9,49 460,23 6,2 – 6,7 42 6,45 270,90 9,66 1.747,31 6,7 – 7,2 39 6,95 271,05 10,53 1.883,80 7,2 – 7,7 20 7,45 149,00 15,40 1.110,05 7,7 – 8,2 9 7,95 71,55 11,43 568,82 Tổng 136 908,70 74,50 6.135,54 a) Thu nhập bình quân của lao động trong doanh nghiệp: _  x i fi 908,7 x   6,68 (triệu đồng)  fi 136 b) Khoảng biến thiên về thu nhập của lao động trong doanh nghiệp: R = xmax – xmin = 8,2 – 4,7 = 3,5 (triệu đồng) c) Độ lệch tuyệt đối bình quân về thu nhập của lao động trong doanh nghiệp: d  x  xf i i  74,5  0,55 (triệu đồng) f i 136 d) Phương sai về thu nhập của lao động trong doanh nghiệp: x f   x i fi 2 2 i i  6.135,54  2      6, 682  0, 49 f i  f  i  136 170 v1.0
  11. Đáp án – Nguyên lý thống kê e) Độ lệch tiêu chuẩn về thu nhập của lao động trong doanh nghiệp:    2  0, 49  0, 7 (triệu đồng) f) Hệ số biến thiên về thu nhập của lao động trong doanh nghiệp:  0, 7 V   0,1048 lần (hay 10,48%) x 6, 68 Bài tập 12 Trị số giữa của mỗi tổ làm lượng biến của tổ đó. Số lượng séc Tần số xi xifi xi2fi < 200 10 100 1.000 100.000 200 – 400 13 300 3.900 1.170.000 400 – 600 17 500 8.500 4.250.000 600 – 800 42 700 29.400 20.580.000 800 – 1000 18 900 16.200 14.580.000 Tổng 100 59.000 40.680.000 Phương sai về số lượng séc chi trả: x f   x i fi 2 2 i i  40.680.000 59.000  2       58.700 f i  f  i  100 100 Độ lệch tiêu chuẩn về số lượng séc chi trả:    2  58.700  242, 28 (séc) Đây chính là điều mà nhà quản lý ngân hàng lo ngại. Bài tập 13 Số bình quân Phương sai Độ lệch tiêu chuẩn Hệ số biến thiên (nghìn đồng) (nghìn đồng) (%) Thu nhập 3.500 8.540 92,41 2,64 Chi tiêu 3.000 4.100 64,03 2,13  a) Công thức tính hệ số biến thiên: V   100 (%) x b) Với chỉ tiêu thu nhập: Me = 3.200 nghìn đồng, khi đó: x > Me > M0, dãy số có phân phối chuẩn lệch phải. Vậy số hộ gia đình có mức thu nhập lớn hơn mức thu nhập bình quân sẽ chiếm thiểu số. Bài tập 14 Tính trị số giữa của mỗi tổ làm lượng biến của tổ đó. Số ngày nằm viện Số người (người) xi xifi xi2fi (ngày) 1–3 24 2 48 96 4–6 83 5 415 2.075 7–9 52 8 416 3.328 v1.0 171
  12. Đáp án – Nguyên lý thống kê 10 – 12 22 11 242 2.662 13 – 15 11 14 154 2.156 16 – 18 5 17 85 1.445 19 – 21 2 20 40 800 22 – 24 1 23 23 529 200 1423 13.091 a) Số ngày nằm viện trung bình: _  x i fi 1.423 x   7,115 (ngày)  fi 200 b) Độ lệch tiêu chuẩn về số ngày nằm viện của 200 người trên là: x f   x i fi 2 2  13.091  2  i i     7,1152  14,83 f i  f  i  200    2  14,83  3,85 (ngày) c) Hệ số biến thiên về số ngày nằm viện:  3,85 V   0,5413 lần (hay 54,13%) x 7,115 Bài tập 15 a) Lượng tiêu dùng cá trung bình của mỗi nhóm người là: n x i 1 i 113 Người Đức: x    11,3 (kg) n 10 n x i 1 i 241 Người Nga: x    16, 07 (kg) n 15 b) Tính trung vị về lượng tiêu dùng cá của mỗi nhóm người. Sắp xếp dãy số theo thứ tự từ nhỏ đến lớn. Người Đức: vị trí chính giữa là 5 và 6 Vậy: Me = (x5 + x6)/2 = (11 + 13)/2 = 12 (kg) Người Nga: vị trí chính giữa là 8 Vậy: Me = x8 = 17 (kg) c) Mốt về lượng tiêu dùng cá của mỗi nhóm người: Người Đức: M0 = 17 (kg) Người Nga: không tính Mốt cho trường hợp này vì có nhiều Mốt. d) So sánh độ phân tán về lượng tiêu dùng cá của hai nhóm người trên. Tính phương sai về lượng tiêu dùng cá. x   xi 2 2 i  1.507 Người Đức:  2       11,32  23, 01 n  n  10 172 v1.0
  13. Đáp án – Nguyên lý thống kê x   xi 2 2 i  4.313 Người Nga:  2       16, 07 2  29, 29 n  n  15 Hệ số biến thiên:  23, 01 Người Đức: V    0, 4245 lần (hay 42,45%) x 11,3  29, 29 Người Nga: V    0,3367 lần (hay 33,67%) x 16, 07 Vậy lượng tiêu dùng cá của nhóm người Đức có độ phân tán lớn hơn lượng tiêu dùng cá của nhóm người Nga. Bài 4: Phân tích hồi quy và tương quan Bài tập 1 a) Mối liên hệ hai chiều. b) Vẽ đồ thị. c) Xây dựng mô hình hồi quy phản ánh ảnh hưởng của chi cho R&D đến lợi nhuận. ˆ x = bo + b1x Mô hình có dạng: y Chi cho R&D Lợi nhuận hàng Năm xy x2 y2 (tỷ đồng) x năm (tỷ đồng) y 2003 2 20 40 4 400 2004 3 25 75 9 625 2005 5 34 170 25 1.156 2006 4 30 120 16 900 2007 11 40 440 121 1.600 2008 5 31 155 25 961 Tổng 30 180 1.000 200 5.642 Trung bình 5,0 30,0 166,7 33,3 940,3 Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS. xy  xy 166, 7  5  30 b1   2  2x 33,3  52 b0 = y – b1 x = 30 – 2 × 5 = 20 Vậy mô hình hồi quy có dạng: yˆ x  20  2x Ý nghĩa các tham số: b0 = 20 cho biết ảnh hưởng của các nguyên nhân khác ngoài chi cho R&D đến lợi nhuận của doanh nghiệp. b1 = 2 cho biết ảnh hưởng trực tiếp của chi cho R&D đến lợi nhuận của doanh nghiệp. Cụ thể, khi chi cho R&D tăng 1 đơn vị (tức 1 tỷ đồng) thì lợi nhuận của doanh nghiệp sẽ tăng bình quân 2 tỷ đồng. Đây là mối liên hệ thuận. v1.0 173
  14. Đáp án – Nguyên lý thống kê Lưu ý : Mô hình hồi quy biểu diễn ảnh hưởng của lợi nhuận đến chi cho R&D của doanh nghiệp được xây dựng tương tự. d) Để đánh giá mức độ chặt chẽ của mối liên hệ trên, ta tính hệ số tương quan: xy  xy  33,3  52 r  b1 x  2   0,907 x y y 940,3  302 Đây là mối liên hệ tương quan tuyến tính rất chặt chẽ. Bài tập 2 a) Vẽ đồ thị biểu diễn mối liên hệ. b) Mô hình hồi quy biểu diễn mối liên hệ giữa thu nhập khả dụng và chi cho lương thực thực phẩm của các hộ gia đình nói trên có dạng: yˆ x = b0 + b1x Hộ Thu nhập khả dụng Chi cho lương thực xy x2 gia đình (triệu đồng) x thực phẩm (triệu đồng) y 1 30,0 5,5 165,0 900,0 2 36,0 6,0 216,0 1.296,0 3 27,0 4,2 113,4 729,0 4 20,0 4,0 80,0 400,0 5 16,0 3,7 59,2 256,0 6 24,0 2,6 62,4 576,0 7 19,0 3,9 74,1 361,0 8 25,0 4,3 107,5 625,0 Tổng 197,0 34,2 877,6 5.143,0 Trung bình 24,63 4,28 109,70 642,88 Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS. xy  xy 109, 7  24, 63  4, 28 b1    0,12 2x 642,88  24, 632 b0 = y – b1 x = 4,28 – 0,12  24,63 = 1,324 Vậy mô hình có dạng: yˆ x  1,324  0,12x . c) Thay giá trị x = 25 vào mô hình ở trên, ta tính được giá trị dự đoán : yˆ x = 1,324 + 0,12  25 = 4,324 (triệu đồng) Bài tập 3 a) Mô hình hồi quy biểu diễn mối liên hệ giữa thời gian tự học và điểm kiểm tra của các sinh viên nói trên có dạng: yˆ x = b0 + b1x 174 v1.0
  15. Đáp án – Nguyên lý thống kê Thời gian tự học Điểm Sinh viên xy x2 y2 (giờ) x kiểm tra – y 1 10,0 9,2 92,0 100,0 84,6 2 15,0 8,1 121,5 225,0 65,6 3 12,0 8,4 100,8 144,0 70,6 4 20,0 7,4 148,0 400,0 54,8 5 8,0 8,5 68,0 64,0 72,3 6 16,0 8,0 128,0 256,0 64,0 7 14,0 8,4 117,6 196,0 70,6 8 22,0 8,0 176,0 484,0 64,0 Tổng 117,0 66,0 951,9 1.869,0 546,4 Trung bình 14,63 8,25 118,99 233,63 68,30 Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS. xy  xy 118,99  14, 63  8, 25 b1     0, 087  2x 233, 63  14, 632 b0 = y – b1 x = 8,25 – (– 0,087)  14,63 = 9,52 Vậy mô hình có dạng: yˆ x  9,52  0, 087x . b) Để đánh giá mức độ chặt chẽ của mối liên hệ trên, ta tính hệ số tương quan: xy  x.y  233, 63  14, 632 r  b1 x   0, 087    0, 79 x y y 68,3  8, 252 Đây là mối liên hệ tương quan tuyến tính nghịch và tương đối chặt chẽ. c) Để xác định xem phương trình trên có phù hợp hay không, tính hệ số xác định: r2 = (– 0,79)2 = 0,6241. Có nghĩa là 62,41% sự thay đổi của điểm thi được giải thích bởi mô hình nói trên. Vì vậy, có thể sử dụng được mô hình này. Bài tập 4 a) Để xác định xem khi chiều cao tăng thêm 1 cm thì cân nặng thay đổi như thế nào, ta tính hệ số hồi quy b1 trong mô hình hồi quy tuyến tính biểu diễn ảnh hưởng của chiều cao tới cân nặng. Cân nặng Chiều cao (cm) xy x2 y2 (kg) y x 65 175 11.375 30.625 4.225 67 133 8.911 17.689 4.489 71 185 13.135 34.225 5.041 71 163 11.573 26569 5.041 66 126 8.316 15876 4.356 75 198 14.850 39204 5.625 67 153 10.251 23.409 4.489 70 163 11.410 26569 4.900 v1.0 175
  16. Đáp án – Nguyên lý thống kê 71 159 11.289 25281 5.041 69 151 10.419 22.801 4.761 69 155 10.695 24.025 4.761 761 1.761 122.224 286.273 52.729 69,18 160,09 11.111,27 26.024,82 4.793,55 Hệ số hồi quy được tính như sau: xy  xy 11.111, 27  160, 09  69,18 b1    0, 092 2x 26.024,82  160, 092 Vậy khi chiều cao tăng thêm 1cm thì cân nặng tăng thêm 0,092 kg. b) Để đánh giá mức độ chặt chẽ của mối liên hệ trên, ta tính hệ số tương quan: xy  x.y  26  024,82  160, 092 r  b1 x  0, 092   0, 661 x y y 4  793,55  69,182 Đây là mối liên hệ tương quan bình thường và có chiều hướng thuận. Bài tập 5 a) Mô hình hồi quy tuyến tính biểu diễn ảnh hưởng của GTSX tới lượng nhiên liệu tiêu thụ có dạng: yˆ x = b0 + b1x Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS. Giá trị Nhiên liệu Phân sản xuất tiêu thụ xy x2 ˆx y (x - x)2 ˆ x )2 (y - y xưởng (triệu đồng) (triệu đồng) x y A 520 23 11.960 270.400 16,726 17.776,889 39,363 B 595 20 11.900 354.025 18,099 3.402,389 3,616 C 945 25 23.625 893.025 24,504 8.5071,389 0,247 D 640 19 12.160 409.600 18,922 177,689 0,006 E 500 10 5.000 250.000 16,360 23.510,089 40,450 G 720 18 12.960 518.400 20,386 4.444,889 5,693 Tổng 3920 115 77.605 2.695.450 114,996 134.383,333 89,374 Trung 653,33 19,17 12.934,17 449.241,67 bình xy  xy 12.934,17  653,33  19,17 b1    0, 0183 2x 449.241, 67  653,332 b0 = y – b1 x = 19,17 – 0,0183  653,33 = 7,21 Vậy mô hình có dạng: yˆ x  7, 21  0, 0183x . b) Có cơ sở cho rằng, hệ số hồi quy trong phương trình biểu diễn mối liên hệ giữa GTSX và lượng nhiên liệu tiêu thụ là bằng 0. Khi đó, ta thực hiện kiểm định cặp giả thiết sau: H0: 1 = 0 (GTSX không có mối liên hệ với lượng nhiên liệu tiêu thụ). H1: 1 ≠ 0 (có mối liên hệ tuyến tính giữa GTSX với lượng nhiên liệu tiêu thụ). 176 v1.0
  17. Đáp án – Nguyên lý thống kê Chúng ta thực hiện kiểm định giả thiết trên với mức ý nghĩa  = 0,05. Khi đó giá trị tới hạn là ±tα/2 = ±t0,025, với độ tự do là n – 2 = 6 – 2 = 4, tra bảng ta xác định được giá trị tới hạn ±t0,025 = ± 2,776. Từ mẫu đã cho, tính tiêu chuẩn kiểm định t: b1 0, 0183 t   1,418 Se 4, 73  (x  x) 2 134.383,33 Với Se   (y  yˆ x )2  89,374  4, 73 n2 62 Vậy giá trị ttính = 1,418 < t0,025, df = 4 = 2,776, với mẫu ở trên và mức ý nghĩa  = 0,05, chưa có cơ sở bác bỏ H0. Vì vậy, không nên dùng GTSX để dự đoán giá trị của lượng nhiên liệu tiêu thụ. Bài tập 6 a) Phương trình hồi quy tuyến tính biểu diễn ảnh hưởng của số lần xem hay đọc quảng cáo đến số lon Coca Cola mua có dạng: yˆ x = b0 + b1x Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS. Số lần xem hay đọc quảng cáo – x Số lon đã mua – y xy x2 y2 4 12 48 16 144 9 14 126 81 196 3 7 21 9 49 0 6 0 0 36 1 3 3 1 9 6 5 30 36 25 2 5 10 4 25 5 10 50 25 100 30 62 288 172 584 3,75 7,75 36,00 21,50 73,00 xy  xy 36  3, 75  7, 75 b1    0,933 2x 21,5  3, 752 b0 = y – b1 x = 7,75 – 3,75  0,933 = 4,25 Vậy mô hình có dạng: yˆ x  4, 25  0,933x. b) Đánh giá trình độ chặt chẽ của mối liên hệ: xy  xy  21,5  3, 752 r  b1 x  0,933   0, 71 x y y 73  7, 752 Đây là mối liên hệ thuận và tương đối chặt chẽ. v1.0 177
  18. Đáp án – Nguyên lý thống kê c) Với điều nghi ngờ ở trên, thực hiện kiểm định cặp giả thiết sau: H0:  = 0 (số quảng cáo đã đọc hay xem và số lon Coca Cola đã mua không có mối liên hệ tuyến tính). H1:  > 0 (số quảng cáo đã đọc hay xem có mối liên hệ tương quan tuyến tính thuận với số lon Coca Cola đã mua). Với mức ý nghĩa α = 0,05, độ tự do df = n – 2 = 8 – 2 = 6, giá trị tới hạn tra bảng t0,05,df = 6 = 1,943. Từ mẫu đã cho, tính tiêu chuẩn kiểm định t: r 0, 71 t   2, 47 1  r2 1  0, 712 n2 82 Ta thấy t > tα = 1,943, với mẫu đã cho và mức ý nghĩa α = 0,05, bác bỏ giả thiết H0. Vậy có cơ sở để kết luận rằng, giữa số quảng cáo đã đọc hay xem có mối liên hệ tương quan tuyến tính thuận với số lon Coca Cola đã mua. Bài tập 7 a) Với mẫu đã cho, nếu biểu diễn trên đồ thị có thể thấy giữa tuổi và nhịp tim có mối liên hệ với nhau (thực tế thì y học đã chứng minh). Tuổi là nguyên nhân và nhịp tim là kết quả. b) Tính hệ số b1 trong phương trình hồi quy biểu diễn ảnh hưởng của tuổi đến nhịp tim. Nhịp tim Tuổi – x xy x2 yˆ x (x - x)2 ˆ x )2 (y - y (lần) y 30 186 5.580 900 188,052 46,24 4,211 38 183 6.954 1.444 178,932 1,44 16,549 41 171 7.011 1.681 175,512 17,64 20,358 38 177 6.726 1.444 178,932 1,44 3,733 29 191 5.539 841 189,192 60,84 3,269 39 177 6.903 1.521 177,792 4,84 0,627 46 175 8.050 2.116 169,812 84,64 26,915 41 176 7.216 1.681 175,512 17,64 0,238 42 171 7.182 1.764 174,372 27,04 11,370 24 196 4.704 576 194,892 163,84 1,228 368 1803 65.865 13.968 1.803,000 425,60 88,498 36,8 180,3 6.586,5 1.396,8 xy  xy 6586,5  36,8  180,3 b1     1,14  2x 1396,8  36,82 Vậy khi tuổi tăng thêm 1 thì nhịp tim sẽ giảm đi 1,14 lần/phút. c) Để xác định xem có thể dùng tuổi để dự đoán nhịp tim hay không (tức là giữa tuổi và nhịp tim có tồn tại mối liên hệ tuyến tính hay không), ta kiểm định cặp giả thiết sau : H0: 1 = 0 (tuổi không có mối liên hệ với nhịp tim). H1: 1 ≠ 0 (có mối liên hệ tuyến tính giữa tuổi và nhịp tim). Với mức ý nghĩa α = 0,05, độ tự do là n – 2 = 10 – 2 = 8, tra bảng ta xác định được giá trị tới hạn ±t0,025 = ±2,306. 178 v1.0
  19. Đáp án – Nguyên lý thống kê Từ mẫu đã cho, tính tiêu chuẩn kiểm định t: b1 1,14 t   –7,07 Se 3,326  (x  x) 2 425, 6 Với Se   (y  yˆ x )2  88, 498  3,326 n2 10  2 (từ mẫu trên, tính được b0 = 222,252 trong phương trình hồi quy tuyến tính giữa tuổi và nhịp tim, thay các giá trị của x để tính được giá trị lý thuyết yˆ x tương ứng). Vậy ta có: t > ±t0,025, bác bỏ giả thiết H0. Với mẫu đã cho và mức ý nghĩa α = 0,05, kết luận rằng: có thể dùng tuổi để dự đoán nhịp tim của một người nào đó. Bài tập 8 a) Vẽ đồ thị. b) Phương trình: yˆ x = b0 + b1x Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS. Giá vé Số hành khách xy x2 y2 (Cents) x trên 100 dặm – y 15 440 6.600 225 193.600 20 430 8.600 400 184.900 25 430 10.750 625 184.900 30 370 11.100 900 136.900 35 360 12.600 1.225 129.600 40 340 13.600 1.600 115.600 45 350 15.750 2.025 122.500 50 350 17.500 2.500 122.500 260 3.070 96.500 9.500 1.190.500 32,5 383,75 12.062,5 1.187,5 148.812,5 xy  xy 12062,5  32,5  383, 75 b1     3,12 2x 1187,5  32,52 b0 = y – b1 x = 383,75 – (–3,12)  32,5 = 485,15 Vậy mô hình có dạng: yˆ x  485,15  3,12x . c) Kiểm định cặp giả thiết sau: H0:  = 0 (giá vé và số hành khách trên 100 dặm không có mối liên hệ tuyến tính). H1:  < 0 (giá vé có mối liên hệ tương quan tuyến tính nghịch với số hành khách trên 100 dặm). v1.0 179
  20. Đáp án – Nguyên lý thống kê Với mức ý nghĩa α = 0,05, độ tự do df = n – 2 = 8 – 2 = 6, giá trị tới hạn tra bảng t0,05,df = 6 = 1,943. Từ mẫu đã cho, tính tiêu chuẩn kiểm định t: r 0,9048 t    5, 205 1  r2 1  ( 0,9048) 2 n2 82 Trong đó: hệ số tương quan của mẫu đã chọn ở trên được tính như sau: xy  xy  1187,5  32,52 r  b1  x   3,12    0,9048 x y y 148812,5  383, 752 Ta thấy t > tα = 1,943, bác bỏ giả thiết H0. Với mẫu đã cho và mức ý nghĩa α = 0,05, kết luận rằng: giữa giá vé xe buýt và số lượng hành khách là có mối liên hệ tương quan tuyến tính âm. Bài tập 9 ˆ x = b0 + b1x a) Phương trình: y Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS. Chi phí quản lý phải trả Số lượng (triệu đồng) y sản phẩm – x xy x2 ˆx y ˆ x )2 (y - y 191 40 7.640 1.600 179,22 138,77 170 42 7.140 1.764 192,20 492,84 272 53 14.416 2.809 263,59 70,73 155 35 5.425 1.225 146,77 67,73 280 56 15.680 3.136 283,06 9,36 173 39 6.747 1.521 172,73 0,07 234 48 11.232 2.304 231,14 8,18 116 30 3.480 900 114,32 2,82 153 37 5.661 1.369 159,75 45,56 178 40 7.120 1.600 179,22 1,49 1922 420 84.541 18.228 1.922,00 837,56 192,2 42,0 8.454,1 1.822,8 xy  xy 8.454,1  42  192, 2 b1    6, 49 2x 1.822,8  422 b0 = y – b1 x = 192,2 – 6,49  42 = –80,38 Vậy mô hình có dạng: yˆ x   80,38  6, 49x . b) Khi x = 50, yˆ 50   80,38  6, 49  50  244,12 (triệu đồng) c) Tính sai số tiêu chuẩn của mô hình dự đoán trên. Se   (y  yˆ x )2  837,56  10, 23 (triệu đồng) n2 10  2 180 v1.0
nguon tai.lieu . vn