Xem mẫu

  1. GIÁO TRÌNH NGUYÊN LÝ THỐNG KÊ Bài 5: Phân tích dãy số thời gian
  2. Bài 5: Phân tích dãy số thời gian 0 BÀI 5: PHÂN TÍCH DÃY SỐ THỜI GIAN Nội dung Mục tiêu Trang bị những kiến thức cơ bản về dãy số  Một số vấn đề chung về dãy số thời gian.  thời gian, bao gồm những khái niệm, các Các chỉ tiêu phân tích dãy số thời gian.  chỉ tiêu phân tích dãy số thời gian, các Một số phương pháp biểu diễn xu  phương pháp biểu diễn xu hướng phát hướng biến động của hiện tượng qua triển của hiện tượng và dự báo thống kê thời gian. ngắn hạn. Dự đoán thống kê ngắn hạn.  Thời lượng học Hướng dẫn học Nghe bài giảng, thảo luận với giảng viên 9 tiết   và học viên khác. Trả lời câu hỏi ôn tập và làm các bài tập ở  cuối bài học. 89 v1.0
  3. Bài 5: Phân tích dãy số thời gian TÌNH HUỐNG DẪN NHẬP Tên tình huống: Lập kế hoạch tình hình sản xuất kinh doanh của doanh nghiệp Bạn được sếp giao cho nhiệm vụ lập kế hoạch về tình hình sản xuất kinh doanh của doanh nghiệp trong vài năm tới. Để đảm bảo kế hoạch là khả thi, bạn tiến hành thu thập và tổng hợp tài liệu về tình hình sản xuất kinh doanh của doanh nghiệp trong những năm gần đây. Bạn định dựa trên cơ sở những số liệu thu thập đó để có thể phân tích sự biến động và tìm ra xu hướng phát triển của các hiện tượng, từ đó xác định được các mức độ kế hoạch trong tương lai. Câu hỏi Bạn sẽ phân tích dãy số liệu thu thập được như thế nào? Tìm ra tính quy luật của chúng ra sao? Làm thế nào để xác định được các mức độ của hiện tượng trong tương lai? Đó chính là nội dung của bài học này, phân tích mối liên hệ của hiện tượng theo thời gian. 90 v1.0
  4. Bài 5: Phân tích dãy số thời gian Mặt lượng của hiện tượng thường xuyên biến động qua thời gian. Để nghiên cứu sự biến động này, người ta thường sử dụng các dãy số thời gian. Vậy dãy số thời gian là gì? 5.1. Một số khái niệm chung về dãy số thời gian 5.1.1. Khái niệm và ý nghĩa của dãy số thời gian 5.1.1.1. Khái niệm Dãy số thời gian là một dãy các trị số của chỉ tiêu thống kê được sắp xếp theo thứ tự thời gian. Ví dụ 1: Có tài liệu về doanh thu của doanh nghiệp A qua các năm như sau: Năm 2004 2005 2006 2007 2008 Doanh thu (tỷ đồng) 25 29 36 50 60 Ví dụ 2: Có tài liệu về lao động của doanh nghiệp A như sau: Ngày 1/1/09 1/2/09 1/3/09 1/4/09 Số lao động (người) 350 370 370 380 Qua quan sát hai ví dụ trên ta thấy, một dãy số thời gian có kết cấu gồm 2 thành phần sau:  Thời gian: có thể là ngày, tuần, tháng, quý, năm tuỳ thuộc vào đặc điểm, tính chất của hiện tượng nghiên cứu. Độ dài giữa 2 thời gian liền nhau gọi là khoảng cách thời gian.  Chỉ tiêu về hiện tượng nghiên cứu: tên, đơn vị tính phù hợp và trị số của chỉ tiêu. Các trị số này được gọi là các mức độ của dãy số thời gian yi ( i  1, n ). Các mức độ của dãy số thời gian có thể là số tuyệt đối, số tương đối hoặc số bình quân. 5.1.1.2. Ý nghĩa Dãy số thời gian cho phép thống kê nghiên cứu xu hướng biến động của hiện tượng qua thời gian. Từ đó, tìm ra tính quy luật của sự phát triển đồng thời dự đoán được các mức độ của hiện tượng trong tương lai. 5.1.2. Các loại dãy số thời gian Một dãy số thời gian luôn bao gồm hai thành phần: thời gian và trị số của chỉ tiêu. Thời gian thì có thời kỳ và thời điểm. Trị số của chỉ tiêu có thể là số tuyệt đối, số tương đối hoặc số bình quân. Khi đó, ta có các loại dãy số thời gian tương ứng dưới đây.  Căn cứ vào các loại chỉ tiêu, dãy số thời gian được chia thành: o Dãy số số tuyệt đối: dãy số có các trị số của chỉ tiêu là số tuyệt đối. Ví dụ: Quy mô vốn của doanh nghiệp qua các năm. o Dãy số số tương đối: dãy số mà các trị số là các số tương đối. Ví dụ: Tốc độ tăng trưởng kinh tế hàng năm. o Dãy số số bình quân: dãy số mà các trị số là các số bình quân. Ví dụ: Năng suất lao động trung bình của doanh nghiệp qua các năm. Trong đó, dãy số tương đối và dãy số bình quân luôn là dãy số thời kỳ. 91 v1.0
  5. Bài 5: Phân tích dãy số thời gian Chú ý Nội dung bài giảng sẽ chỉ tập trung đi vào phân tích dãy số số tuyệt đối. Vì thế, các khái niệm liên quan dưới đây có thể không phù hợp với hai dãy số số tương đối và dãy số số bình quân.  Căn cứ vào đặc điểm biến động về quy mô của hiện tượng qua thời gian, dãy số được chia thành: o Dãy số thời kỳ: biểu hiện quy mô, khối lượng của hiện tượng trong từng khoảng thời gian nhất định. Các trị số của chỉ tiêu có thể cộng dồn với nhau tạo thành số có ý nghĩa trong thời gian dài hơn. Ví dụ 1 (phần 5.1.1.1) là dãy số thời kỳ, phản ánh quy mô doanh thu của doanh nghiệp qua từng năm. o Dãy số thời điểm: biểu hiện quy mô, khối lượng của hiện tượng tại những thời điểm nhất định. Các trị số của chỉ tiêu không thể cộng dồn với nhau vì không có ý nghĩa. Ví dụ 2 (phần 5.1.1.1) là dãy số thời điểm, phản ánh số lao động của doanh nghiệp tại từng thời điểm nhất định trong tháng. Để có thể nghiên cứu biến động của hiện tượng qua thời gian thì các mức độ trong dãy số phải đảm bảo tính chất có thể so sánh được, tức là dãy số thời gian đó phải đáp ứng một số yêu cầu nhất định. 5.1.3. Yêu cầu khi xây dựng dãy số thời gian  Phải thống nhất về nội dung và phương pháp tính chỉ tiêu qua thời gian. Ví dụ: Chỉ tiêu GDP ở nước ta hiện nay tính theo Hệ thống tài khoản quốc gia của Liên hợp quốc (SNA 1993), trước đó là chỉ tiêu Thu nhập quốc dân tính theo Hệ thống sản xuất vật chất của Liên Xô cũ (MPS).  Phải thống nhất về phạm vi tổng thể nghiên cứu. Ví dụ: Từ 1/8/2008, Hà Nội bao gồm Hà Tây và một số địa phương thuộc Vĩnh Phúc, Hoà Bình. Như vậy, không thể đem các số liệu của Hà Nội trước khi nhập tỉnh để so sánh với số liệu của Hà Nội hiện nay được.  Các khoảng cách thời gian trong dãy số nên bằng nhau, nhất là với các dãy số thời kỳ phải bằng nhau. 5.2. Các chỉ tiêu phân tích dãy số thời gian Chúng ta đã biết, mặt lượng của hiện tượng thường xuyên biến động. Để tìm ra tính quy luật của sự biến động đó, trong thống kê, người ta sử dụng 5 chỉ tiêu sau để phân tích dãy số thời gian: 5.2.1. Mức độ bình quân theo thời gian  Khái niệm Mức độ bình quân theo thời gian là chỉ tiêu tổng hợp phản ánh mức độ đại biểu của hiện tượng trong toàn bộ thời gian nghiên cứu hoặc từng giai đoạn nghiên cứu.  Công thức tính o Đối với dãy số thời kỳ: n y i y i 1 n 92 v1.0
  6. Bài 5: Phân tích dãy số thời gian Đối với dãy số thời điểm: Dãy số thời điểm phản ánh quy mô, khối lượng của o hiện tượng trong từng thời điểm. Để tính được mức độ bình quân một cách chính xác, người ta phải xác định trị số chỉ tiêu ở từng ngày. Nhưng trên thực tế, chúng ta chỉ có được trị số chỉ tiêu vào một ngày trong tháng nên phải giả thiết rằng khoảng giữa hai thời điểm điều tra, mật độ của hiện tượng tăng giảm đều đặn. Khi đó công thức tính mức độ bình quân qua thời gian như sau:  Trường hợp dãy số thời điểm có khoảng cách thời gian bằng nhau: y1  y2 y2  y3 y y y1 y   ...  n 1 n  y2  ...  yn 1  n y 2 2 2 2 2 n 1 n 1 Bản chất của cách tính này là chuyển từ dãy số thời điểm sang dãy số thời kỳ để thực hiện phép tính. Ví dụ: Số lao động của doanh nghiệp A tại các thời điểm: Ngày 1/1/09 1/2/09 1/3/09 1/4/09 Số lao động (người) 350 370 370 380 Yêu cầu: Tính số lao động bình quân trong qúy I/2009 của doanh nghiệp A. Hướng dẫn: Số lao động là số tuyệt đối vì vậy khi tính bình quân, ta phải sử dụng công thức bình quân cộng. Nhưng do đây là số tuyệt đối thời điểm, không thực hiện được phép cộng nên phải chuyển về nó về dạng cộng được, tức phải tính bình quân cho từng thời kỳ. Trước hết, ta phải tính số lao động bình quân từng tháng. Số lao động bình quân tháng 1 là số lao động bình quân của tất cả các ngày trong tháng 1. Giả thiết biến động số lao động các ngày trong tháng là tương đối đều đặn. Vậy, ta sẽ tính số lao động bình quân tháng 1 dựa vào số lao động ngày đầu tháng và cuối tháng (ở đây, có số liệu vào ngày 1/2, được coi là số liệu của ngày 31/1). y1  y 2 350  370 y1    360 (người) 2 2 Tương tự với tháng 2 và tháng 3: y 2  y3 370  370 y2    370 (người) 2 2 y3  y 4 370  380 y3    375 (người) 2 2 Khi đó, số lao động bình quân quý I/2009 là: y1 y 2 y 2 y3 y3 y 4 y1 y   y 2  y3  4 y  y 2  y3 2 2 2 22 22 2 y 1 4 1 3 3 350 380  370  370  2 2  368,33 hay 369 (người) 4 1 Vậy số lao động bình quân của doanh nghiệp trong quý I/2009 là 369 người. 93 v1.0
  7. Bài 5: Phân tích dãy số thời gian  Trường hợp dãy số thời điểm có khoảng cách thời gian không bằng nhau. y t ii y t i Trong đó: yi: Các mức độ của dãy số thời gian. ti: Khoảng cách thời gian có các mức độ yi tương ứng. Ví dụ: Có tài liệu về số lao động của doanh nghiệp A trong tháng 4/2009: Ngày 1/4 doanh nghiệp có 380 lao động. Đến ngày 10/4, doanh nghiệp tuyển dụng thêm 5 lao động. Ngày 15/4, tuyển dụng tiếp 3 lao động. Đến ngày 21/4, cho 4 lao động thôi việc. Yêu cầu: Tính số lao động bình quân trong tháng 4/2009 của doanh nghiệp. Hướng dẫn: Ta có dãy số thời gian thể hiện sự biến động số lao động của doanh nghiệp trong tháng 4/2009 như sau: Số lao động Khoảng cách thời gian Ngày yiti (ngày) ti (người) yi 1 380 9 3.420 10 385 5 1.925 15 388 6 2.328 21 384 10 3.840 ∑ 30 11.513 n y t ii 11.513 y   383, 77 hay 384 (người) i 1 n 30 t i i 1 Vậy số lao động bình quân trong tháng 4/2009 của doanh nghiệp là 384 người. 5.2.2. Lượng tăng (giảm) tuyệt đối  Khái niệm: Là chỉ tiêu phản ánh sự biến động về trị số tuyệt đối của chỉ tiêu giữa hai thời gian nghiên cứu hay nói cách khác, nó cho biết mức độ của hiện tượng nghiên cứu qua hai thời gian đã tăng/giảm một lượng tuyệt đối là bao nhiêu. Hai thời gian nghiên cứu ở đây có thể: o Liền nhau: liên hoàn. o Trong một khoảng thời gian có 1 năm gốc cố định: định gốc. o Trong một khoảng thời gian: bình quân.  Công thức tính: Tương ứng với 3 loại thời gian nghiên cứu ở trên, có 3 chỉ tiêu tính lượng tăng (giảm) tuyệt đối như sau: o Lượng tăng (giảm) tuyệt đối liên hoàn: phản ánh sự thay đổi trị số tuyệt đối giữa hai thời gian liền nhau. i = yi – yi – 1 Công thức: (i = 2, n ) 94 v1.0
  8. Bài 5: Phân tích dãy số thời gian Lượng tăng (giảm) tuyệt đối định gốc: phản ánh sự thay đổi trị số tuyệt đối o giữa các khoảng thời gian dài và thường lấy mức độ đầu tiên làm gốc cố định. Thực tế thì có thể chọn bất kỳ thời gian nào để làm gốc nhưng về mặt lý thuyết thì thường chọn mốc thời gian đầu tiên để làm gốc. i = yi – y1 (i = 2, n ) Công thức: Ví dụ: Tiếp ví dụ 1 phần 5.1.1.1: N ăm 2004 2005 2006 2007 2008 Doanh thu (tỷ đồng) 25 29 36 50 60 i (tỷ đồng) 2 = 4 3 = 7 4 = 14 5 = 10 i (tỷ đồng) 2 = 4  3 = 11  4 = 25  5 = 35 Từ hai công thức trên, ta thấy mối liên hệ giữa lượng tăng (giảm) tuyệt đối liên hoàn và lượng tăng (giảm) tuyệt đối định gốc: lượng tăng (giảm) tuyệt đối định gốc trong một thời gian bằng tổng các lượng tăng (giảm) tuyệt đối liên hoàn trong thời gian đó. n  i   i   n   i  y n  y1 i2 5 Như ở ví dụ trên,  5    i  4  7  14  10  35 (tỷ đồng) là lượng tăng tuyệt i 2 đối về chỉ tiêu doanh thu của doanh nghiệp năm 2008 so với năm 2004. Lượng tăng (giảm) tuyệt đối bình quân: Là bình quân cộng của các lượng tăng o (giảm) tuyệt đối liên hoàn, phản ánh mức độ của hiện tượng nghiên cứu đã tăng hay giảm bình quân là bao nhiêu. n  n y  y1 i Công thức:    n i2 n 1 n 1 n 1 Áp dụng số liệu ở ví dụ trên, ta có:  35  5   8, 75 (tỷ đồng) 5 1 4 Như vậy, trong giai đoạn 2004 – 2008, bình quân mỗi năm doanh thu của doanh nghiệp tăng thêm 8,75 tỷ đồng. Chú ý  chỉ phụ thuộc vào mức độ đầu tiên và mức độ cuối cùng. Do vậy, chỉ nên tính khi các mức độ của dãy số có cùng xu hướng và nên kết hợp với các lượng tăng giảm tuyệt đối liên hoàn i để phân tích thì mới chặt chẽ. 5.2.3. Tốc độ phát triển  Khái niệm: Là chỉ tiêu phản ánh xu hướng phát triển của hiện tượng qua thời gian. Về bản chất, tốc độ phát triển giống như số tương đối động thái.  Công thức tính: Tương tự như lượng tăng (giảm) tuyệt đối, tốc độ phát triển cũng được chia thành 3 loại và có cách tính như sau: o Tốc độ phát triển liên hoàn: Phản ánh sự phát triển của hiện tượng giữa hai thời gian liền nhau. 95 v1.0
  9. Bài 5: Phân tích dãy số thời gian  yi ti  (lần, %) i = 2, n yi 1 Tốc độ phát triển định gốc: Phản ánh sự phát o triển của hiện tượng trong các khoảng thời gian dài và lấy mức độ đầu tiên làm gốc cố định.  y Ti  i (lần, %) i = 2, n y1 Ví dụ: Với ví dụ 1 trong phần 5.1.1.1, ta có: N ăm 2004 2005 2006 2007 2008 Doanh thu (tỷ đồng) 25 29 36 50 60 ti (lần) t2 = 1,16 t3 = 1,24 t4 = 1,39 t5 = 1,20 Ti (lần) T2 = 1,16 T3 = 1,44 T4 = 2,00 T5 = 2,40 Mối liên hệ giữa tốc độ phát triển liên hoàn và tốc độ phát triển định gốc:  Tốc độ phát triển định gốc trong 1 độ dài thời gian bằng tích các tốc độ phát triển liên hoàn trong thời gian đó. n Ti = Πti  Tn =  t i i2  Tốc độ phát triển liên hoàn bằng thương của 2 tốc độ phát triển định gốc liền nhau. T ti  i Ti 1 Tốc độ phát triển bình quân: Là bình quân nhân của các tốc độ phát liên hoàn, o phản ánh tốc độ phát triển đại diện trong cả 1 thời kỳ dài. yn n t  n 1 t i  n 1 Tn  n 1 y1 i2 Với ví dụ trên, ta có: t  4 T5  4 2, 40  1,245 (lần) hay 124,5% Như vậy, trong giai đoạn 2004 – 2008, tốc độ phát triển trung bình của chỉ tiêu doanh thu của doanh nghiệp A là 1,245 (lần) hay 124,5%. Chú ý t bản chất là trung bình nhân của ti nhưng thực chất chỉ phụ thuộc vào hai mức độ đầu và cuối của dãy số. Do đó, chỉ nên tính khi các mức độ của dãy số có cùng xu hướng. Nếu không cùng xu hướng thì nên dùng tốc độ phát triển liên hoàn. 5.2.4. Tốc độ tăng (giảm)  Khái niệm: Tốc độ tăng (giảm) là chỉ tiêu phản ánh mức độ của hiện tượng trong hai thời gian nghiên cứu tăng lên hay giảm đi bao nhiêu lần hay bao nhiêu %.  Công thức tính: o Tốc độ tăng (giảm) liên hoàn: phản ánh tốc độ tăng, giảm của hai thời gian liền nhau. y i  y i 1   ai  i   t i  1 (lần) i = 2, n yi 1 yi 1 96 v1.0
  10. Bài 5: Phân tích dãy số thời gian Tốc độ tăng (giảm) định gốc: phản ánh sự biến động tương đối giữa những o khoảng thời gian dài, thường lấy mức độ đầu tiên làm gốc cố định.  i yi  y1 yi  Ai     1  Ti  1 (lần) i = 2, n y1 y1 y1 Ví dụ: Với ví dụ 1 trong phần 5.1.1.1, ta có: a N ăm 2004 2005 2006 2007 2008 Doanh thu (tỷ đồng) 25 29 36 50 60 ai (lần) a2 = 0,16 a3 = 0,24 a4 = 0,39 a5 = 0,20 Ai (lần) A2 = 0,16 A3 = 0,44 A4 = 1,00 A5 = 1,40 Lưu ý: Không có mối quan hệ giữa tốc độ tăng (giảm) liên hoàn và định gốc. Tốc độ tăng (giảm) bình quân: phản ánh tốc độ tăng (giảm) đại diện của hiện o tượng trong một thời gian nghiên cứu. a  t  1 (lần) hay a  t  100 (%) a  t  1 = 1,245 – 1 = 0,245 lần (hay 24,5%) Vậy, trong giai đoạn 2004 – 2008, doanh thu của doanh nghiệp A tăng trung bình 0,245 (lần/năm) hay 24,5%/năm. Chú ý a cũng chỉ nên sử dụng khi dãy số có cùng xu hướng. Trong thống kê luôn luôn phải sử dụng kết hợp số tuyệt đối và số tương đối, bởi nhiều hiện tượng mặc dù có cùng tốc độ tăng (giảm) nhưng giá trị tuyệt đối của nó lại hoàn toàn khác nhau. Sự khác nhau đó được quyết định bởi gốc so sánh, có nghĩa là cùng một tốc độ như nhau nhưng chỉ tiêu nào có gốc so sánh lớn hơn thì lượng tăng (giảm) tuyệt đối của nó cũng lớn hơn. Trong thống kê, người ta thường sử dụng chỉ tiêu sau để phản ánh mức độ tăng (giảm) của hiện tượng. 5.2.5. Giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn Là sự kết hợp giữa chỉ tiêu lượng tăng (giảm) tuyệt đối và chỉ tiêu tốc độ tăng (giảm).  Khái niệm: Giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn phản ánh sự kết hợp giữa số tương đối và số tuyệt đối. Cụ thể, nó biểu hiện cứ 1% tăng hay giảm liên hoàn thì tương ứng với 1 trị số tuyệt đối là bao nhiêu.  Công thức tính: i i y gi    i 1 i a i (%)  100 100 yi 1 gi: là số tuyệt đối, nên đơn vị tính tương ứng với đơn vị tính của chỉ tiêu nghiên cứu. Ví dụ: Với ví dụ 1 trong phần 5.1.1.1, ta có: 97 v1.0
  11. Bài 5: Phân tích dãy số thời gian N ăm 2004 2005 2006 2007 2008 Doanh thu (tỷ đồng) 25 29 36 50 60 gi (tỷ đồng) g2 = 0,25 g3 = 0,29 g4 = 0,36 g5 = 0,50 Lưu ý: Trên thực tế, người ta không dùng chỉ tiêu giá trị tuyệt đối của 1% tốc độ tăng (giảm) định gốc vì nó luôn là 1 hằng số. i i y Gi    1  const A i (%)  i  100 100 y1 Không có Gi nên không có mối liên hệ giữa Gi và gi, do đó cũng không có g . Bên cạnh việc phân tích sự biến động của dãy số thời gian, một vấn đề rất quan trọng là phải thấy được xu hướng biến động của hiện tượng. 5.3. Một số phương pháp biểu diễn xu hướng biến động cơ bản của hiện tượng 5.3.1. Sự cần thiết phải nghiên cứu các phương pháp biểu diễn xu hướng biến động cơ bản của hiện tượng Hiện tượng biến động qua thời gian, chịu ảnh hưởng bởi nhiều nhóm nhân tố, trong đó:  Các nhân tố chủ yếu, tác động đến hiện tượng và quyết định xu hướng phát triển cơ bản của hiện tượng.  Các nhân tố ngẫu nhiên tác động một cách ngẫu nhiên làm cho hiện tượng sai lệch so với xu hướng chung. Vấn đề đặt ra là phải loại trừ những nhân tố ngẫu nhiên và làm bộc lộ ra những nhân tố cơ bản. Mục đích chung của các phương pháp này là loại bỏ những nhân tố ngẫu nhiên. Nhưng để thực hiện được các phương pháp này, điều kiện đầu tiên là phải đảm bảo tính chất có thể so sánh được giữa các mức độ của hiện tượng trong dãy số. 5.3.2. Các phương pháp biểu diễn xu hướng biến động cơ bản của hiện tượng Thống kê sử dụng 4 phương pháp cơ bản dưới đây: 5.3.2.1. Phương pháp mở rộng khoảng cách thời gian  Nội dung: Mở rộng thêm khoảng cách thời gian bằng cách ghép một số thời gian liền nhau vào thành một khoảng thời gian dài hơn. Ví dụ: Mở rộng khoảng cách thời gian từ tháng thành quý, từ quý thành năm... Mục đích là để từ dãy số không có hoặc chưa thể hiện rõ tính quy luật thành dãy số xuất hiện tính quy luật (triệt tiêu ngẫu nhiên để biểu hiện xu hướng).  Vận dụng: Mở rộng khoảng cách thời gian được vận dụng với dãy số thời kỳ có khoảng cách thời gian tương đối ngắn, nhiều mức độ và chưa thấy rõ được xu hướng phát triển cơ bản của hiện tượng. Thời gian dài – ngắn mang ý nghĩa tương đối, phụ thuộc vào đặc điểm của hiện tượng và từng loại chỉ tiêu khác nhau. 98 v1.0
  12. Bài 5: Phân tích dãy số thời gian Ví dụ: Sản phẩm của ngành chế biến thủy sản có thể xét theo ngày, tuần. Nhưng sản phẩm của ngành đóng tàu phải xét theo tháng, năm…  Hạn chế: o Do ghép nhiều khoảng thời gian vào thành một nên số lượng các mức độ trong dãy số mất đi quá nhiều, đôi khi làm mất ảnh hưởng của các nhân tố cơ bản. Ví dụ: Số liệu từ tháng chuyển thành qúy, từ 12 mức độ còn 4 mức độ, tức là mất đi 2/3 số mức độ ban đầu. o Trường hợp sử dụng với những hiện tượng có tính chất thời vụ sẽ làm mất đi tính chất thời vụ của hiện tượng. 5.3.2.2. Phương pháp bình quân trượt Từ đặc điểm của số bình quân là san bằng các chênh lệch vì thế nó san bằng các nhân tố ngẫu nhiên làm bộc lộ nhân tố cơ bản của hiện tượng, người ta đưa ra khái niệm số bình quân trượt.  Khái niệm: Số bình quân trượt là số bình quân của một nhóm nhất định các mức độ trong dãy số được tính bằng cách lần lượt loại trừ dần mức độ đầu, đồng thời thêm vào các mức độ tiếp theo sao cho số lượng các mức độ tham gia tính số bình quân là không đổi. Dãy số bình quân trượt là dãy số được hình thành từ các số bình quân trượt. Ví dụ: Có dãy số thời gian n mức độ y1, y2, …, yn Giả sử nhóm 3 mức độ để tính số bình quân trượt, ta có: y1  y 2  y3 y2  ; 3 y  y3  y 4 y3  2 ; 3 … y n  2  y n 1  y n y n 1  3 y 2 , y3 ,..., y n được gọi là dãy số bình quân trượt lần thứ nhất (MA1). Nếu dãy số vẫn chưa bộc lộ rõ xu hướng, nghĩa là chưa loại bỏ hết các yếu tố ngẫu nhiên thì có thể tính bình quân trượt lần thứ hai. y 2  y3  y 4 y3  ; 3 y3  y 4  y5 y4  ; 3 … y n 3  y n  2  y n 1 yn 2  3 99 v1.0
  13. Bài 5: Phân tích dãy số thời gian Khi đó ta có dãy số bình quân trượt lần thứ 2 (MA2). Ngoài phương pháp trượt như trên còn có thể tính số bình quân trượt có trọng số.  Vận dụng: Với dãy số thời kỳ theo tháng, quý, năm nhưng không có yếu tố thời vụ.  Ưu điểm: So với mở rộng khoảng cách thời gian thì số lượng các mức độ trong dãy số mất đi ít hơn, khi biểu diễn trên đồ thị sẽ thấy xu hướng rõ ràng hơn.  Hạn chế: Trong trường hợp sử dụng với những hiện tượng có tính chất thời vụ sẽ làm mất đi tính chất thời vụ của hiện tượng. Để khắc phục nhược điểm của hai phương pháp trên, người ta sử dụng phương pháp dưới đây. 5.3.2.3. Phương pháp hồi quy theo thời gian  Nội dung: Phương pháp hồi quy trong dãy số thời gian được vận dụng để biểu diễn xu hướng phát triển cơ bản của những hiện tượng có nhiều dao động ngẫu nhiên. Khi đó, người ta xây dựng một hàm số (gọi là phương trình hồi quy) nhằm phản ánh biến động của hiện tượng theo thời gian. ˆ Hàm số này có dạng tổng quát: y t = f(t) và thường được gọi là hàm xu thế. Trong đó: o t: là biến thời gian, là thứ tự thời gian theo quy ước, đóng vai trò là biến số độc lập trong phương trình hồi quy. – < t < + ˆ y t : Mức độ của hiện tượng ở thời gian t tính từ hàm xu thế. o  Các dạng hàm xu thế thường sử dụng o Hàm xu thế tuyến tính: Sử dụng khi dãy số thời gian có các lượng tăng (giảm) tuyệt đối liên hoàn xấp xỉ nhau. ˆ y t = a0 + a1 t Hàm có dạng: Các tham số a0, a1 được xác định bằng phương pháp bình phương nhỏ nhất. Theo đó, a0 và a1 phải thỏa mãn phương trình:  y  na 0  a1  t    ty  a 0  t  a1  t 2  ty  ty a1  hoặc: và a 0 = y – a1 t 2t Chú ý Để dễ tính nên chọn t sao cho t = 0. Kết quả ở hàm hồi quy sẽ khác nhau nhưng dùng để dự báo thì đều có giá trị như nhau. Hàm xu thế parabol: Được sử dụng trong trường hợp các mức độ của dãy số o tăng dần theo thời gian đạt cực đại, sau đó lại giảm dần theo thời gian hoặc giảm dần theo thời gian đạt cực tiểu, sau đó lại tăng dần theo thời gian. y t = a 0 + a 1 t + a2 t 2 ˆ Hàm có dạng: Các tham số được xác định bằng phương pháp bình phương nhỏ nhất và phải thỏa mãn hệ phương trình: 100 v1.0
  14. Bài 5: Phân tích dãy số thời gian   y  a 0  n  a1   t  a 2   t 2    ty  a 0   t  a1   t  a 2   t 2 3    t y  a 0   t  a1   t  a 2   t 2 2 3 4  Hàm xu thế hypebol: Được sử dụng khi các mức độ của hiện tượng giảm dần o theo thời gian. a yt  a 0  1 ˆ Hàm có dạng: t Các tham số a0, a1 được xác định bằng phương pháp bình phương nhỏ nhất và phải thỏa mãn hệ phương trình:  1   y  a 0 n  a1  t    1 y  a  1  a  1 t 0 1  t2 t Hàm xu thế mũ: Được sử dụng khi các tốc độ phát triển liên hoàn xấp xỉ nhau. o y t  a 0  a1 t ˆ Hàm có dạng: lny = lna0 + t  lna1 hay: Các tham số a0, a1 được xác định bằng phương pháp bình phương nhỏ nhất và lna, lnb phải thỏa mãn hệ phương trình:  ln y  ln a 0  n  ln a1   t    t ln y  ln a 0   t  ln a1   t 2  Ví dụ: Có số liệu về sản lượng sản xuất của doanh nghiệp A qua các năm như sau: N ăm 2003 2004 2005 2006 2007 2008 Sản lượng (triệu sản phẩm) 10,0 12,5 15,4 17,6 20,2 22,9 Yêu cầu: Xây dựng hàm xu thế tuyến tính biểu diễn biến động của sản lượng sản xuất của doanh nghiệp qua thời gian. Hướng dẫn: ˆ yt = a0 + a1t Hàm xu thế tuyến tính có dạng: Trong đó: y: Sản lượng sản xuất của doanh nghiệp. t: Biến thứ tự thời gian. Nếu quy ước năm 2003, t = 1; năm 2004, t = 2, ta có các giá trị khác của t như ở bảng dưới đây: t2 N ăm Sản lượng (y) Thứ tự thời gian (t) ty 2003 10,0 1 10,0 1 2004 12,5 2 25,0 4 2005 15,4 3 46,2 9 2006 17,6 4 70,4 16 2007 20,2 5 101,0 25 2008 22,9 6 137,4 36 Cộng 98,6 21 390,0 91 Trung bình 16,43 3,50 65,0 15,17 101 v1.0
  15. Bài 5: Phân tích dãy số thời gian Khi đó, các giá trị a0, a1 ở trên được xác định bằng phương pháp bình phương nhỏ nhất và được tính theo công thức: ty  ty 65  3,5  16, 43 a1   = 2,567 15,17   3,5  2 2 t a0 = y – a1 t = 16, 43  2,567  3,5 = 7,446 Vậy hàm xu thế tuyến tính biểu diễn biến động sản lượng sản xuất của doanh nghiệp qua thời gian là: ˆ yt = 7,446 + 2,567t Lựa chọn hàm xu thế nào thì tốt? o Với một dãy số liệu, người ta có thể xây dựng nhiều hàm xu thế khác nhau. Liệu hàm xu thế nào là tốt? Khi đó, từ các hàm xu thế, người ta tính sai số chuẩn của mỗi hàm xu thế và chọn dạng hàm cho sai số chuẩn nhỏ nhất.  (y  y t )2 ˆ Se  t np Trong đó: y t : Mức độ thực tế của hiện tượng ở thời gian t. ˆ yt : Mức độ của hiện tượng ở thời gian t được tính từ hàm xu thế. n: Số lượng các mức độ của dãy số thời gian. p: Số lượng các tham số của hàm xu thế (hàm tuyến tính: p = 2; parabol: p = 3; hypebol: p = 2; hàm mũ: p = 2). 5.3.2.4. Phương pháp biểu hiện biến động thời vụ  Khái niệm: Biến động thời vụ là sự biến động của hiện tượng có tính chất lặp đi lặp lại trong từng thời gian nhất định. Nguyên nhân của biến động thời vụ là do ảnh hưởng của điều kiện tự nhiên và tập quán sinh hoạt của dân cư. Ảnh hưởng nhiều nhất là trong các ngành nông nghiệp, du lịch và các ngành công nghiệp chế biến sản phẩm từ nông nghiệp, các ngành khai thác... Biến động thời vụ làm cho hiện tượng lúc thì mở rộng, khẩn trương, khi thì thu hẹp, nhàn rỗi. Biến động thời vụ thường gây ra tình trạng làm ảnh hưởng đến hoạt động sản xuất kinh doanh của ngành đó và các ngành có liên quan. Vì vậy, việc nghiên cứu biến động thời vụ cho phép chủ động trong công tác quản lý kinh tế - xã hội, lập kế hoạch sản xuất hay hoạt động nghiệp vụ thích hợp, hạn chế ảnh hưởng đến sản xuất và sinh hoạt xã hội. 102 v1.0
  16. Bài 5: Phân tích dãy số thời gian  Phương pháp nghiên cứu: Nghiên cứu biến động thời vụ thường dựa vào nguồn số liệu trong nhiều năm, ít nhất là 3 năm và sử dụng phương pháp tính chỉ số thời vụ.  Công thức tính o Đối với dãy số không có xu thế: Dãy số không có xu thế là dãy số mà các mức độ theo thời gian tương đối ổn định: cùng kỳ từ năm này qua năm khác không có biểu hiện tăng giảm rõ rệt (biến động thời vụ không có xu thế). y y 0 Thời gian yi Công thức: Ii = × 100 y0 Trong đó: Ii: Chỉ số thời vụ của thời gian thứ i (có thể là tháng, quý,...). y i : Mức độ bình quân của thời gian i qua các năm. y 0 : Mức độ bình quân chung của dãy số. Ii > 100% cho biết: Sự biến động của hiện tượng ở thời gian i tăng, tức đây là thời kỳ bận rộn và ngược lại. Ví dụ: Mức tiêu thụ hàng hóa trong 3 năm của doanh nghiệp A như sau: N ăm Mức tiêu thụ hàng hóa (triệu đồng) yi Ii (%) Quý 2006 2007 2008 I 4.489 4.589 4.574 4.551 63.86 II 7.957 8.296 8.000 8.084 113.46 III 9.450 9.524 9.514 9.496 133.27 IV 6.376 6.294 6.444 6.371 89.41 ∑ 400.00 28.272 28.703 28.532  Tính các mức độ bình quân của từng quý qua 3 năm yi . 4.489  4.589  4.574 y1   4.551 (triệu đồng) 3 Tương tự với các qúy khác (kết quả như trên bảng).  Tính mức độ bình quân chung: 28.272  28.703  28.532 y0   7.126 (triệu đồng) 12  Tính các chỉ số thời vụ cho từng quý Ii: y1 4.551 I1   100   100  63,87% 7.126 y0 Ii của các quý khác tính tương tự (kết quả cho ở bảng trên). 103 v1.0
  17. Bài 5: Phân tích dãy số thời gian Nhận xét: Mặt hàng này tiêu thụ mạnh (trên mức bình quân chung) trong quý II và quý III và tiêu thụ ít (dưới mức bình quân chung) vào các quý I, quý IV. Đối với dãy số có xu thế: Nếu các mức độ cùng kỳ của hiện tượng từ năm này o qua năm khác có biểu hiện tăng hay giảm rõ rệt (có yếu tố thời vụ và xu thế), muốn tính chỉ số thời vụ, trước hết phải điều chỉnh dãy số bằng phương trình hồi quy để tính các mức độ lý thuyết rồi sau đó dùng các mức độ này làm căn cứ so sánh. ˆt y y 0 Thời gian Công thức: yij n y ˆ j 1 ij Ii   100 (%) m Trong đó: yij: Mức độ thực tế của thời kỳ thứ i (i = 1, n ) thuộc năm j (j = 1, m ). ˆ yij : Mức độ lý thuyết của thời kỳ thứ i (i = 1, n ) thuộc năm j (j = 1, m ) được tính từ hàm xu thế. m: Số năm nghiên cứu. Ví dụ: Mức tiêu thụ hàng hóa trong 3 năm của 1 doanh nghiệp như sau: Mức độ lý thuyết Mức độ thực tế y ij (triệu đồng) ×100(%) (triệu đồng) ˆ y ij Quý Ii (%) ˆ yij yij 2006 2007 2008 2006 2007 2008 2006 2007 2008 I 1.639 2.336 3.030 866 1.808 2.750 189,28 129,21 110,18 142,89 II 864 1.091 2.177 1.101 2.043 2.986 78,44 53,39 72,92 68,25 III 671 1.407 2.603 1.337 2.279 3.221 50,19 61,74 80,81 64,25 IV 2.410 2.749 4.958 1.572 2.515 3.457 153,26 109,32 143,44 135,34 ∑ 5.584 7.583 12.768 4.877 8.645 12.413 ˆ Bước 1: Xác định hàm xu thế tuyến tính dạng y t = a0 + a1t Sau khi sắp xếp lại số liệu theo thứ tự thời gian, ta có bảng số liệu: 104 v1.0
  18. Bài 5: Phân tích dãy số thời gian Mức tiêu thụ Thứ tự thời t2 Thời gian ty hàng hóa (y) gian (t) I/2006 1.639 1 1.639 1 II/2006 864 2 1.728 4 III/2006 671 3 2.013 9 IV/2006 2.410 4 9.640 16 I/2007 2.336 5 11.680 25 II/2007 1.091 6 6.546 36 III/2007 1.407 7 9.849 49 IV/2007 2.749 8 21.992 64 I/2008 3.030 9 27.270 81 II/2008 2.177 10 21.770 100 III/2008 2.603 11 28.633 121 IV/2008 4.958 12 59.496 144 Cộng 25.935 78 202.256 650 Từ đó, các tham số của hàm xu thế được xác định như sau: 202256 78 25935   ty  ty 12 12 12 = 235.514 a1   2 2 650  78  t   12  12  25935 78  235.514  a0 = y – a1 t = = 630.409 12 12 Hàm xu thế tuyến tính có dạng: ˆ y t = 630.409 + 235.514t ˆ Bước 2: Thay t từ 1 – 12 có kết quả yij tương ứng (bảng trên). y ij  100 (%) và Ii theo công thức. Bước 3: Tính ˆ yij Nhận xét: Mặt hàng này tiêu thụ mạnh (trên mức bình quân chung) trong quý I và quý IV và tiêu thụ ít (dưới mức bình quân chung) vào các quý II, quý III. 5.4. Một số phương pháp dự đoán thống kê ngắn hạn 5.4.1. Khái niệm dự đoán thống kê ngắn hạn Dự đoán thống kê là việc xác định các mức độ của hiện tượng nghiên cứu trong tương lai. Dự đoán chia ra làm 3 loại: dài hạn (> 10 năm), trung hạn (3 – 10 năm) và ngắn hạn (< 3 năm), thời gian quá khứ ít nhất là 5 mức độ. Xuất phát từ đối tượng và nhiệm vụ nghiên cứu, từ nguồn tài liệu thích hợp, thống kê thường thực hiện dự đoán ngắn hạn hay còn gọi là dự đoán thống kê ngắn hạn. 105 v1.0
  19. Bài 5: Phân tích dãy số thời gian Đây là công cụ quan trọng để tổ chức quản lý thường xuyên các hoạt động sản xuất kinh doanh của các ngành, các cấp. Nó cho phép phát hiện những nhân tố mới, những sự mất cân đối để từ đó có biện pháp phù hợp trong quá trình quản lý, hay nói cách khác, đây là cơ sở cho việc ra quyết định trong quản lý. Có nhiều phương pháp dự đoán khác nhau, phụ thuộc vào nguồn thông tin cũng như mục tiêu của dự đoán. Nhưng nội dung cơ bản của dự đoán thống kê là dựa trên các giá trị đã biết hay các mức độ của dãy số thời gian, phân tích các yếu tố ảnh hưởng đến sự biến động của hiện tượng, thừa nhận rằng những yếu tố đã và đang tác động sẽ vẫn còn tác động đến hiện tượng trong tương lai để xây dựng mô hình dự đoán. Chính vì vậy, người ta còn gọi dự đoán thống kê là dự đoán có điều kiện. Cụ thể, có 3 phương pháp dự đoán cơ bản sau:  Phương pháp chuyên gia: Tham khảo, hỏi ý kiến các chuyên gia về sự phát triển trong tương lai ở lĩnh vực mà chuyên gia đó am hiểu.  Phương pháp hồi quy: Mô hình hoá hiện tượng chịu tác động của nhiều nhân tố từ đó xây dựng phương trình hồi quy. Phương pháp này tính toán phức tạp nên chỉ phù hợp với dự đoán trung và dài hạn.  Phương pháp dãy số thời gian: Xây dựng mô hình và dự đoán. Phương pháp này dễ tính, cần ít tài liệu nên thích hợp đối với dự đoán thống kê ngắn hạn. Dưới đây, bài giảng sẽ giới thiệu một số phương pháp dự đoán thống kê ngắn hạn dựa trên cơ sở phân tích dãy số thời gian. 5.4.2. Một số phương pháp dự đoán thống kê ngắn hạn 5.4.2.1. Dựa vào lượng tăng (giảm) tuyệt đối trung bình yn  L  yn    L ˆ Mô hình dự đoán: Trong đó: L là tầm xa dự đoán. y n  y1 Theo công thức này, giá trị dự đoán phụ thuộc phần lớn vào  = hay chính n 1 xác hơn là dựa vào yn và yl. Do đó, chỉ nên áp dụng phương pháp này khi dãy số thời gian có các lượng tăng hay giảm tuyệt đối liên hoàn xấp xỉ nhau. 5.4.2.2. Dựa vào tốc độ phát triển trung bình  L yn L  yn t ˆ Mô hình dự đoán: Trong đó: L là tầm xa dự đoán. yn Giá trị dự đoán phụ thuộc phần lớn vào t  n 1hay chính xác hơn là dựa vào yn và y1 y1. Do đó, chỉ nên áp dụng phương pháp này khi dãy số thời gian có các tốc độ phát triển liên hoàn xấp xỉ nhau. 5.4.2.3. Ngoại suy hàm xu thế Mô hình dự đoán: y t  f  t  ˆ với f(t) là hàm xu thế tìm được, thay giá trị t tương ứng với thời kỳ cần dự đoán để tìm ˆ ra yt . 106 v1.0
  20. Bài 5: Phân tích dãy số thời gian 5.4.2.4. Dự đoán kết hợp xu thế và biến động thời vụ Mô hình dự đoán: y t  f  t   Ii ˆ với f(t) là hàm xu thế tìm được, Ii là chỉ số thời vụ đối với từng thời kỳ cụ thể, thay giá ˆ trị t tương ứng để tìm yt . Ví dụ: Với ví dụ về sản lượng sản xuất của doanh nghiệp ở trên, ta có:  Dự đoán sản lượng năm 2009 theo lượng tăng/giảm tuyệt đối trung bình: y n  y1 22,9  10, 0 =   2,58 n 1 6 1 Vậy y 2009  y 2008    1 = 22,9 + 2,58  1 = 25,48 (triệu sản phẩm) ˆ  Dự đoán sản lượng năm 2009 theo phương pháp ngoại suy hàm xu thế: Hàm xu thế tuyến tính biểu diễn biến động của sản lượng sản xuất qua thời gian: ˆ y t = 7,446 + 2,567t Năm 2009, tương ứng t = 7, vậy y2009 = 7,446 + 2,567  7 = 25,415 (triệu sản phẩm). ˆ 107 v1.0
nguon tai.lieu . vn