Xem mẫu

PHÂN TÍCH DỮ LIỆU
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP. HCM

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian
NỘI DUNG MÔN HỌC

Chương 7: Phân tích chuỗi thời gian
Khoa KTXD - Bộ môn KTTNN

Giảng viên: PGS. TS. NGUYỄN THỐNG
E-mail: nguyenthong@hcmut.edu.vn or nthong56@yahoo.fr
Web: http://www4.hcmut.edu.vn/~nguyenthong/
PGS. TS. Nguyễn Tél. (08)
Thống

1

Chương 1. Thống kê mô tả (ôn).
Chương 1bis. Xác suất & phân phối thống kê (ôn)..
Chương 2. Khoảng tin cậy.
Chương 3. Kiểm định thống kê.
Chương 4. Phân loại dữ liệu (Classification).
Chương 5. Phân nhóm dữ liệu (Cluster).
Chương 6. Phân tích thành phần chính (PCA).
Chương 7. Phân tích chuỗi thời gian.
Chương 8. Hồi quy tuyến tính.
Chương 9. Xử lý số liệu thực nghiệm.
Chương 10. Giới thiệu phần mềm SPSS or R

PGS. TS. Nguyễn Thống

38 691 592- 098 99 66 719

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

PHÂN TÍCH CHUỖI THỜI GIAN
Phương pháp phân rã
(Decoposition method)

PHÂN TÍCH CHUỖI THỜI GIAN
(PHƯƠNG PHÁP PHÂN RÃ)

Y

???

Y5

 Phương pháp Box-Renkins
(AR  Auto Regressive
MA  Mobile Average
ARMA, ARIMA, SARIMA)
PGS. TS. Nguyễn Thống

Y0
t1

0
3

t2

t4

t3

t5

t.

tn

PGS. TS. Nguyễn Thống

t

tn+1

Thời điểm hiện tại

4

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

PHƯƠNG PHÁP PHÂN RÃ

1. PHÂN TÍCH XU THẾ: Đây là một phân tích liên quan đến
chuỗi nhiều năm, do đó ta sẽ sử dụng số liệu hàng năm để
phân tích. Một cách tổng quát ta cần phải có một chuỗi dài ít
ra là 1015 năm.

Chuỗi số liệu được nghiên cứu tách biệt theo
2 yếu tố:
 Xu thế số liệu, trend (vĩ mô)
 Biến đổi mùa, season (vi mô)

Xu theá tuyeán tính
Y=a+bt

Y

???
ΔY6

ΔY3
Y0
PGS. TS. Nguyễn Thống

5

0

t

t

2
1
PGS. TS. Nguyễn Thống

t3

t4

t5

t6

t7

t8

t
6

1

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

 Để đánh giá yếu tố xu thế, phương pháp sử
dụng phổ biến là phương pháp bình phương
tối thiểu (BPTT).
 Đây là phương pháp cho phép xác định
được đường cong (thẳng) hoặc mặt phẳng
(siêu mặt phẳng) biểu thị xu thế số liệu, giới
thiệu "tốt nhất" số liệu trong quá khứ (“gaàn
vôùi soá lieäu quan saùt”).

Trong trường hợp cá biệt khi nhận thấy xu
thế của biến khảo sát trong thời gian dài là
tuyến tính, phương trình sẽ xác định bởi:

Y = a + bt
trong đó t biểu thị thời gian (năm) và a, b chỉ
các thông số được xác định đường thẳng
tính được từ phương pháp BPTT.

7

PGS. TS. Nguyễn Thống

8

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian
• Gọi yi là khoảng cách thẳng đứng từ điểm quan sát
(ti,Yi) đến đường thẳng cần xác định. Ta định nghĩa
haøm muïc tieâu:
Quan sát
2

Xu theá tuyeán tính
Y=a+bt

N

Sai biệt giữa
quan sát &
giá trị tính
từ xu thế
ΔY6

Y

Giá trị (a+bti)
Y0
0

Giá trị quan sát
t

t

2
1
PGS. TS. Nguyễn Thống

t3

t4

t5

t6

t7

t8

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

Töø ñoù:

 2 y
i



i

 (a  bt i )   0

2  yi  (a  bt i ) .t i  0

PGS. TS. Nguyễn Thống

PGS. TS. Nguyễn Thống

 D
 a  0


 D  0
 b


10

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

[1]

N

t 

[2]

i

Giải hệ phương trình trên ta có:
 t i yi  N.t.y
b i


  t i2   N.t 2
 i 
a  y i  bt i

i 1
i 1
Xu thế
• Đây là một hàm 2 biến a và b, để cho D cực trị (với ý
nghĩa vật lý của bài toán ta biết đó là cực tiểu) ta phải
có:

t
9

N

D   Yi2   Yi  (a  bt i )  min

t
i 1

i

N



t1  ...  t N
N

N  số quan trắc

11

PGS. TS. Nguyễn Thống

12

2

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

HAØM TÍNH a, b TRONG EXCEL
 Intercept(Y,X)  tính tung ñoä
goác a cuûa quan heä tuyeán tính.
 Linest(Y,X)  tính heä soá b (ñoä
doác cuûa quan heä tuyeán tính giöõa
Yi & Xi).
PGS. TS. Nguyễn Thống

13

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

14

PGS. TS. Nguyễn Thống

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

Chuù yù: Trong trường hợp xu thế không
phải là tuyến tính, ta có thể xét đến
dạng đường cong hàm mũ y = abt hoặc
dạng parabol y = a + bt + ct2.
 Các thông số a, b, c vẫn xác định dựa
vào khái niệm bình phương tối thiểu
mà ta vừa nghiên cứu trên.

ĐÁNH GIÁ
SỰ BIẾN ĐỔI
THEO MÙA
16

PGS. TS. Nguyễn Thống

15

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

Để nhận biết ảnh hưởng của thành phần
mùa lên chuỗi thời gian khảo sát ta dùng
thông số gọi là chỉ số mùa.
- Nếu số liệu theo tháng, ta có 12 giá trị is.
- Nếu số liệu theo qúy, ta có 4 giá trị is.
- Nếu giá trị tính theo 6 tháng, ta có 2 giá trị
is.
PGS. TS. Nguyễn Thống

PGS. TS. Nguyễn Thống

17

TÍNH CHỈ SỐ MÙA

is,k

Từ số liệu quan trắc chỉ số mùa được tính
từ is,t như sau:
is,t=[giá trị quan trắc] / [giá trị cho bởi
y=[a+bt]t]
 Chú ý: Có bao nhiêu số liệu quan trắc 
có bấy nhiêu chỉ số is,t
PGS. TS. Nguyễn Thống

18

3

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

PHÂN TÍCH DỮ LIỆU
Chương 7: Phân tích chuỗi thời gian

Chuù yù: Giaù trò is,t thay ñoåi chung quanh giaù trò 1
is,t3=AB/AC >1
Xu theá tuyeán tính

Từ các giá trị is,t, các giá trị đại biểu is được tính bằng giá trị
trung bình của các tháng (quý) tương ứng:
N
• Theo tháng:

Y=a+bt

is,t4
nguon tai.lieu . vn