KINH TỆ LƯỢNG ỨNG DỤNG
Tự tương quan có thể được định nghĩa là “sự tương quan giữa các thành phần của
chuỗi các quan sát được sắp xếp theo thứ tự thời gian (dữ liệu thời gian) hay không
gian (dữ liệu chéo). Các ước lượng OLS vẫn tuyến tính và không chệch nhưng không còn hiệu quả nữa (không còn thuộc tính BLUE) Các phương sai của các ước lượng OLS bị chệch (ước lượng thấp giá trị phương sai và sai số chuẩn thực, = giá trị t lớn = dễ sai lầm) ...
Kinh teá löôïng öùng duïng Baøi giaûng 10: Tự tương quan
Bài giảng 10
TỰ TƯƠNG QUAN
Mục tiêu học tập:
Bản chất của tự tương quan
Hậu quả của tự tương quan
Phát hiện tự tương quan
Khắc phục tự tương quan
Các phương pháp ước lượng hệ số tự tương quan, ρ (rho)
Tài liệu tham khảo chính:
Domodar Gujarati, 1999, Essentials of Econometrics, Chapter 12
Domodar Gujarati, 2003, Basic Econometrics, Chapter 12
Ramanathan, 2002, Introductory Econometrics with Applications, Chapter 9
Phạm Chí Cao, 2006, Kinh tế lượng ứng dụng, Chương 8
Phuøng Thanh Bình, UEH 1
Kinh teá löôïng öùng duïng Baøi giaûng 10: Tự tương quan
10.1 BẢN CHẤT CỦA TỰ TƯƠNG QUAN
Tự tương quan có thể được định nghĩa là “sự tương quan giữa các thành phần của
chuỗi các quan sát được sắp xếp theo thứ tự thời gian (dữ liệu thời gian) hay không
gian (dữ liệu chéo).
Tự tương quan thường có ở dữ liệu thời gian
Giả định CLRM:
E(uiuj) = 0 (i ≠j) => Không có tương quan chuỗi
(Sai số ứng với quan sát nào đó không bị ảnh hưởng bởi sai số ứng với một
quan sát khác)
E(uiuj) ≠ 0 => Có tương quan chuỗi
Thể hiện của tự tương quan trên đồ thị
Vẽ hạng nhiễu/phần dư theo thời gian
Vẽ hạng nhiễu ut/phần dư et theo hạng nhiễu ut-1/phần dư et-1
Một số lý do của hiện tượng tự tương quan
Quán tính (Inertia)
Sai dạng hàm
Hiện tượng mạng nhện (Cobweb phenominon)
Xử lý dữ liệu
10.2 HẬU QUẢ CỦA TỰ TƯƠNG QUAN
Các ước lượng OLS vẫn tuyến tính và không chệch nhưng không còn hiệu quả nữa
(không còn thuộc tính BLUE)
Các phương sai của các ước lượng OLS bị chệch (ước lượng thấp giá trị phương
sai và sai số chuẩn thực, => giá trị t lớn => dễ sai lầm)
Nên các kiểm định t, F, và χ2 không còn đáng tin cậy
^
Công thức thông thường để tính phương sai nhiễu ( σ 2 = RSS/df) là một ước lượng
chệch của phương sai thực (σ2) và trong một số trường hợp có thể ước lượng thấp.
R2 có thể không phải là ước lượng tin cậy của R2 thực
Các phương sai và sai số chuẩn của dự báo có thể không hiệu quả
10.3 PHÁT HIỆN TỰ TƯƠNG QUAN
Sử dụng file Table6-3ee.txt (Chi tiêu hàng hóa nhập khẩu (Y) và thu nhập khả
dụng (X) của Mỹ giai đoạn 1967 - 1987)
Phương pháp đồ thị
Ước lượng hàm sau:
Yt = B1 + B2Xt + ut (6.51)
Phuøng Thanh Bình, UEH 2
Kinh teá löôïng öùng duïng Baøi giaûng 10: Tự tương quan
Vẽ đồ thị et theo thời gian
Vẽ đồ thị et theo et-1
Nhận xét: Tự tương quan dương
Kiểm định d (Durbin – Watson)
Là kiểm định được sử dụng phồ biến nhất để kiểm định hiện tượng tương quan
chuỗi
Công thức
n
2
∑ (e t − e t −1 )
t =2
d= n
(12.6.5)
2
∑ et
t =1
Ưu điểm lớn nhất của kiểm định d là dựa trên phần dư nên là một thước đo
được báo cáo phổ biến ở tất cả các phần mềm kinh tế lượng
Một số giả định:
Mô hình hồi qui phải có hệ số cắt (b1)
Các biến giải thích không ngẫu nhiên hay cố định
Hạn nhiễu ut có phân phối chuẩn
Mô hình hồi qui không có các biến giải thích là biến trễ của biến phụ thuộc
(các mô hình tự hồi qui)
Không được “thiếu quan sát” (missing observations), ví dụ chuỗi thời gian
nếu thiếu 2 quan sát năm 1978 và 1982 thì d không dùng được
Công thức (12.6.5) được triển khai như sau:
2 2
∑ e t + ∑ e t −1 − 2∑ e t e t −1
d= 2
(12.6.7)
∑ et
2 2
Do ∑ e t và ∑ e t −1 chỉ khác nhau một quan sát, nên chúng được xem là như
nhau, vậy ta có:
⎛ ∑ e t e t −1 ⎞
d = 2 ⎜1 −
⎜
⎟ (12.6.8)
∑ et ⎟
2
⎝ ⎠
^
∑ e t e t −1
Đặt ρ = 2
, vậy d được viết lại như sau:
∑ et
^
d ≈ 2(1- ρ ) (12.6.10)
^
Lưu ý: ρ là ước lượng của ρ (rho) là hệ số tự tương quan bậc 1:
Phuøng Thanh Bình, UEH 3
Kinh teá löôïng öùng duïng Baøi giaûng 10: Tự tương quan
ut = ρut-1 + εt (-1≤ ρ ≤ 1) (12.2.1)
(phương trình tự hồi qui bậc 1)
Giá trị giới hạn của d?
^
Nếu ρ = 0 => d = 2: không có tự tương quan
^
Nếu ρ = 1 => d = 0: tự tương quan dương hoàn hảo
^
Nếu ρ = -1 => d = 4: tự tương quan âm hoàn hảo
0≤d≤4 (12.6.11)
Thống kê d Durbin – Watson được minh họa trong hình sau:
Bác bỏ H0 Vùng không Vùng không Bác bỏ H0
Tự tương quan quyết định quyết định Tự tương quan
dương Chấp nhận H0 âm
0 dL dU 2 4-dU 4-dL 4
Giả thiết H0: Không có tự tương quan
Qui trình kiểm định Durbin-Watson:
Hồi qui OLS và phần dư
Tính d theo công thức trên (các phần mềm kinh tế lượng đều báo cáo thống
kê d với tên Durbin-Watson, hay DW)
Với số quan sát n và số biến giải thích ta tìm giá trị dL và dU
So sánh và quyết định
Kiểm định Breusch-Godfrey (BG test)
Ưu điểm: Khắc phục được những hạn chế trong giả định của kiểm định Durbin-
Watson
Giả sử mô hình hồi qui hai biến:
Yt = B1 + B2Xt + ut (12.6.14)
Giả sử: ut có dạng sau:
ut = ρ1ut-1 + ρ2ut-2 + … + ρput-p + εt (12.6.15)
(tự hồi qui bậc p)
Giả thiết H0:
ρ1 = ρ2 = ρ3 = … = ρp = 0 (12.6.16)
Phuøng Thanh Bình, UEH 4
Kinh teá löôïng öùng duïng Baøi giaûng 10: Tự tương quan
Qui trình kiểm định BG:
Ước lượng (12.6.14) và lưu phần dư et
Ước lượng phương trình hồi qui phụ et theo Xt và et-1, et-2, …, ut-p VÀ lưu R2
Nếu cỡ mẫu lớn, Breusch và Godfrey cho rằng:
2
(n-p)R2 ~ χ p
Nếu (n-p)R2 > Chi2 tra bảng ở mức ý nghĩa được chọn => Bác bỏ giả thiết
H0
Hạn chế của BG test là xác định số độ trễ tối ưu p. Thông thường người ta sử
dụng các thống kê AIC hay SIC để chọn độ trễ.
Kiểm định BG trên Eviews?
View/Residual Tests/Serial Correlation LM Test
10.4 TỰ TƯƠNG QUAN DO SAI MÔ HÌNH VÀ TỰ TƯƠNG
QUAN THUẦN TÚY (PURE AUTOCORRELATION)
Ví dụ sử dụng file table12-4.wfl (Y = thu nhập thực, X = năng suất lao động)
Ước lượng phương trình sau: Yt = B1 + B2Xt + ut
d = 0.1229 => Tự tương quan dương
Câu hỏi: Hiện tượng tự tương quan này do sai dạng hàm hay do bản chất của
mối quan hệ?
Lập luận: Do dữ liệu thời gian, nên rất có thể cả biến lương và năng suất đều có
yếu tố xu thế. Nếu giả thiết này đúng, thì mô hình nên đưa biến xu thế vào, và
ta có kết quả như sau:
d vẫn rất thấp
Phuøng Thanh Bình, UEH 5
Kinh teá löôïng öùng duïng Baøi giaûng 10: Tự tương quan
Dạng hàm khác như sau: Yt = B1 + B2Xt + B3Xt2 + ut
Kết quả hồi qui vẫn cho thấy d vẫn rất thấp và vẫn hiện tượng tự tương quan.
Kết luận, tự tương quan không phải do sai dạng hàm mà là tự tương quan thuần
túy.
Ý nghĩa: Nếu tự tương quan do sai dạng hàm, cách khắc phục đơn giản là chọn lại
dạng hàm đúng. Nếu là tự tương quan thuần túy thì ta có các cách khắc phục như
sẽ được trình bày ở phần 10.5.
10.5 KHẮC PHỤC TỰ TƯƠNG QUAN
Giả sử ta có phương trình hồi qui sau:
Yt = B1 + B2Xt + ut (12.12)
Giả sử hạn nhiễu là phương trình tự hồi qui bậc 1 như sau:
ut = ρut-1 + εt -1Kinh teá löôïng öùng duïng Baøi giaûng 10: Tự tương quan
Lưu ý:
o Hồi qui sai phân không có hệ số cắt
o Hệ số b2 giữa 2 mô hình gốc và mô hình sai phân không khác nhau
nhiều (nhưng d và R2 sẽ khác nhau đáng kể)
Nếu ước lượng có hệ số cắt:
ΔYt = B1 + B2ΔXt + εt (12.9.8)
B1 là gì?
Yt = A + B1t + B2Xt + ut (a)
Yt-1 = A + B1(t-1) + B2Xt-1 + ut-1 (b)
(a) – (b) = (12.9.8)
B1 = hệ số của biến xu thế trong mô hình gốc
Phát hiện tự tương quan bằng kiểm định Berenblutt-Webb?
• Nhắc lại rằng việc chuyển qua sai phân bậc 1 có thể thích hợp nếu ρ cao
hay d thấp. Nói cách khác, chuyển qua sai phân bậc 1 chỉ có ý nghĩa nếu
và chỉ nếu ρ = 1.
• H0: ρ = 1
n ^
∑ ε2
t
2
• Thống kê g = n
2
∑ et
1
^
o ε t là phần dư từ phương trình hồi qui sai phân bậc 1
o et là phần dư tư phương trình hồi qui gốc
• Vẫn sử dụng bảng thống kê Durbin-Watson nhưng chỉ khác giả thiết H0.
Ước lượng ρ dựa trên thống kê d Durbin-Watson
Nếu ta không sử dụng dạng sai phân bậc 1 do rho không quá cao, ta có thể
ước lượng ρ theo (12.6.10) như sau:
^ d
ρ ≈1- (12.9.13)
2
Áp dụng tương tự phương pháp sai phân tổng quát
Cách này chỉ cho ước lượng tốt nếu cỡ mẫu đủ lớn
Nếu cỡ mẫu nhỏ ta ước lượng ρ theo phương pháp của Theil & Nagar như
sau:
Phuøng Thanh Bình, UEH 7
Kinh teá löôïng öùng duïng Baøi giaûng 10: Tự tương quan
d
^ n 2 (1 − ) + k 2
ρ= 2
n − k2
2
Trong đó:
- n = cỡ mẫu
- k = số hệ số hồi qui (kể cả hệ số cắt)
- d = thống kê d Durbin-Watson
ρ được ước lượng từ phần dư (hàm hồi qui gốc)
Ta có:
^
et = ρ et-1 + vt (12.9.14)
Áp dụng tương tự phương pháp sai phân tổng quát
Các phương pháp khác
Qui trình lặp của Cochrane-Orcutt
Phương pháp Cochrane-Orcutt hai bước
Phương pháp Durbinh hai bước
Qui trình tìm kiếm Hildreth-Lu
Phương pháp ML
BÀI TẬP NHÓM SỐ 8
Yêu cầu làm theo nhóm, nộp bài làm qua email: [email protected] và nộp bản in
(hoặc viết tay) và buổi học tiếp theo. Bài tập này sẽ được tính vào điểm quá trình của
môn học.
8.1 Trong một nghiên cứu về xu hướng đong góp của lao động vào tổng giá trị tăng
thêm (Yt), Gujarati ước lượng hai mô hình sau:
Mô hình A: Yt = B1 + B2t + ut
Mô hình B: Yt = B1 + B2t + B3t2 + ut
Từ số liệu theo năm trong giai đoạn 1949 – 1964, Gujarati ước lượng được các
kết quả sau đây:
^
Mô hình A: Yt = 0.4529 - 0.0041t
t (-3.961)
r2 = 0.5284 d = 0.8253
^
Mô hình B: Yt = 0.4786 - 0.0127t + 0.0005t2
Phuøng Thanh Bình, UEH 8
Kinh teá löôïng öùng duïng Baøi giaûng 10: Tự tương quan
t (-3.272) (2.777)
R2 = 0.6629 d = 1.82
a. Có tương quan chuỗi ở mô hình A? Mô hình B?
b. Nếu có, theo Anh/Chị thương quan chuỗi ở đây thuộc loại nào? Tại sao?
c. Làm sao Anh/Chị phân biệt được tương quan chuỗu thuần túy với tương quan
chuỗi do sai dạng hàm?
8.2 Giả sử trên một bài báo Anh/Chị gặp mô hình hồi qui như sau:
ΔlnYt = B1 + B2ΔlnLt + B3ΔlnKt + ut
Y = Sản lượng
L = Lao động
K = Vốn
Δ = Sai phân bậc 1
a. Theo Anh/Chị tại sao tác giả bài báo đó lại sử dụng dạng hàm sai phân?
b. Anh/Chị giải thích hệ số B1 trong mô hình trên như thế nào? Có phải hệ số này
là một giá trị ước lượng của thay đổi công nghệ?
8.3 Sử dụng file dữ liệu Table12-9 (Y = Tồn kho (tỳ $), X = Doanh số (tỷ $) của
ngành công nghiệp sản xuất của Mỹ giai đoạn 1950 - 1991), ước lượng mô hình
sau:
Yt = B1 + B2Xt + ut
a. Ước lượng phương trình trên?
b. Kiểm định xem có tự tương quan dương hay không?
c. Nếu ρ dương, áp dụng kiểm định Berenblutt-Webb để kiểm định giả thiết ρ =
1?
d. Nếu Anh/Chị hoài nghi có cấu trúc tự tương quan của nhiễu bậc p, sử dụng
kiểm định Breusch-Godfrey để kiểm định? Làm sao Anh/Chị biết p là bao
nhiêu?
e. Trên cơ sở các kiểm định, Anh/Chị sẽ chuyển dạng dữ liệu như thế nào để loại
bỏ tự tương quan?
f. Lập lại các bước trên với mô hình sau:
lnYt = B1 + B2lnXt + ut
g. Theo Anh/Chị nên chọn mô hình nào?
Phuøng Thanh Bình, UEH 9