Chương 4: Hồi quy với biến giả
Biến định tính thường biểu thị có hay không có một tính chất hoặc là các mức độ khác nhau của một tiêu thức thuộc tính nào đó.
Để lượng hoá các biến định tính, trong phân tích hồi quy người ta dùng biến giả
Chương 4
HỒI QUY VỚI
BIẾN GIẢ
I. BẢN CHẤT CỦA BIẾN GIẢ
Các biến độc lập Xi trong các mô hình đã nghiên
cứu thông thường là những biến định lượng, giá
trị quan sát là những con số
Ví dụ : Thu nhập, chi tiêu, chi phí, doanh thu .v.v..
Tuy nhiên có những trường hợp các biến độc
lập này là những biến định tính.
Ví dụ : tốt – xấu, cao – thấp, nhanh – chậm…
I. BẢN CHẤT CỦA BIẾN GIẢ
Biến định tính thường biểu thị có hay không có một
tính chất hoặc là các mức độ khác nhau của một tiêu
thức thuộc tính nào đó
Ví dụ : giới tính (nam hay nữ), tôn giáo, dân tộc, nơi
sinh, hình thức sở hữu, ngành nghề kinh doanh .v.v…
Để lượng hoá các biến định tính, trong phân tích hồi
quy người ta dùng biến giả (dummy variables)
I. Hồi qui với biến độc lập đều là
biến định tính.
1. Trường hợp các biến định tính chỉ có hai lựa
chọn
Ví dụ, giữa hai ngôi nhà có cùng các đặc trưng, một
có hồ bơi trong khi ngôi nhà còn lại không có.
Tương tự, giữa hai nhân viên của một công ty có
cùng tuổi, học vấn, kinh nghiệm, một người là
nam và người kia là nữ…
I. Hồi qui với biến độc lập đều là
biến định tính.
1. Trường hợp các biến định tính chỉ có hai lựa
chọn
Lấy ví dụ về lương và đặt Yi là tiền lương hàng
tháng của nhân viên thứ i trong công ty. Để đơn giản,
ở đây chúng ta bỏ qua các biến khác có ảnh hưởng
đến lương và chỉ tập trung vào giới tính
Vì biến giới tính không phải là một biến định
lượng một cách trực tiếp được nên chúng ta định
nghĩa một biến giả gọi là D (Dummy variables)
I. Hồi qui với biến độc lập đều là
biến định tính.
1. Trường hợp các biến định tính chỉ có hai lựa
chọn
iến giả này là biến nhị nguyên chỉ nhận giá trị 1
vớiunam nhân viên và nghĩai nữ nhân viên.toàn ngẫu
Lư ý là cách định 0 vớ này là hoàn
nhiên. Nhóm mà giá trị D bằng 0 gọi là nhóm điều
khiển (Control group).
Bây giờ chúng ta sẽ thiết lập và ước lượng một
mô hình sử dụng biến giả như một biến giải thích.
Dạng đơn giản nhất của mô hình như sau:
I. Hồi qui với biến độc lập đều là
biến định tính.
1. Trường hợp các biến định tính chỉ có hai lựa
Yi = β1 + β 2 Di + U i
chọn
Tạm thời bỏ qua sai số Ui
Đối với nam: D = 1 ⇒ Y = β1 + β 2
Đối với nữ: D = 0 ⇒ Y = β1
I. Hồi qui với biến độc lập đều là
biến định tính.
1. Trường hợp các biến định tính chỉ có hai lựa
chọn
β 1 là lương trung bình của nhóm điều
khiển (nhân viên nữ)
β 2 là chênh lệch về lương trung bình của
một nhân viên nam so với nhân viên nữ.
Lưu ý: Thủ tục ước lượng phương trình hồi
quy được tiến hành bình thường như những
mô hình ở các chương trước bằng phương
pháp OLS.
I. Hồi qui với biến độc lập đều là
biến định tính.
1. Trường hợp các biến định tính chỉ có hai lựa
chọn
Để xét xem giữa hai nhân viên có
sự phân biệt về giới hay không ta tiến
hành kiểm định giả thiết
H0: β 2=0
H1:β 2 ≠ 0.
(Dùng kiểm định t với bậc tự do n-2).
I. Hồi qui với biến độc lập đều là
biến định tính.
1. Trường hợp các biến định tính có nhiều
hơn hai lựa chọn
Số các lựa chọn có thể có của một biến
định tính có thể nhiều hơn hai.
Chú ý: số các biến giả luôn luôn ít hơn
một biến so với số các lựa chọn.
Gọi Yi là tiền tiết kiệm của một hộ gia đình thứ i.
Ví dụ Chúng ta kỳ vọng rằng các hộ gia đình thuộc các
nhóm tuổi khác nhau sẽ có mức tiết kiệm khác
nhau.
I. Hồi qui với biến độc lập đều là
biến định tính.
1. Trường hợp các biến định tính có nhiều
hơn hai lựa chọn
Nếu chúng ta có tuổi chính xác của người chủ hộ,
biến này có thể đưa vào mô hình như là biến định
lượng.
Tuy nhiên, nếu chúng ta chỉ có nhóm tuổi (ví dụ người
chủ hộ thuộc nhóm tuổi dưới 25, từ 25 đến 55 và trên
55), chúng ta sẽ có biến định tính "nhóm tuổi của chủ
hộ” có 3 lựa chọn
I. Hồi qui với biến độc lập đều
là biến định tính.
1. Trường hợp các biến định tính có nhiều
hơn hai lựa chọn
Cụ thể hơn, chúng ta định nghĩa:
1 Nếu chủ hộ từ 25 đến 55
D2i = tuổi
0 Nếu chủ hộ thuộc nhóm tuổi khác
1 Nếu chủ hộ trên 55 tuổi
D3i =
0 Nếu chủ hộ thuộc nhóm tuổi khác
Nhóm điều khiển là nhóm mà cả D2i và D3i đều bằng 0,
có nghĩa là tất cả những hộ gia đình mà chủ hộ dưới 25
tuổi.
I. Hồi qui với biến độc lập đều
là biến định tính.
1. Trường hợp các biến định tính có nhiều
hơn hai lựa chọn
Một mô hình đơn giản mô tả quan hệ giữa tiền
tiết kiệm và nhóm tuổi như sau:
Yi = β1 + β 2 D2i + β 3 D3i + U i
I. Hồi qui với biến độc lập đều
là biến định tính.
1. Trường hợp các biến định tính có nhiều
hơn hai lựa chọn
Đối với hộ gia đình dưới 25 tuổi
D2i = D3i = 0 ⇒ Y = β1
Đối với hộ gia đình từ 25 đến 55 tuổi:
D2i = 1, D3i = 0 ⇒Y = β1 + β2
Đối với hộ gia đình trên 55 tuổi
D2i = 0, D3i = 1 ⇒ Y = β1 + β3
I. Hồi qui với biến độc lập đều
là biến định tính.
1. Trường hợp các biến định tính có nhiều
hơn hai lựa chọn
Như vậy, β 1 cho chúng ta biết tiền tiết kiệm trung bình
một tháng của một hộ gia đình mà chủ hộ dưới 25 tuổi.
β 2 biểu thị chênh lệch về tiền tiết kiệm trung bình một
tháng của một hộ gia đình mà chủ hộ thuộc nhóm tuổi từ
25 đến 55 tuổi so với nhóm tuổi dưới 25
β 3 biểu thị chênh lệch về tiền tiết kiệm trung bình một
tháng của một hộ gia đình mà chủ hộ thuộc nhóm tuổi
trên 55 so với nhóm tuổi dưới 25.
I. Hồi qui với biến độc lập định
lượng và định tính.
1. Trường hợp có một biến định tính với 2 lựa
chọn: c tiếp theo trong phân tích là thêm các biến độc lập có thể
Bướ
định lượng được. Để minh họa, ta lấy lại ví dụ về tiền lương
ở trên.
• Đặt Yi : là tiền lương hàng tháng của nhân viên thứ i.
• Gọi Xi : là kinh nghiệm của nhân viên thứ I
• Với Di =1 : nhân viên nam
• Với Di =0 : nhân viên nữ
Nếu bỏ qua yếu tố giới tính, chỉ xét mối quan hệ giữa tiền
lương hàng tháng và kinh nghiệm, một mô hình hồi quy đơn
cho quan hệ này là:
Yi = β1 + β 2 X i + U i
I. Hồi qui với biến độc lập định
lượng và định tính.
1. Trường hợp có một biến định tính với 2 lựa
chọn: này, câu hỏi đặt ra là :"Giữa hai nhân viên có
Lúc
cùng kinh nghiệm, có sự khác biệt trong tiền lương
tháng do giới tính không?"
Khi đó, nếu tính đến biến giả , mô hình sẽ trở
thành
Yi = β1 + β 2 Di + β 3 X i + U i
I. Hồi qui với các biến độc lập định
lượng và các biến định tính.
1. Trường hợp có một biến định tính với 2 lựa
chọn:
Đối với Nữ Yi = β1 + β3 X i
Đối với Nam Yi = ( β + β2 ) + β3 X i
1
Một giả thiết tự nhiên cần kiểm định là "không có
sự khác biệt trong quan hệ giữa hai nhóm".
Vì vậy, chúng ta kiểm định giả thiết
H0: β 2 =0
Kiểm định t với bậc tự do n-3
H1: β 2 ≠ 0.
I. Hồi qui với các biến độc lập định
β
lượng và các biến định tính.
1. Trường hợp có một biến định tính với nhiều
hơn 2 lựa chọn
Ví dụ , trường hợp biến giả có 3 lựa chọn :
Yi =1 +
I. Hồi qui với các biến độc lập định
lượng và các biến định tính.
1. Trường hợp có nhiều hơn một biến định tính.
Chúng ta có thể xác định số biến giả được đưa vào
mô hình như sau:
k
n =∑ni −
( 1)
i=1
Trong đó: n - là số biến giả cần thiết đưa vào mô hình
k - là số biến định tính
ni - là số lựa chọn của biến định tính thứ i