Hồi quy với biến độc lập định tính (biến giả Dummy) trên SPSS

Thảo luận trong 'Phần mềm' bắt đầu bởi tungseo123, 21/1/21.

  1. tungseo123

    tungseo123 New Member

    Dummy là gì? Cách sử dụng hồi quy biến độc lộc định tính như thế nào. Cùng Phạm Lộc Blog tìm hiểu qua bài viết sau nhé

    Chúng ta đã khá quen với việc sử dụng các biến độc lập là các biến định lượng. Tuy nhiên, trong nhiều tình huống chúng ta cần phân tích hồi quy với các biến độc lập là biến định tính. Nếu một biến là định danh, chúng ta không thực hiện hồi quy ngay trên các con số mã hóa nhóm giá trị bởi kết quả phân tích sẽ không mang lại bất kỳ một ý nghĩa gì cả. Và để có thể thực hiện được hồi quy với biến định tính, các nhà nghiên cứu đã đưa ra khái niệm biến giả hay còn gọi là biến Dummy.

    >> Tham khảo dịch vụ hỗ trợ spss tại https://www.phamlocblog.com/p/dich-vu-xu-ly-phan-tich-spss-amos.html

    [​IMG]
    1. Biến giả - Tại sao chúng ta phải sử dụng chúng?
    Điều kiện để thực hiện phân tích hồi quy là các biến phải có đơn vị đo lường, phải có thang đo đơn vị. Ví dụ:
    - Biến Thu nhập có đơn vị là đồng. Người A có thu nhập là 10.000 đồng, người B có thu nhập là 15.000 đồng, người C có thu nhập 20.000 đồng. Như vậy người B hơn người A 5.000 đồng, người C hơn người A 10.000 đồng, thu nhập người C hơn người A 2 lần.
    >> Biến này có thể phân tích được hồi quy vì nó có đơn vị. Chúng ta xác định được sự cao hơn, thấp hơn là bao nhiêu đơn vị tính.
    - Biến Tình trạng hôn nhân không có đơn vị tính. Người A có tình trạng là Độc thân, người B có tình trạng là Đã lập gia đình, người C có tình trạng là Ly hôn. Chúng ta mã hóa Độc thân mang giá trị 1, Đã lập gia đình mang giá trị 2, Ly hôn mang giá trị 3 nhưng các con số này chỉ là con số đại diện, chúng ta không thể thực hiện cộng trừ nhân chia với nó để xem nhóm này hơn nhóm kia bao nhiêu đơn vị. Chúng ta không thể nói: người Đã lập gia đình có tình trạng hôn nhân nhiều hơn người Độc thân 1 đơn vị, người Ly hôn có tình trạng hôn nhân cao hơn người Đã lập gia đình 2 đơn vị.
    >> Biến này không thể phân tích hồi quy. Chúng ta không xác định được giữa Đã lập gia đình, Độc thân, Ly hôn cái nào cao hơn cái nào, cái nào gấp bao nhiêu lần cái nào bao nhiêu đơn vị.
    Chính vì vậy mà chúng ta cần chuyển các biến định đính không có thước đo đơn vị này về một dạng biến khác có thước đo đơn vị để có thể lượng hóa, đó là biến giả Dummy.
    2. Cách xây dựng biến giả
    Biến giả là một biến được đặt giá trị tương đương với 0 hoặc 1, phụ thuộc vào việc liệu các quan sát có chứa các tính chất được quan tâm hay không.
    Ví dụ, xem xét biến giới tính có thể giữ 2 giá trị: Nam và Nữ. Giới tính chuyển thành biến giả X1 như sau:
    X1 = 1 nếu là Nam
    X1 = 0 nếu là Nữ
    Do vậy, tập hợp dữ liệu về giới tính bao gồm Nam và Nữ giờ sẽ tương ứng với giá trị 0 và 1 của X1. Các bạn có thể mã hóa ngược lại Nữ là 1, Nam là 0, không có sự khác biệt về việc mã hóa ở đây.
    Nếu biến giới tính chỉ có 2 là giá trị khá đơn giản và không gặp khó khăn trong khâu chuyển sang biến giả thì biến từ 3 giá trị trở lên sẽ phức tạp hơn. Ví dụ biến tình trạng hôn nhân gồm: Đã lập gia đình, Độc thân, Ly hôn. Trường hợp này biến tình trạng hôn nhân có 3 giá trị, để giải thích cho tất cả các khả năng xảy ra, chúng ta cần 2 biến giả. Chúng có thể mã hóa như sau:
    X1 = 1 nếu Đã lập gia đình, X1 = 0 nếu ngược lại
    X2 = 1 nếu Độc thân, X2 = 0 nếu ngược lại
    Nếu một người đồng thời không ở trong tình trạng Đã lập gia đình (X1 = 0) và Độc thân (X2 = 0) thì người đó sẽ rơi vào nhóm còn lại là Ly hôn. Chính vì vậy mà chúng ta không cần phải có biến X3 cho nhóm thứ 3 - Ly hôn.
    (X1 = 1 và X2 = 0): Đã lập gia đình
    (X1 = 0 và X2 = 1): Độc thân
    (X1 = 0 và X2 = 0): Ly hôn
    Từ đây chúng ta có thể suy ra rằng, để phân biệt m tính chất, người ta dùng m-1 biến giả. Hay nói một cách dễ hiểu, nếu biến định tính có m đáp án thì cần m-1 biến giả để giải thích cho tất cả các trường hợp xảy ra của biến định tính này.
    Website: https://www.phamlocblog.com/
    Chỉnh sửa cuối: 22/1/21

Chia sẻ trang này