View Full Version : Trợ giúp về T-test & hồi quy với biến độc lập định tính
tungvcci
18-11-09, 07:04 PM
Mình đang phải xử lý một số dữ liệu và gặp phải khó khăn sau:
Thu thập bảng hỏi từ 3 vùng với tỷ lệ Bắc:100, trung:50, nam:100. Yêu cầu phân tích T-test on equality of means của các vùng (bắc, trung, nam) với cả nước. Các vùng thì mình đã phân tích được, mình cũng định nghĩa lại biến nhưng chỉ phân tích tương quan được giữa các miền bắc-nam, bắc-trung...chứ không phân tích được từng miền với cả nước. Bạn nào biết có thể vui lòng chỉ giùm mình được không.
Cám ơn rất nhiều.
levanhuy
23-11-09, 08:14 AM
Bạn dùng biến giả (dummy variable), bạn recode lại với 2 biến. Giả sử: MIEN1 với 1 là miền Nam, 0 là các miền còn lại, MIEN2 với 1 là miền Trung và 0 là các miền còn lại. Sau đó làm regression bình thường.
Bạn có thể xem slide mà Tôi có gửi ở một số diễn đàn phía dưới.
Thân.
tatuan11_12_1982
24-11-09, 04:52 PM
Ban co thể gửi dữ liệu và yêu cầu lên cho moi người coi duoc không
friends
27-11-09, 06:45 PM
Chào bạn, một câu hỏi hơi khó và hay đấy!
Mình có 2 phương án, bạn thử suy nghĩ thêm xem sao
- Theo mình, để đơn giản, với tình huống của bạn, đầu tiên, bạn tính được giá trị trung bình của biến mà bạn quan tâm tương ứng với từng miền. ước lượng điểm về trung bình tổng thể của từng nhóm cũng chính là trung bình mẫu của từng nhóm. Bước tiếp theo, bạn sẽ làm 3 lần về kiểm định trung bình tổng thể của biến mà bạn quan tâm có khác biệt so với từng giá trị trung bình của mỗi miền (one sample t-test). Tương tự như vậy, một cách khác khi dùng one sample t test là: đầu tiên, bạn cũng có thể tính trung bình chung của cả nước. Sau đó, với mỗi dữ liệu của từng miền (lọc lại dữ liệu tương ứng với từng miền), kiểm định sự khác biệt của trung bình của miền đó so với giá trị trung bình của cả nước.
- Xét chung trong tình huống của bạn là xem xét yếu tố miền có ảnh hưởng đến biến Y hay không, hay nói cách khác, trung bình của Y có khác biệt giữa từng vùng hay không. T-test hay ANOVA là cách làm đơn giản nhất, và nó chỉ quan tâm đến mối quan hệ giữa Y và yếu tố miền. Tuy nhiên, bên cạch yếu tố miền còn có nhiều yếu tố khác nữa. Vì vậy Hồi quy bội với biến độc lập là một số biến số khác có thể ảnh hưởng đến Y, và những biến giả phản ánh yếu tố miền (Nếu có 3 miền, bạn chỉ cần xài 2 trong 3 biến giả là được). Phương án này, Thầy Huy đã hướng dẫn bạn. Cách làm này rất phổ biến hiện nay.
- Bên cạnh việc hồi quy với biến Dummy; Phương án thứ hai nữa mà mình muốn gợi ý cho bạn là hồi quy với Effect Coding. Nó sẽ góp phần giải quyết tốt hơn yêu cầu của bạn. Nếu bạn sử dụng hồi quy với trường hợp có biến độc lập là biến dummy (biến giả) để xem xét ảnh hưởng của các biến X, và 2 biến giả (Dummy) thể hiện miền đến Y. Mức ý nghĩa của biến giả, cũng như ý nghĩa kinh tế của hệ số hồi quy đứng trước biến giả phản ánh yếu tố miền nào đó sẽ cho thấy sự khác biệt về trung bình Y giữa miền đó với miền tham chiếu (biến giả không đưa vào mô hình). Chứ không cho thấy sự khác biệt về trung bình Y của miền đó so với một miền nào đó là miền đại diện cho trung bình chung. Vì vậy, có một phương án khác tốt hơn để xử lý vấn đề này: bạn hãy tìm hiểu về mô hình hồi quy với trường hợp Effect Coding. Bạn hãy tìm trên google với thuật ngữ Effect Coding ! bước đầu, bạn có thể tham khảo tại đây: http://luna.cas.usf.edu/~mbrannic/files/regression/anova1.html
Hy vọng, những gợi ý của chúng tôi sẽ hỗ trợ bạn được một vài điều gì đó.
TM BQT 4r
Khánh Duy
Powered by vBulletin® Version 4.1.6 Copyright © 2012 vBulletin Solutions, Inc. All rights reserved.