View Full Version : Help: Factor analysis: mâu thuẫn cách tính factor score?
trong SPSS, sau khi làm Factor analysis cho phép save Factor score coefficent và nhân số đã chuẩn hoá. Tuy nhiên, ko thể sử dụng nhân số đã chuẩn hoá để làm các kiểm định t-test vì chúng có giá trị trung bình bằng 0 và phương sai bằng 1.
Muốn làm t-test buộc phải tính các nhân số chưa chuẩn hoá bằng 2 cách: (1) tính trung bình giá trị các biến trong nhân tố tại từng quan sát, (2) thông qua ma trận hệ số điểm nhân tố. Tuy nhiên theo th Hoàng Trọng, vì dụ: F1 gồm X1, X2, X3; F2 gồm X4, X5 thì tại mỗi quan sát:
F1 = w11 X1 + w12 X2 + w13 X3 + w14 X4 + w15 X5
F2 = w21 X1 + w22 X2 + w23 X3 + w24 X4 + w25 X5
Nhưng một số tài liêu khác lại viết:
F1 = w11 X1 + w12 X2 + w13 X3
F2 = w24 X4 + w25 X5
1. Thực tế:nếu theo công thức của Hoàng Trọng, F1 chỉ bao gồm X1, X2, X3 thì tại sao công thức tính nhân số của F1 lại có cả X4, X5 ...? Và thực tế công thức nào là đúng?
2. Theo định nghĩa thì trọng số (weight) đại diện cho mức độ quan trọng của biến trong tập hợp, và tổng các trọng số bằng 1 hoặc 100%. Vậy tại sao trong bảng factor score coefficent, tổng các trọng số này lại khác 1?
Nếu bạn dùng SPSS, thì khi chạy EFA, không nên dùng chức năng save score coefficent, mà bạn cứ chạy bình thường. Sau đó, bạn dùng công cụ Transform --> Compute... để tính nhân số là tốt nhất.
- Tại cửa sổ Target Variable, bạn đặt tên factor, vd F1
- Tại cửa sổ Numeric Expression, bạn chọn lệnh Mean (?,?)
- Thay các dấu ? bằng những item X1, X2,... Lúc này, bạn sẽ thấy công thức F1 chỉ bao gồm từ X1 đến X3.
Bạn hãy yên tâm sử dụng kết quả này để làm các phân tích khác như hồi quy chẳng hạn, vì chúng đã được rất nhiều nhà nghiên cứu sử dụng mà không cần quan tâm đến trọng số, và là công cụ được tích hợp trong SPSS.
Chúng tôi không nhận được thông tin rằng bạn có học cao học không, song nếu bạn là một reasercher thì chắn chắn bạn sẽ hiểu cách tính của tôi ở trên.
Chúc bạn thành công.
Cảm ơn vì phần giải thích rất cụ thể! Nhưng tôi vấn có một số điểm ko đồng ý:
Tính nhân số theo phuơng pháp trung bình cộng giản đơn là một phuơng pháp hay dùng và đơn giản, tuy nhiên: (1) với những dữ liệu mà factor loading cho kết quả tuơng đối chênh lệch thì vai trò của các dimension đối với factor là rất khác nhau, tính trung bình giản đơn là đã san bằng những chênh lệch này; (2) đối với những dimension có đơn vị tính khác nhau: ko thể dùng cách tính này được mà bắt buộc phải dùng giá trị đã chuẩn hóa để phân tích đa biến hoặc tuơng quan. Bản thân các bài báo của Hair cũng nói về cách tính trung bình cộng gia quyền.
Có một điều tôi vẫn ko rõ, ko phải là do hiểu nhầm hay ko: Sách của thầy Hoàng Trọng (kể cả sách phân tích dữ liệu đa biến (1999), SPSS (2008) và một số bài giảng đều sử dụng công thức tính F1 có cả X4, X5. Ko phải là tôi muốn tìm lỗi sai, nhưng đọc một số luận án thì cũng thấy họ trình bày như thế, một số thì ngược lại?
huynhanhkiet
02-12-08, 09:06 AM
:spam: Trong khoa học, không có khái niệm "đúng và sai" tuyệt đối. Spam tiếp nè :spam:
hominhsanh
08-10-09, 10:19 AM
Cảm ơn vì phần giải thích rất cụ thể! Nhưng tôi vấn có một số điểm ko đồng ý:
Tính nhân số theo phuơng pháp trung bình cộng giản đơn là một phuơng pháp hay dùng và đơn giản, tuy nhiên: (1) với những dữ liệu mà factor loading cho kết quả tuơng đối chênh lệch thì vai trò của các dimension đối với factor là rất khác nhau, tính trung bình giản đơn là đã san bằng những chênh lệch này; (2) đối với những dimension có đơn vị tính khác nhau: ko thể dùng cách tính này được mà bắt buộc phải dùng giá trị đã chuẩn hóa để phân tích đa biến hoặc tuơng quan. Bản thân các bài báo của Hair cũng nói về cách tính trung bình cộng gia quyền.
Có một điều tôi vẫn ko rõ, ko phải là do hiểu nhầm hay ko: Sách của thầy Hoàng Trọng (kể cả sách phân tích dữ liệu đa biến (1999), SPSS (2008) và một số bài giảng đều sử dụng công thức tính F1 có cả X4, X5. Ko phải là tôi muốn tìm lỗi sai, nhưng đọc một số luận án thì cũng thấy họ trình bày như thế, một số thì ngược lại?
Bạn Nguyễn Thoa nói đúng chứ không sai, bởi vì hai biến X4, X5 cũng có hệ số tải nhân tố tác động lên F1 nhưng rất nhỏ. Bản thân tôi có học Thầy Hoàng Trọng, thầy cho rằng phải tính đến 2 biến này. Tuy nhiên nhiều Thầy Cô cho rằng bỏ qua sai số đó cũng không sau (vì trong khoa học kinh tế không có khái niệm đúng tuyệt đối như trong Toán học). Cô Kim Dung cho rằng tùy theo cách tính của từng người, theo Cô thì hồi quy lấy từ kết quả EFA score, còn các kiểm định T-test, ANOVA thì lấy giá trị Mean (tất nhiên là không thể sử dụng EFA score đề làm T-Test hay ANOVA được rồi). Theo mình thấy thì phần hồi quy chạy theo kết quả EFA score thì tốt hơn do có sự phân tán (Scater) rõ ràng ở phần dư (Residual).Đề tài của tôi làm theo Cô kết quả cũng rất tốt (nhưng đến nay mình chưa bảo vệ, vì chờ ý kiến của Cô). Còn muốn chạy hồi quy theo giá trị Mean thì phải kiểm tra hiện tượng đa cộng tuyến (giá trị VIF < 10).
Đây là ý kiến cá nhân, kiến thức của mình có giới hạn, mong các bạn góp ý thêm.
levanhuy
09-10-09, 12:08 PM
Về lý thuyết, cần phải giữa các hệ số của X4, X5 vì các biến số này có tác động đến F2, tuy nhiên, giá trị này rất nhỏ nên trên thực tế có thể không đưa vào phương trình.
Một chú ý cho các bạn là khi phân tích, các bạn loại bỏ những hệ số có giá trị nhỏ hơn 0,3 hoặc 0,5 (tùy theo mục đích phân tích) nên các biến số xi không hiện diện trong một số nhân tố, tuy nhiên, nó vẫn hiện diện nhưng nhỏ hơn 0,3 hoặc 0,5.
Thân
Joseph Bui
04-01-10, 03:16 PM
trong SPSS, sau khi làm Factor analysis cho phép save Factor score coefficent và nhân số đã chuẩn hoá. Tuy nhiên, ko thể sử dụng nhân số đã chuẩn hoá để làm các kiểm định t-test vì chúng có giá trị trung bình bằng 0 và phương sai bằng 1.
Muốn làm t-test buộc phải tính các nhân số chưa chuẩn hoá bằng 2 cách: (1) tính trung bình giá trị các biến trong nhân tố tại từng quan sát, (2) thông qua ma trận hệ số điểm nhân tố. Tuy nhiên theo th Hoàng Trọng, vì dụ: F1 gồm X1, X2, X3; F2 gồm X4, X5 thì tại mỗi quan sát:
F1 = w11 X1 + w12 X2 + w13 X3 + w14 X4 + w15 X5
F2 = w21 X1 + w22 X2 + w23 X3 + w24 X4 + w25 X5
Nhưng một số tài liêu khác lại viết:
F1 = w11 X1 + w12 X2 + w13 X3
F2 = w24 X4 + w25 X5
1. Thực tế:nếu theo công thức của Hoàng Trọng, F1 chỉ bao gồm X1, X2, X3 thì tại sao công thức tính nhân số của F1 lại có cả X4, X5 ...? Và thực tế công thức nào là đúng?
2. Theo định nghĩa thì trọng số (weight) đại diện cho mức độ quan trọng của biến trong tập hợp, và tổng các trọng số bằng 1 hoặc 100%. Vậy tại sao trong bảng factor score coefficent, tổng các trọng số này lại khác 1?
Chào bạn!
Trong phân tích nhân tố có nhiều phép xoay, thông dụng nhất là varimax và promax. Mình không biết bạn sử dụng phép xoay nào?
Phép xoay varimax chỉ có các biến tải chính loading lên nhân tố mới hình thành nên bạn sẽ chọn cách tính như sau:
"F1 = w11 X1 + w12 X2 + w13 X3
F2 = w24 X4 + w25 X5"
Còn nếu sử dụng phép xoay Promax thì được phép tính nhân tố theo cách còn lại:
"F1 = w11 X1 + w12 X2 + w13 X3 + w14 X4 + w15 X5
F2 = w21 X1 + w22 X2 + w23 X3 + w24 X4 + w25 X5".
Do đó phụ thuộc vào phép xoay bạn chọn mà có cách tính factor phù hợp.
Chúc bạn hoàn thành tốt đề tài nghiên cứu!
Tớ đã tìm ra câu trả lời rồi, hôm nay mới chia sẻ với các bạn được. Bạn Hồ Minh Sánh nói cũng đúng, nhưng chưa hoàn toàn.
Trong Factor analysis, đặc trưng quan trọng nhất là sự khác biệt có ý nghĩa giữa các nhân tố được phản ánh bởi những nhóm items khác nhau riêng biệt. Do đó một tập hợp thang đo tốt được đánh giá một phần thông qua việc các factor này có “pure” hay không.
Thực ra, trong thực tế không có khái niệm factor thuần nhất (vì các factor trong cùng một khái niệm thường rất gần nhau), nhân tố F1 có thể được phản ánh một phần nào đó bởi các items thuộc nhân tố F2, mức độ thể hiện qua độ lớn của Factor loading. Khi giá trị này lớn (theo Hair et al, 2007 hoặc Roussel et al, 2007 thì từ 0.4 trở lên) thì xảy ra hiện tượng Cross-loading, và những items load vào cả hai nhân tố như thế phải bị loại ra khỏi mô hình nhằm đảm bảo có sự khác biệt giữa Factor 1 và Factor 2 (Nếu chạy mô hình trên AMOS, hiện tượng này được thể hiện thông qua xem xét Modification index).
Kết quả của Factor analysis phải đảm bảo không còn hiện tượng Cross-loading. Do đó, khi tính giá trị đại diện cho nhân tố, có thể sử dụng một trong 3 phương pháp tùy thuộc vào bản chất thang đo và mục đich/nội dung nghiên cứu.
1)Single surrogate variable: lựa chọn item có factor loading cao nhất trong Factor làm đại diện
2)Summated scale: bình quân cộng giản đơn các items trong factor
3)Factor score: bình quân cộng gia quyền với quyền số là Factor loading
Việc tính toán ở 2 cách dưới bỏ qua vài trò của các item thuộc nhân tố này đôí với nhân tố kia:
F1 = w11 X1 + w12 X2 + w13 X3
F2 = w24 X4 + w25 X5
VickyBui
10-07-10, 10:20 AM
Mình thực sự không rành lắm về SPSS nên cho mình hỏi một chút:
- Mình đang làm đề tài "Tác động văn hóa công ty lên sự hài lòng của nhân viên". Mình có các nhân tố: giao tiếp, Đào tạo, Công bằng, Phát triển và Sự gắn bó. Mỗi nhân tố đều có khoảng 3, 4 biến quan sát. Mình đã phân tích nhân tố, phân tích độ tin cậy của thang đo, loại một số biến không tin cậy rồi. Mình đang làm đến phần Chạy tương quan và hồi qui tuyến tính bội. Tuy nhiên mình không biết gộp các biến quan sát trong cùng 1 nhân tố như thế nào? Bạn nào biết xin chỉ mình cụ thể cách làm trong SPSS. Mình đang học và thử nghiệm qua đề tài. Các bạn giúp mình nhe!
Mình thực sự không rành lắm về SPSS nên cho mình hỏi một chút:
- Mình đang làm đề tài "Tác động văn hóa công ty lên sự hài lòng của nhân viên". Mình có các nhân tố: giao tiếp, Đào tạo, Công bằng, Phát triển và Sự gắn bó. Mỗi nhân tố đều có khoảng 3, 4 biến quan sát. Mình đã phân tích nhân tố, phân tích độ tin cậy của thang đo, loại một số biến không tin cậy rồi. Mình đang làm đến phần Chạy tương quan và hồi qui tuyến tính bội. Tuy nhiên mình không biết gộp các biến quan sát trong cùng 1 nhân tố như thế nào? Bạn nào biết xin chỉ mình cụ thể cách làm trong SPSS. Mình đang học và thử nghiệm qua đề tài. Các bạn giúp mình nhe!Search tài liệu trên Forum trước khi hỏi bạn nhé, từ khoá là EFA, phân tích nhân tố khám phá, tìm tài liệu của Th.s Nguyễn Khánh Duy
Không thì mua sách Phân tích dữ liệu của thầy Hoàng Trọng & Chu Nguyễn Mộng Ngọc - tập 2
Nói chung , những thông tin về sách trên Forum có hết
Powered by vBulletin® Version 4.1.6 Copyright © 2012 vBulletin Solutions, Inc. All rights reserved.