Sức khỏe Bệnh Phổi

Trang thông tin y học sức khỏe Bệnh Phổi

Chia sẻ kiến thức mang tính tham khảo về Bệnh Phổi và các lĩnh vực liên quan

Bệnh hô hấp

Bệnh Phổi mạn tính, Bệnh Phổi nhiễm trùng, Bệnh Phổi nghề nghiệp...

Dịch tễ, chẩn đoán, điều trị và quản lý bệnh Lao

"Chỉ có nắm vững được tình hình bệnh phổi trong nước mới chẩn đoán bệnh lao ít sai lầm" - Cố GS Phạm Ngọc Thạch

Nghiên cứu khoa học

Chia sẻ các bài báo, phương pháp nghiên cứu khoa học

Phục hồi chức năng hô hấp

Phục hồi chức năng hô hấp

Hướng dẫn phân tích chi tiết ANOVA trong SPSS

Sau bước hồi quy, chúng ta thường thực hiện phân tích ANOVA và Independent Sample T – Test nhằm kiểm định sự khác biệt giữa các value của biến định tính với biến định lượng. 

PHAn-tich-anova-spss-phamloc
Phân tích ANOVA là một bước quan trọng trong bài nghiên cứu

Ví dụ: Chúng ta sẽ đánh giá xem có sự khác biệt hay không về sự hài lòng trong công việc giữa nhân viên nam và nhân viên nữ, giữa nhân viên thu nhập cao với thu nhập thấp , giữa phòng marketing và phòng kế toán ....v..v... Để thực hiện được điều này chúng ta tiến hành phân tích phương sai ANOVA  Independent Sample T – Test. Sự khác biệt có ý nghĩa thống kê với độ tin cậy 95% (hay mức ý nghĩa Sig.< 0.05).

Câu hỏi đặt ra khi nào sẽ thực hiện phân tích phương sai ANOVA và khi nào sẽ sử dụng Independent Sample T – Test? Mình sẽ trình bày chi tiết theo từng mục phía dưới nhé. Tuy nhiên trước mắt, các bạn hãy nắm trước cho mình lý thuyết này:
  • Biến định tính hơn 2 value - Dùng ANOVA
  • Biến định tính có 2 value - Dùng Independent Sample T - Test


A - PHÂN TÍCH ANOVA


phan-tich-phuong-sai-anova

Ví dụ điển hình: 
Trên hình ảnh, các bạn có thể thấy biến nhóm tuổi có 5 value, như vậy như câu nói ban đầu của mình, hơn 2 value thì sẽ dùng ANOVA. Để dễ dàng cho việc trình bày, mình sẽ sử dụng biến Tuoi (nhóm tuổi) là biến định tính và biến SHL (sự hài lòng) là biến định lượng. 

Cách thực hiện phân tích ANOVA như sau. Vào Analyze > Compare Means > One-Way ANOVA...

phan-tich-phuong-sai-anova2

Giao diện hiện ra như sau, các bạn đưa biến phụ thuộc vào mục Dependent List, đưa biến định tính vào mục Factor.

phan-tich-phuong-sai-anova3

Tiếp theo sử dụng tùy chọn Post Hoc để đề phòng trường hợp kiểm định Levene cho giá trị sig < 0.05 (đoạn này bạn sẽ hiểu khi đọc tới cuối bài). Chọn vào mục kiểm định Tamhane's T2 rồi chọn Continue.

phan-tich-phuong-sai-anova4

Tiếp đến, sử dụng tùy chọn Options. Tích vào 3 mục như hình ảnh phía dưới. Sau đó chọn Continue.

phan-tich-phuong-sai-anova5

Quay lại giao diện ban đầu, chọn OK để xuất kết quả ra Output:

phan-tich-phuong-sai-anova3

Bảng bạn quan tâm đầu tiên đó là Test of Homogeneity of Variances, chúng ta sẽ xem xét sig của Levene Statistic.

1/ Trường hợp sig lớn hơn hoặc bằng 0.05

phan-tich-phuong-sai-anova-6

Nếu sig ở kiểm định này > 0.05 thì phương sai giữa các lựa chọn của biến định tính ở trên không khác nhau, xem tiếp kết quả ở bảng ANOVA.

phan-tich-phuong-sai-anova-7

Nếu sig ở bảng ANOVA < 0.05, chúng ta kết luận: Có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên thuộc các nhóm tuổi khác nhau.

Nếu sig ở bảng ANOVA >= 0.05, chúng ta kết luận: Không có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên thuộc các nhóm tuổi khác nhau.

2/ Trường hợp sig nhỏ hơn 0.05

phan-tich-phuong-sai-anova-8

Trường hợp sig nhỏ hơn 0.05, chúng ta không sử dụng bảng ANOVA mà sử dụng kết quả kiểm định Post Hoc (thống kê Tamhane's T2). Sơ lược về Post Hoc:
Kiểm định Post Hoc kiểm định sự khác biệt về giá trị trung bình của biến định lượng giữa từng cặp thuộc tính của biến định tính. Nếu ít nhất có một cặp có sự khác biệt về giá trị trung bình  (sig < 0.05) theo các thuộc tính của biến định tính thì kết luận có sự khác biệt về giá trị trung bình của biến định lượng theo các thuộc tính của biến định tính.

phan-tich-phuong-sai-anova-9

Các điểm tô vàng trong hình đều có sig nhỏ hơn 0.05. Khi chạy ra bảng này, chỉ cần nhìn vào cột sig các bạn thấy có 1 giá trị < 0.05 thì kết luận ngay: Có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên thuộc các nhóm tuổi khác nhau

Ngược lại, trường hợp cả cột đều có sig >= 0.05, chúng ta kết luận: Không có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên thuộc các nhóm tuổi khác nhau.

B - KIỂM ĐỊNH INDEPENDENT SAMPLE T-TEST




Ví dụ điển hình: 
Trên hình ảnh, các bạn có thể thấy biến giới tính có 2 value, như vậy như câu nói ban đầu của mình, 2 value thì sẽ dùng Independent Sample T - Test. Để dễ dàng cho việc trình bày, mình sẽ sử dụng biến Gioi_tinh (giới tính) là biến định tính và biến SHL (sự hài lòng) là biến định lượng. 

Cách thực hiện kiểm định như sau. Vào Analyze > Compare Means > Independent Sample T-Test...

Kiem-dinh-Independent-Sample-t-test1

Ở giao diện được mở ra, các bạn đưa biến định lượng vào mục Test Variable (s), đưa biến định tính vào mụcGrouping Variable. Sau đó nhấn vào mục Define Groups... ngay bên dưới.

Kiem-dinh-Independent-Sample-t-test2

Tại đây, các bạn sẽ phân nhóm giá trị ra. Biến giới tính của chúng ta có 2 value: 1 là nam, 2 là nữ, do vậy các bạn sẽ điền 2 số này vào 2 ô trống, không cần phải sắp xếp 1 đến 2, có thể điền 2, 1 cũng được, không sao cả nhé. Sau đó nhấn vào Continue.

Kiem-dinh-Independent-Sample-t-test3

Trở lại giao diện ban đầu, nhấn OK để xuất kết quả ra Output.

Kiem-dinh-Independent-Sample-t-test5

Chúng ta sẽ quan tâm tới bảng Independent Samples Test. Giá trị đầu tiên là sig của Levene's Test (điểm màu vàng). 

Kiem-dinh-Independent-Sample-t-test6

1/ Trường hợp sig nhỏ hơn 0.05

Nếu sig Levene's Test nhỏ hơn 0.05 thì phương sai giữa 2 giới tính là khác nhau, chúng ta sẽ sử dụng giá trị sig T-Test màu hồng ở hàng Equal variances not assumed

- Giá trị sig T-Test < 0.05 chúng ta kết luận: Có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên có giới tính khác nhau.

- Giá trị sig T-Test >= 0.05 chúng ta kết luận: Không có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên có giới tính khác nhau.

2/ Trường hợp sig lớn hơn hoặc bằng 0.05

Nếu sig Levene's Test lớn hơn hoặc bằng 0.05 thì phương sai giữa 2 giới tính là không khác nhau, chúng ta sẽ sử dụng giá trị sig T-Test màu xanh ở hàng Equal variances assumed

- Giá trị sig T-Test < 0.05 chúng ta kết luận: Có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên có giới tính khác nhau.

- Giá trị sig T-Test >= 0.05 chúng ta kết luận: Không có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những đáp viên có giới tính khác nhau.


Trên đây là bài hướng dẫn chi tiết cách thực hiện kiểm định ANOVA và Independent Sample T-Test.

Phân tích tương quan Pearson trong SPSS

Phân tích tương quan Pearson là một trong các bước chúng ta thực hiện trong bài nghiên cứu sử dụng phân tích định lượng SPSS. Thường bước này sẽ được thực hiện trước khi phân tích hồi quy.

phan-tich-tuong-quan-pearson-spss


Mục đích chạy tương quan Pearson nhằm kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập, vì điều kiện để hồi quy là trước nhất phải tương quan.

Ngoài ra cần nhận diện vấn đề đa cộng tuyến khi các biến độc lập cũng có tương quan mạnh với nhau. Dấu hiệu nghi ngờ dựa vào giá trị sig tương quan giữa các biến độc lập nhỏ hơn 0.05 và giá trị tương quan Pearson lớn hơn 0.3. Khi gặp phải nghi ngờ này, các bạn cần chú ý đến đa cộng tuyến sẽ được xem xét khi phân tích hồi quy (kiểm tra hệ số VIF).

CÁCH CHẠY TƯƠNG QUAN PEARSON


Các bạn truy cập vào thẻ Analyze > Correlate > Bivariate…

phan-tich-tuong-quan-pearson-spss (1)


Hộp thoại Bivariate Correlations xuất hiện, các bạn đưa các biến độc lập và biến phụ thuộc từ cột bên trái sang bên phải. Để thuận tiện cho quá trình đọc số liệu, các bạn nên sắp sếp biến phụ thuộc nằm trên cùng (trong hình là biến SA). Sau đó các bạn chọn OK.

phan-tich-tuong-quan-pearson-spss (2)


Bảng tương quan Correlations xuất hiện trong Output của các bạn. Tiến hành đọc số liệu:


Trong hình minh họa ở trên, các biến tô màu xanh lá là biến độc lập, biến tô màu vàng là biến phụ thuộc. Giá trị sig tô màu cam là sig giữa các biến độc lập với biến phụ thuộc, và sig tô màu hồng là đại diện cho sig giữa các biến độc lập với nhau. Tạm gọi hệ số tương quan Pearson (Pearson Correlation) là r:

Yếu tố cần quan tâm đầu tiên là giá trị sig. Giá trị sig nhỏ hơn 0.05 thì hệ số tương quan mới có ý nghĩa thống kê, giá trị sig lớn hơn 0.05 nghĩa là có lớn nhỏ thế nào cũng không liên quan gì cả, bởi vì nó không có ý nghĩa, hay nói cách khác không có tương quan giữa 2 biến này

> VỚI GIÁ TRỊ SIG TÔ MÀU CAM:           


Giá trị sig tô màu cam nào nhỏ hơn 0.05 nghĩa là biến độc lập đó có tương quan với biến phụ thuộc, giá trị sig tô màu cam nào lớn hơn 0.05 nghĩa là biến độc lập đó KHÔNG tương quan với biến phụ thuộc và nên loại bỏ biến đó trước khi đi vào chạy hồi quy. Khi sig nhỏ hơn 0.05, các bạn chú ý tới hệ số tương quan Pearson để đánh giá mức độ tương quan mạnh/yếu giữa các biến độc lập với biến phụ thuộc.

> VỚI GIÁ TRỊ SIG TÔ MÀU HỒNG:           


Giá trị sig tô màu hồng của các biến độc lập với nhau thì nó CÀNG LỚN CÀNG TỐT. Nếu các giá trị sig này lớn hơn 0.05 nghĩa là giữa các biến độc lập này không có mối tương quan và nó càng khẳng định tính "độc lập" tốt giữa các biến độc lập. Nếu sig nhỏ hơn 0.05 thì các bạn sẽ bắt đầu lưu ý tới hệ số tương quan Pearson để xem tính tương quan mạnh hay yếu giữa các biến và đặt ra nghi 

> HỆ SỐ TƯƠNG QUAN PEARSON:


Hệ số tương quan Pearson càng tiến về 1 càng tương quan mạnh. Ngược lại, hệ số này càng tiến gần về 0 thì tương quan càng yếu.

Các bạn cần lưu ý đến giá trị sig: nếu bạn chọn mức ý nghĩa 1% thì giá trị sig phải < 0.01, còn nếu bạn chọn mức ý nghĩa là 5% thì sig < 0.05 tương ứng với các dấu (*) được đánh dấu trên hệ số tương quan r. Chú thích ở 2 hàng cuối cùng trong bảng Correlation

**. Correlation is significant at the 0.01 level (2-tailed)
*. Correlation is significant at the 0.05 level (2-tailed)