Đối với dữ liệu sau khi được nhập có thể chưa đưa ngay vào phân tích vì gặp phải các lỗi như lỗi nhập liệu, câu trả lời khảo sát không đúng do hiểu sai câu hỏi, chất lượng của việc khảo sát không cao,…. Vì thế bạn cần các phương pháp để làm sạch dữ liệu trong spss, làm đẹp dữ liệu thuận tiện cho việc chạy và phân tích dữ liệu được dễ dàng hơn. Trong bài viết này Top 10 Hà Nội sẽ giới thiệu tới bạn 3 phương pháp làm sạch dữ liệu trong SPSS như sau:

*


1. Làm sạch dữ liệu trong spss bằng cách dùng bảng tần số2. Dùng lệnh Sort case để tìm dữ liệu sau trên cửa sổ Data View3. Dùng bảng phối hợp 2 biến hay 3 biến

1. Làm sạch dữ liệu trong spss bằng cách dùng bảng tần số

Bước 1: Tìm các dữ liệu bị nhập nhầm, dữ liệu lỗi

Để tìm các lỗi dữ liệu bị nhầm, ta có thể lập bảng tần số để tìm ra những dữ liệu lạ để sửa.Chẳng hạn, trong file dữ liệu LamSachDuLieu.sav các biến GioiTinh và Nghe đều được mã hóa (Biến GioiTinh có hai giá trị là 0 và 1, biến Nghe có ba giá trị là 1,2,3,4), nếu ta lập bảng tần số cho biến GioiTinh thấy kết quả như sau:

*

Từ kết quả thì ta biết ngay là các giá trị là 11 đã bị nhập nhầm. Để tìm ra các giá trị sai này để sửa ta có thể dùng lệnh Find để tìm, cụ thể như sau:

Trong cửa sổ Data View bôi đen cột GioiTinh và vào Edit > Find… , màn hình hiện ra hộp thoại tìm kiếm dữ liệu. Chúng ta cần nhập dữ liệu sai đã giá trị 11 ở trên.

Bạn đang xem: Làm sạch dữ liệu trong spss

*

Điền dữ liệu sai cần tìm trong cột GioiTinh, ở đây là 11 trong dòng Find What và ấn Find Next. Khi đó những ô dữ liệu sai trong cột dữ liệu sẽ được hiện trắng, ta ấn Find Next lên tiếp để tìm và sửa những dữ liệu sai theo ý muốn.

Bước 2. Chỉnh sửa dữ liệu về đúng giá trị

Sau khi tìm được các dữ liệu sai, chúng ta tự chỉnh sửa thủ công các giá trị bị nhầm lẫn về các giá trị theo đúng quy chuẩn.

*
Top 3 Phương Pháp Làm Sạch Dữ Liệu Trong SPSS 20

2. Dùng lệnh Sort case để tìm dữ liệu sau trên cửa sổ Data View

Trong cách làm sạch dữ liệu trong spss thứ 2 thì ta có thể sử dụng lệnh Sort Case trong Data để tìm những lỗi đơn giản ngay trên cửa sổ dữ liệu (Data View). Chẳng hạn với dữ liệu về giới tính, ta chỉ cần chọn lệnh sắp xếp dữ liệu theo thứ tự tăng dần và nếu có những dữ liệu lớn hơn 1 thì đó chính là những dữ liệu lỗi. Cụ thể ta tiến hành như sau:

Bước 1. Chọn công cụ Sortcase

Vào Data > Sort Cases…, màn hình hiện ra hộp thoại:

*

Bước 2: Lọc các dữ liệu chứa giá trị lỗi

Chọn biến GioiTinh bên trái để đưa vào khung Sort by bên phải, trong khung SortOrder ta chọn Ascending và ấn OK.

*

Sau khi lọc được các dữ liệu bị sai ở hàng số 97 98 99 100 thì chúng ta tiến hành chỉnh sửa các giá trị sai thành giá các trị đã được quy chuẩn.

Xem thêm: Xem Phim Cô Dâu Tám Tuổi Phần 4 Tập 35 Hd Vietsub + Lồng Tiếng

3. Dùng bảng phối hợp 2 biến hay 3 biến

Khi lập bảng tần số kết hợp biến tuổi và biến nghề nghiệp bạn thấy có trường hợp nhân viên văn phòng (mã hóa 3) mà tuổi chỉ có 8 nên bạn nghĩ rằng một trong hai biến đã nhập sai. 

*

Trong trường hợp này ta phải tìm ra ô nhập sai và sửa lại. Để tìm ra ô nhập sai trong trường hợp này ta dùng lệnh Select Cases, cụ thể như sau:

Bước 1: Đưa ra điều kiện để lọc biến

– Vào Data chọn Select Cases..., khi màn hình hiện ra hộp thoại thì ta chọn If Condi-tion is satisfied để nút If hiện ra và ấn vào.

– Chọn biến Tuoi và biến NgheNghiep bên trái để đưa vào khung bên phải với điều kiện logic Tuoi=8 & NgheNghiep=”2″. Sua đó chọn tiếp Continue và chọn tiếp OK.

*

Bước 2. Tìm kiếm biến theo điều kiện và tiến hành chỉnh sửa

Khi lệnh này được thực hiện, SPSS sẽ tạo ra một biến mới là filter $ , biến này nhận giá trị 0 tại tất cả các tình huống không thỏa mãn và 1 tại tình huống thỏa mãn điều kiện của lệnh If. Những giá trị là 1 trong biến filter $ chính là những trường hợp sai mà ta cần tìm để sửa.

Trên đây là 3 cách làm sạch dữ liệu trong spss dễ dàng và đơn giản mà chúng tôi tìm hiểu và tổng hợp được. Nếu bạn còn gặp khó khăn gì trong quá trình chạy dữ liệu spss, bạn có thể tìm hiểu thêm thông tin về dịch vụ và giá chạy Spss của Luận văn 1080.