Công việc đầu tiên cần thực hiện khi thao tác hóa một phạm trù đó là quyết định các mức độ đánh giá cụ thể (level of measurement).
Mức độ đánh giá là gì?
Mức độ đánh giá (hay còn gọi là thang tỉ lệ – rating scale) đề cập đến các giá trị của một chỉ số. Ví dụ, nam và nữ (hoặc M và F hoặc 1 và 2) là hai giá trị của chỉ số “giới tính”. Trong bài viết chuyên đề với tựa đề “Lý thuyết về thang đánh giá” được xuất bản trong tạp chí “Science” vào năm 1946, nhà tâm lý học Stanley SmithStevens (1946) đã xác định bốn loại thang đánh giá cơ bản dùng cho đánh giá khoa học: thang định danh, thang thứ bậc, thang khoảng và thang tỷ lệ. Đặc điểm thống kê của các thang này được thể hiện trong Bảng.
Các loại thang đánh giá cơ bản
Thang định danh
Thang định danh (nominal scale), cũng được gọi là thang xác thực, đùng để đo lường, đánh giá sự xác thực của các nguồn dữ liệu. Những thang này được sử dụng cho những biến hay những chỉ số có thành phần (hay giá trị) không loại bỏ lẫn nhau, ví dụ như giới tính (hai giá trị: nam hoặc nữ), ngành công nghiệp (sản xuất vật liệu, tài chính, nông nghiệp,…) hay tôn giáo (Thiên Chúa, Đạo Hồi, Do Thái,…). Kể cả khi chúng ta đặt số cho mỗi giá trị (ví dụ 1 cho nam và 2 cho nữ) thì những con số này cũng không thật sự mang đến ý nghĩa gì cả (ví dụ 1 không có nghĩa là nhỏ hơn hay là một nửa của 2) và chúng cũng dễ dàng được đặt tên, ví như nam là M và nữ là F. Các thang định danh chỉ đơn thuần cung cấp tên hay nhãn mác của các giá trị khác nhau. Đo lường xu hướng trung tâm của một thang định danh là mode (yếu vị), cả trung vị hay trung bình đều không được định nghĩa. Kỹ thuật chi-square (xác suất) và phân bổ tần đều có thể được sử dụng và chỉ cho phép thực hiện sự biến đổi lần lượt (bình đẳng), ví dụ 1 là nam, 2 là nữ.
Thang đo thứ bậc
Thang đo thứ bậc (ordinal scale) đo lường những dữ liệu đã được xắp sếp theo thứ tự, chẳng hạn như thứ bậc của sinh viên trong lớp học là thứ nhất, thứ hai, thứ ba và thứ tư tùy thuộc vào điểm trung bình học tập của họ. Tuy nhiên, giá trị thực tế hoặc giá trị tương đối của các thành phần hay sự khác biệt trong giá trị của các thành phần không thể được đánh giá. Ví dụ, thứ hạng của các học sinh trong lớp không nói lên điểm trung bình cụ thể của họ. Một ví dụ điển hình trong khoa học tự nhiên là thang về độ cứng khoáng sản của Moh, trong đó mức độ cứng của các khoáng chất khác nhau được xác định bởi khả năng làm xước các khoáng sản khác. Ví dụ, kim cương có thể làm xước tất cả các khoáng sản khác xuất hiện trên trái đất, do đó kim cương là khoáng chất “cứng nhất”. Tuy nhiên, loại thang này không chỉ ra độ cứng cụ thể của các khoáng chất là bao nhiêu và cũng không cung cấp những đánh giá tương đối về độ cứng của chúng.
Thang thứ bậc cũng có thể sử dụng các nhãn mức độ như “xấu”, “trung bình” và “tốt”, hay “rất không hài lòng”, “không hài lòng”, “không biết”, “hài lòng” và “rất hài lòng”. Trong trường hợp thứ hai, chúng ta có thể nói rằng những người trả lời là “hài lòng” sẽ ít thỏa mãn hơn những người chọn “rất hài lòng” nhưng chúng ta không định lượng chính xác được mức độ hài lòng của họ. Xu hướng trung tâm của một thang thứ bậc có thể là yếu vị hoặc trung vị, trong khi đó trung bình không thể phát huy tác dụng. Do đó, phân tích thống kê có thể bao gồm phân tích phân vị và phi tham số, nhưng các kỹ thuật phức tạp hơn như hồi quy, tương quan và phân tích phương sai lại không phù hợp. Chuyển đổi tăng dần đều (mà vẫn giữ được xếp hạng) được phép áp dụng.
Thang đo thứ bậc không chỉ đánh giá theo trật tự thứ hạng, mà còn chỉ ra các khoảng bằng nhau giữa các chỉ số liền kề. Ví dụ, thang nhiệt độ (F hoặc C) có sự khác biệt trong khoảng 30 – 40 độ F giống như sự khác biệt trong khoảng 80 và 90 độ F. Tương tự như vậy, thang thu nhập hàng năm của một người có thể sử dụng các khoảng chỉ số: $ 0 đến 10.000, $ 10.000 đến 20.000, $ 20.000 đến 30.000,… Đây là thang khoảng bởi vì điểm giữa của mỗi khoảng (ví dụ, $ 5.000, $ 15.000, $ 25.000,…) cách đều nhau. Thang khoảng cho phép chúng ta đánh giá mức độ chênh lệch giữa các chỉ số. Đây là điểm mạnh mà khoảng định danh và khoảng thứ bậc không có được.
Xu hướng trung tâm chấp nhận được bao gồm trung bình, trung vị và yếu vị. Các phân tích thống kê có thể sử dụng bao gồm tất cả kỹ thuật trong thang định danh và thứ bậc cùng với với các kỹ thuật tương quan, hồi quy, phân tích phương sai,… Chuyển đổi thang chấp nhận được là tuyến tính tích cực. Cần lưu ý rằng các thang về sự hài lòng được thảo luận trước đó là không hoàn toàn là một thang khoảng, bởi vì chúng ta không thể khẳng định liệu khoảng khác biệt giữa “rất hài lòng” và “hài lòng” có tương tự như những khoảng khác biệt giữa “không biết” và “hài lòng” hay giữa “không hài lòng” và “rất không hài lòng” hay không. Tuy nhiên, các nhà nghiên cứu khoa học xã hội thường chấp nhận (dù là không chính xác) những khác biệt này là tương tự. Vì vậy, họ có thể sử dụng các kỹ thuật thống kê để phân tích dữ liệu.
Thang tỉ lệ
Thang tỉ lệ (ratio scale) là thang chứa đựng tất cả đặc điểm của các thang định danh, thứ bậc và tỉ lệ, ngoài ra còn có gốc “0 có ý nghĩa” (true zero) (nói đến việc thiếu vắng hoặc không sẵn có của các phạm trù cơ bản). Hầu hết các hệ thống đo lường trong khoa học tự nhiên và kỹ thuật, chẳng hạn như khối lượng, mặt phẳng nghiêng, điện lượng,… và một số biến trong khoa học xã hội như tuổi tác, nhiệm kỳ trong tổ chức và quy mô doanh nghiệp (số lượng nhân viên hay tổng doanh thu) đều có sử dụng thang tỷ lệ. Ví dụ, một công ty có quy mô là “không” có nghĩa là nó không có nhân viên hoặc các khoản thu. Tất cả kỹ thuật của xu hướng trung tâm, bao gồm cả phương tiện hình học và điều hòa, tất cả các phương pháp thống kê và các chuyển đổi phức tạp như đồng vị dương được phép sử dụng trong thang tỷ lệ.
Dựa trên bốn kiểu loại thang được trình bày trên, chúng ta có thể hình thành những thang đánh giá trong khoa học xã hội. Trong đó, phổ biến nhất là thang nhị phân, thang Likert, thang đối nghĩa và thang Guttman.
Thang nhị phân
Thang nhị phân (binary scale) là những thang định danh chứa đựng những mục chứa hai trị số ví dụ như có/không hay đúng/sai. Phạm trù “tích cực chính trị” là một thang nhị phân tiêu biểu, nó chứa 6 điểm nhị phân. Mỗi điểm trong thang này là một mục nhị phân và tổng số những câu trả lời “đã từng” có thể được sử dụng như một thông số tổng thể để đánh giá sự tích cực chính trị của người đó. Thang nhị phân cũng có thể được sử dụng cho các biến khác, chẳng hạn giới tính (nam hay nữ), tình trạng việc làm (toàn thời gian hay bán thời gian),… Nếu mục “tình trạng việc làm” được sửa đổi để tạo ra nhiều hơn hai giá trị (ví dụ, thất nghiệp, toàn thời gian, bán thời gian và đã nghỉ hưu), nó không còn là nhị phân nhưng vẫn là một mục định danh.
Thang Likert
Thang Likert (Likert scale) được thiết kế bởi Rensis Likert, là một thang đánh giá rất thông dụng trong khoa học xã hội cho dữ liệu định danh. Thang này chứa những mục là những phát biểu đơn giản, dễ hiểu giúp người trả lời bày tỏ mức độ đồng ý hay không đồng ý về một thang 5 đến 7 điểm bắt đầu từ rất đồng ý đến rất không đồng ý. Thang Likert là thang tổng bởi vì điểm của thang là một tổng các giá trị chỉ số của mỗi điểm khi được chọn bởi người trả lời.
Thang Likert mang đến được độ chi tiết cao hơn (câu trả lời linh động hơn) so với thang nhị phân khi nó bao gồm cả câu trả lời trung lập. Chúng ta cũng có thể được sử dụng ba hoặc chín trị số (thường được gọi là các “mấu” – anchor), nhưng nên sử dụng số lượng trị số là lẻ để có thể tạo ra trị số trung lập. Một số nghiên cứu sử dụng “lựa chọn cưỡng bức” để buộc người trả lời đồng ý hay không đồng ý với các phát biểu bằng cách loại bỏ mấu trung lập và sử dụng lượng trị số chẵn. Tuy nhiên điều này không phải là một chiến lược tốt vì một số người thực sự có quan điểm trung lập và kỹ thuật này không cho họ cơ hội để phát biểu quan điểm thật sự. Một đặc tính quan trọng của thang Likert là mặc dù các phát biểu là khác nhau ở các trị số khác nhau nhưng các mấu “hoàn toàn đồng ý” và “hoàn toàn không đồng ý” là luôn luôn giống nhau. Thang Likert là thang thứ bậc bởi vì các mấu không luôn luôn là các khoảng cách bằng nhau, tuy vậy, đôi khi chúng ta coi nó như thang khoảng.
Thang đối nghĩa
Thang đối nghĩa (Semantic Differential Scale) là thang chứa nhiều chỉ số đối xứng về nghĩa, được sử dụng để tìm hiểu quan điểm của người được hỏi về một phát biểu nào đó bằng cách sử dụng các tính từ được đặt ở những vị trí đối xứng nhau. Ví dụ, phạm trù “thái độ về bảo hiểm y tế” có thể được đánh giá bằng cách sử dụng bốn cặp chỉ số như được minh họa trong Bảng bên dưới. Giống như trong thang Likert, số điểm tổng của thang được tổng hợp từ điểm của các chỉ số thành phần. Tuy nhiên, cần chú ý rằng trong thang Likert, phát biểu có thể thay đổi nhưng sử dụng các trị số giống nhau để đánh giá mỗi phát biểu. Trong khi đó, ở thang đối nghĩa, một phát biểu có thể được đánh giá bởi các trị số khác nhau. Thang đối nghĩa được đánh giá là một công cụ rất thích hợp và hiệu quả để đo lường, đánh giá thái đội hay cảm xúc của con người về các đối tượng, các sự kiện hoặc các hành vi.
Thang Guttman
Thang Guttman (Guttman scale) là thang đối xứng được thiết kế bởi Louis Guttman. Nó sử dụng hàng loạt những chỉ số được sắp xếp theo thứ tự tăng dần về mức tăng dần về cường độ của phạm trù cần đánh giá. Ví dụ, phạm trù “thái độ đối với người nhập cư” có thể được đánh giá bằng cách sắp đặt năm chỉ số như được minh họa trong Bảng. Mỗi chỉ số trong thang Guttman thể hiện một trọng số khác nhau (chưa được trình bày ở trên) thay đổi theo cường độ của chỉ số đó và sự kết hợp trọng số của mỗi câu trả lời được sử dụng như biện pháp tổng hợp của một quan sát.