Xem mẫu

THỐNG KÊ, BIẾN SỐ VÀ PHÂN PHỐI Mục tiêu Sau khi nghiên cứu chủ đề, học viên có khả năng: ­ Trình bày định nghĩa của thống kê, số liệu, thông tin và biến số ­ Phân biệt được các loại biến số: định lượng và định tính trong có có biến số nhị giá, danh định hay thứ tự. ­ Xây dựng được bảng phân phối tần suất cho số liệu định tính và định lượng ­ Lựa chọn được các loại biểu đồ hay đồ thị thích hợp để trình bày số liệu định tính và định lượng ­ Tính được các số thống kê tóm tắt như trung bình, trung vị, yếu vị, độ lệch chuẩn, phương sai. 1. Một số định nghĩa Thống kê là phương pháp khoa học dùng đề thu thập, tóm tắt, trình bày và phân tích số liệu. Phương pháp thống kê được sử dụng trong nghiên cứu nhằm để so sánh một nhóm đối tượng chứ không nhằm nghiên cứu từng cá nhân đơn lẻ. Số liệu: Kết quả có được do việc quan sát hay thu thập đặc tính hay đại lượng ở các đối tượng khác nhau hay ở thời gian khác nhau. Thí dụ: Quan sát giới tính của các học viên trong lớp, số liệu ghi nhận được là: Nam, nam, nữ, nữ, nữ, nam, nữ, v.v Thí dụ: Một nhà nghiên cứu đo nồng độ hemoglobin của 70 thai phụ có kết quả như sau: 10.2 13.7 10.4 13.3 12.9 12.1 10.6 10.5 13.7 12.1 12.9 11.4 9.3 13.5 14.6 12.0 12.9 11.1 13.4 12.1 10.9 11.9 11.4 12.5 11.2 15.1 10.7 14.6 11.1 13.5 14.9 11.5 9.4 13.2 11.8 14.1 12.7 10.6 11.2 11.7 8.8 10.2 11.3 14.7 13.0 11.6 12.9 13.4 10.9 13.1 12.0 11.0 10.8 11.7 10.3 13.6 11.4 11.9 10.9 10.4 11.6 12.5 10.8 13.3 13.1 9.7 12.3 11.0 11.8 12.2 và những con số này được gọi là số liệu. Cần lưu ý số liệu phải liên kết với một đặc tính hay đại lượng nhất định. Ghi nhận giới tính ở người này, tuổi của người khác, quần áo của một người khác nữa thì kết quả này được không phải là số liệu. Sử dụng phương pháp thống kê chúng ta có thể tóm tắt số liệu trên sử dụng nồng độ hemoglobin trung bình=11,98 và độ lệch chuẩn bằng 1.42. Số liệu được tóm tắt, trình bày hay phân tích bằng phương pháp thống kê sẽ trở thành thông tin. 2. Biến số và các loại biến số Biến số là những đại lượng hay những đặc tính có thể thay đổi từ người này sang người khác hay từ thời điểm này sang thời điểm khác. Như vậy biến số có thể thể hiện đại lượng hay đặc tính. Nếu nó thể hiện một đại lượng nó được gọi là biến số định lượng. Nếu nó nhằm thể hiện một đặc tính no được gọi là biến số định tính. Biến số định tính Biến số định tính còn được chia làm 3 loại: biến số thứ tự, biến số danh định và biến số nhị giá. Biến số thứ tự là biến số định tính với các giá trị có thể sắp xếp thứ tự được. Thí dụ: tình trạng kinh tế xã hội (giàu, khá, trung bình, nghèo, rất nghèo) là biến số thứ tự bởi vì người giàu có điều kiện kinh tế tốt hơn người khá, người khá hơn người trung bình, trung bình hơn nghèo, v.v Những thí dụ khác là học lực của học sinh (giỏi, khá, trung bình, kém), tiên lượng (tốt, khá, xấu, tử vong). Theo phân loại tăng huyết áp của Tổ chức Y tế Thế giới được trình bày như sau, theo phân loại huyết áp với các giá trị huyết áp bình thường, tăng huyết áp độ 1, tăng huyết áp độ 2, tăng huyết áp độ 3 là biến số thứ tự Huyết áp bình thường: Tăng huyết áp độ 1: Tăng huyết áp độ 2: Tăng huyết áp độ 3: HA tâm thu £ 139 và HA tâm trương £ 89 HA tâm thu £ 179 hay HA tâm trương £ 104 HA tâm thu ³ 180 hay HA tâm trương >114 HA tâm thu ³ 180 và HA tâm trương ³ 115 mmHg Biến số danh định là biến số định tính mà giá trị của nó không thể biểu thị bằng số mà phải biểu diễn bằng một tên gọi (danh: tên) và các giá trị này không thể sắp đặt theo một trật tự từ thấp đến cao. Thí dụ: Biến số dân tộc với các giá trị: Kinh, Khmer, Hoa, Chăm,… là biến số định tính vì chúng ta không thể sắp xếp các giá trị này từ theo một trật tự từ thấp đến cao hay ngược lại. Một số thí dụ khác của biến số danh định là tình trạng hôn nhân (có 4 giá trị: độc thân, có gia đình, li dị, góa) nhóm máu (A, B, AB và O). Đôi khi biến số danh định chỉ có 2 giá trị: thí dụ như sống hay chết; có hút thuốc lá hay không hút thuốc lá; có suy dinh dưỡng hay không suy dinh dưỡng; nam hay nữ. Những biến số thuộc loại này được gọi là biến số nhị giá (binary variable) Mã hoá Trong phân tích thống kê, để tiện việc nhập số liệu hay lí giải kết quả, người ta có thể ánh xạ (mapping) các giá trị của biến định tính vào các con số. Việc này được gọi là mã hóa và cần hiểu rằng việc mã hóa này hoàn toàn có tính chất áp đặt và các con số được dùng trong mã hóa không phản ánh bản chất của biến số danh định. Giới tính là biến số danh định và có hai giá trị là nam và nữ. Chúng ta có thể mã hóa giới tính và quy ước Nam là 1 và Nữ là 2. Tuy nhiên việc mã hóa này là áp đặt và chúng ta hoàn toàn có thể quy ước Nam là 1 và Nữ là 0. Việc mã hóa chỉ nhằm giúp việc nhập số liệu và xử lí số liệu trở nên dễ dàng hơn chứ không nhằm phản ánh bản chất của biến số đó. Biến số định lượng Biến số định lượng nhằm thể hiện một đại lượng và do đó có giá trị là những con số. Thí dụ: tuổi là biến số liên tục bởi vì ta có thể nói người này 20 tuổi, người kia 32 tuổi, v.v. Những thí dụ khác là đường huyết, hemoglobin, hematocrite, chiều cao, cân nặng, thu nhập, v.v 3. Phương pháp trình bày số liệu bảng Số liệu ghi nhận các đặc tính hay đại lượng có thể trình bày thành bảng và bảng này được gọi là bảng phân phối tần suất. Phân phối tần suất của biến số định tính Số liệu của biến số rời rạc có thể được trình bày dưới dạng một phân phối tần suất. Phân phối tần suất là một bảng chỉ ra tần suất xuất hiện của từng giá trị rời rạc của biến số (Bảng 1). Như vậy bảng phân phối tần suất gồm 2 cột, một cột liệt kê các giá trị của biến số và một cột trình bày tần suất tương ứng của các giá trị đó. Table 1. Phân phối giới tính của 69 học sinh lớp cơm thường trường mầm non 23 tháng 11, Huyện Hóc môn Giới Số trẻ Nam 45 Nữ 24 Tổng số 69 Phần trăm 65% 35% 100% Bảng trên là bản phân phối tần suất của giới tính. Bởi vì giới tính có 2 giá trị nam và nữ nên ta liệt kê 2 giá trị này ở một cột. Ở cột thứ nhì ta ghi tần suất tương ứng của các giá trị này. Ðôi khi bảng phân phối tần suất có thêm cột phần trăm như trong thí dụ ở trên. Bảng 2 là một thí dụ khác về bảng phân phối tần suất. Table 2. Phương pháp đỡ đẻ của 600 trẻ trong bệnh viện Phương pháp đỡ Số Phần đẻ sinh trăm Sinh thường Sinh forceps Sinh mổ Tổng số 478 79,7 65 10,8 57 9,5 600 100,0 Ðôi khi trong bảng phân phối người ta không ghi con số thực tế của tần suất mà chỉ ghi nhận phần trăm. Trong trường hợp hợp này, phải ghi rõ số đối tượng của toàn bộ phân phối (số đối tượng toàn bộ trong thí dụ trên là 600) Phân phối tần suất của biến số định lượng Nếu biến số là biến số liên tục chúng ta không thể liệt kê tất cả các giá trị của biến số. Trong trường hợp này chúng ta có thể nhóm (làm tròn) giá trị của biến số lại. Cụ thể các bước xây dựng bảng phân phối tần suất cho biến số định lượng như sau: 1­ Tìm phạm vi (giá trị cực tiểu và giá trị cực đại) của số liệu. Trong thí dụ về hemoglobin của 70 phụ nữ phạm vi là 8,8 đến 15,1 2. Chia phạm vi số liệu ra làm n khoảng với độ rộng của mỗi khoảng là d. Cần lưu ý độ rộng mỗi khoảng d nên là đại lượng chẵn như 1, 2, 5, 10 hay 0,5, 0,2 và số các khoảng n nên từ 5­12 (trung bình là 7­8). Trong thí dụ trên ta có thể chia phạm vi ra làm 8khoảng với chiều rộng khoảng bằng 1 đơn vị. Khi đó các khoảng là: 8­8,9; 9­9,9; 10­10,9; 11­11,9; 12­12,9; 13­13,9; 14­14,9; 15­15,9. 3. Ðếm các giá trị thích hợp vào khoảng đã định trước Hemoglobin (g/100ml) 8­8,9 9­9,9 10­10,9 11­11,9 12­12,9 13­13,9 14­14,9 15­15,9 Ðếm 1 111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 111 1111 1 4. Xây dựng bảng phân phối tần suất với biến số và các khoảng giá trị của biến số và tần suất tương ứng với các khoảng giá trị đó. Chúng ta cũng có thể thêm vào cột phần trăm và cột phần trăm tích lũy (nếu thích hợp) Table 3. Hemoglobin của 70 phụ nữ Hemoglobin Tần suất 8­8,9 1 9­9,9 3 10­10,9 14 Phần Phần trăm tích trăm lũy 1.43 1.43 4.29 5.71 20.00 25.71 11­11,9 12­12,9 13­13,9 14­14,9 15­15,9 19 27.14 52.86 14 20.00 72.86 13 18.57 91.43 5 7.14 98.57 1 1.43 100.00 Thí dụ như nếu biên số là chu vi vòng cánh tay của trẻ chúng ta có thể làm tròn chu vi vòng cánh tay đến 1 cm. Khi đó ta có thể xem thang đo của biến số là rời rạc và trình bày bảng phân phối tần suất của biến số (bảng 2). Table 4. Phân phối số đo vòng cánh tay của 69 trẻ lớp cơm thường nhà trẻ 23 tháng 11, Hóc môn. Vòng cánh tay Tần suất 13­ <14 2 14­ <15 31 15­ <16 27 16­ <17 9 17­ <18 0 18­ <19 2 19­ <20 1 Phần Phần trăm tích trăm lũy 2.78 2.78 43.06 45.83 37.50 83.33 12.50 95.83 12.50 95.83 2.78 98.61 1.39 100.00 4. Các số thống kê mô tả Việc trình bày số liệu bằng bảng là thỏa mãn cho các biến số định tính (cả biến số danh định và biến số thứ tự). Tuy nhiên các số liệu định lượng có thể tóm tắt hơn nữa bằng các số thống kê mô tả. Có hai loại thống kê mô tả: thống kê mô tả khuynh hướng tập trung và thống kê mô tả tính phân tán. Thống kê mô tả khuynh hướng tập trung Thống kê mô tả khuynh hướng tập trung có thể là trung bình (mean), trung vị (median) và yếu vị (mode). Những thống kê này cho biết giá trị tiêu biểu cho số liệu. Thí dụ: có hai loại thuốc hạ áp A và B. Giả sử có 5 đối tượng sau khi sử dụng thuốc hạ áp A sẽ có huyết áp 110 ­ 115 ­120 ­ 125 ­130 và ở 5 đối tượng khác sau khi sử dụng thuốc hạ áp B sẽ có huyết áp 120 ­ 125 ­ 130 ­ 135 ­ 140. Con số tiêu biểu nhất để cho biết tác dụng của thuốc A là huyết áp trung bình sau khi sử dụng thuốc A và là 120. Con số huyết áp trung bình này thấp hơn huyết áp trung bình sau khi sử dụng thuốc B cho biết thuốc A có tác dụng mạnh hơn. Trung bình của số liệu, được kí hiệu là x (đọc là x gạch) là tổng các giá trị của số liệu chia cho số lần quan sát (N). ... - tailieumienphi.vn
nguon tai.lieu . vn