Xem mẫu

  1. TRƯỜNG ĐẠI HỌC PHẠM VĂN ĐỒNG KHOA KINH TẾ BÀI GIẢNG MÔN: THỐNG KÊ KINH TẾ (BẬC ĐẠI HỌC) Người biên soạn: Th.S Nguyễn Thị Phương Hảo Năm 2020
  2. CHƯƠNG 1: GIỚI THIỆU VỀ THỐNG KÊ KINH TẾ 1.1 Thống kê và các phân nhánh của thống kê 1.1.1 Định nghĩa thống kê Thống kê là hệ thống các phương pháp dùng để thu thập và xử lý dữ liệu nhằm phục vụ cho quá trình nghiên cứu và ra quyết định khi dữ liệu được thu thập trong điều kiện không chắc chắn. “Thống kê’ có 2 nghĩa: Nghĩa thông thường là thu thập số liệu; nghĩa rộng là một môn khoa học về bố trí, hoạch định các quan sát và thí nghiệm; thu thập và phân tích các số liệu và rút ra kết luận về các số liệu đã phân tích. Do đó, thống kê được coi là một công cụ của nghiên cứu khoa học, quản lý kinh tế và quản lý xã hội. Đây chính là “bộ đồ nghề” của các nhà nghiên cứu và lãnh đạo. Tuy nhiên, đôi khi thuật ngữ thống kê cũng được dùng để chỉ những con số thu thập được từ hoạt động thống kê mô tả hay thống kê suy luận trên thực tế Cơ sở lý thuyết cho thống kê là lý thuyết xác suất và thống kê toán. Hiện nay thống kê đã được ứng dụng rộng rãi trong rất nhiều lĩnh vực như: thống kê dân số, thống kê xã hội, thống kê trong kinh doanh, thống kê bảo hiểm, thống kê trong giáo dục, thống kê trong sinh học, thống kê trong y học,…Trong lĩnh vực kinh tế và kinh doanh, thống kê đóng vai trò là công cụ cơ bản để phân tích thực trạng tình hình thông qua dữ liệu thu thập và xử lý nhằm tìm hiểu bản chất và tính quy luật của hiện tượng trong những điều kiện không gian và thời gian cụ thể. 1.1.2 Các phân nhánh của thống kê. Thống kê thường được phân thành 2 lĩnh vực: - Thống kê mô tả (Descriptive statistics): là các phương pháp có liên quan đến việc thu thập số liệu, tóm tắt,trình bày, tính toán và mô tả các đặc trưng khác nhau để phản ánh một cách tổng quát đối tượng nghiên cứu - Thống kê suy luận (Inferential statistics): là bao gồm các phương pháp ước lượng các đặc trưng của tổng thể, phân tích mối liên hệ giữa các hiện tượng nghiên cứu, dự đoán hoặc đưa ra quyết định trên cơ sở thông tin thu thập từ kết quả quan sát mẫu 1
  3. 1.2 Các khái niệm căn bản. 1.2.1 Tổng thể thống kê và đơn vị tổng thể * Tổng thể thống kê (còn gọi là tổng thể chung) là tập hợp các đơn vị cá biệt (hay phần tử) thuộc hiện tượng nghiên cứu, cần quan sát, thu thập và phân tích mặt lượng của chúng theo một hay một số tiêu thức nào đó. Ví dụ 1.1: Tổng thể các sinh viên trường đại học Phạm Văn Đồng (các sinh viên có đặc điểm chung là sinh viên của trường…. * Đơn vị tổng thể: là từng đơn vị cá biệt cấu thành nên tổng thể thống kê Ví dụ 1.2: trong tổng thể sinh viên trường đại học Phạm Văn Đồng thì mỗi sinh viên là một đơn vị tổng thể… Tuỳ theo mục đích nghiên cứu mà tổng thể xác định có khác nhau. Muốn xác định được một tổng thể thống kê, ta phải xác định được tất cả các đơn vị tổng thể của nó. Thực chất của việc xác định tổng thể thống kê là việc xác định các đơn vị tổng thể. * Phân loại tổng thể thống kê Có nhiều cách để phân loại tổng thể thống kê, cụ thể: - Căn cứ vào sự nhận biết các đơn vị trong tổng thể + Tổng thể bộc lộ: Tổng thể có ranh giới rõ ràng, có thể nhận biết được tất cả các đơn vị bằng trực quan. Ví dụ 1.3: Tổng thể các công ty có cổ phiếu niêm yết trên sàn giao dịch chứng khoán TP. Hồ Chí Minh, tổng thể các cổ đông của công ty A… + Tổng thể tiềm ẩn: Tổng thể có ranh giới không rõ ràng, không nhận biết hết được tất cả các đơn vị trong tổng thể. Ví dụ 1.4: Tổng thể những doanh nghiệp có hoạt động làm ăn phi pháp, tổng thể những người mê tín dị đoan… Trong thực tế, tổng thể tiềm ẩn rất đa dạng, vì vậy cần xác định tổng thể nghiên cứu là tổng thể bộc lộ hay tiềm ẩn để tìm cách xác định đối tượng cho phù hợp. - Căn cứ vào mục đích nghiên cứu + Tổng thể đồng chất: Bao gồm những đơn vị giống nhau về một số đặc điểm chủ yếu có liên quan tới mục đích nghiên cứu. Ví dụ 1.5: Sản lượng lúa của Việt Nam năm 2018 2
  4. + Tổng thể không đồng chất: Bao gồm những đơn vị có những đặc điểm chủ yếu khác nhau có liên quan tới mục đích nghiên cứu. Ví dụ 1.6: Sản lượng các loại cây năm 2018 - Căn cứ vào phạm vi nghiên cứu + Tổng thể chung: Bao gồm tất cả các đơn vị thuộc đối tượng nghiên cứu. + Tổng thể bộ phận: Bao gồm một phần của tổng thể chung. 1.2.2 Mẫu Mẫu là một bộ phận của tổng thể, đảm bảo được tính đại diện và được chọn ra để quan sát và dùng để suy diễn cho toàn bộ tổng thể. Như vậy, tất cả các phần tử của mẫu phải thuộc tổng thể, nhưng ngược lại các phần tử của mẫu thì chưa chắc thuộc mẫu. Điều này tưởng chừng đơn giản, tuy nhiên trong một số trường hợp việc xác định mẫu cũng có thể dẫn đến nhầm lẫn, đặc biệt là trong trường hợp tổng thể ta nghiên cứu là tổng thể tiềm ẩn Ngoài ra, chọn mẫu như thế nào để làm cơ sở suy diễn cho tổng thể, tức là mẫu phải mang tính đại diện cho tổng thể. Điều này thực sự không dễ dàng, ta chỉ hạn chế tối đa sự sai biệt này thôi chứ không thể khắc phục được hoàn toàn 1.2.3 Tiêu thức (biến) thống kê Là đặc điểm của đơn vị tổng thể chọn ra để nghiên cứu tùy theo mục đích nghiên cứu khác nhau. Như vậy, tiêu thức thống kê không phải là tất cả những đặc điểm của đơn vị tổng thể mà chỉ là những đặc điểm được chọn ra để nghiên cứu. Ví dụ 1.7: Mỗi sinh viên là một đơn vị tổng thể có các đặc điểm như: tên, tuổi, giới tính, điểm trung bình chung học tập.... Mỗi đặc điểm này khi được chọn ra để nghiên cứu là một tiêu thức thống kê Mỗi tiêu thức thống kê đều có các giá trị biểu hiện của nó, dựa vào sự biểu hiện của nó người ta chia ra làm 2 loại: - Tiêu thức thuộc tính: là loại tiêu thức mà biểu hiện của nó không phải là những con số cụ thể mà là những tên gọi, từ ngữ dùng để phản ánh tính chất của đơn vị tổng thể Ví dụ 1.8: giới tính, dân tộc, tôn giáo, tình trạng hôn nhân (có gia đình hay chưa),... 3
  5. - Tiêu thức số lượng: là loại tiêu thức mà biểu hiện của nó là những con số cụ thể phản ánh đặc trưng của đơn vị tổng thể mà có thể cân, đong, đo, đếm được và những con số đó được gọi là lượng biến của tiêu thức Ví dụ 1.9: độ tuổi, số lượng công nhân, năng suất lao động, mức tiền lương,... Có hai loại lượng biến: - Lượng biến rời rạc: Là lượng biến mà các giá trị có thể có của nó chỉ nhận những giá trị nguyên Ví dụ 1.10: Số sinh viên trong 1 trường đại học, số nhân khẩu trong 1 hộ gia đình, số thành phẩm nhập kho trong 1 ngày tại một phân xưởng,… - Lượng biến liên tục: Là lượng biến có khả năng nhận mọi giá trị trên trục số. Ví dụ 1.11: Trọng lượng, chiều cao của 1 học sinh; năng suất lao động của một công nhân… * Tiêu thức chỉ có 2 biểu hiện không trùng nhau trên 1 đơn vị tổng thể gọi là tiêu thức thay phiên Ví dụ 1.12: Tiêu thức giới tính (nam – nữ), sinh tử, tiêu thức chất lượng (đạt/không đạt)… 1.2.4 Chỉ tiêu thống kê Là tiêu chí mà biểu hiện bằng số của nó phản ánh quy mô, tốc độ phát triển, cơ cấu, quan hệ tỉ lệ của hiện tượng kinh tế - xã hội trong điều kiện thời gian và không gian cụ thể. Ví dụ 1.13: Dân số hiện tại của Việt Nam là 96.993.385 người vào ngày 12/01/2019 theo số liệu mới nhất từ Liên Hợp Quốc. (Nguồn: https://danso.org/viet- nam/); Lợi nhuận của công ty B trong năm 2018 là 3 tỷ đồng,... * Phân loại chỉ tiêu thống kê Có nhiều cách thức phân loại chỉ tiêu thống kê khác nhau. Phân theo nội dung phản ánh thì chỉ tiêu thống kê chia làm 2 loại: - Chỉ tiêu khối lượng: là chỉ tiêu nêu lên các đặc điểm chung về quy mô, khối lượng đơn vị tổng thể. Ví dụ 1.14: chỉ tiêu số nhân khẩu, khối lượng sản phẩm, số công nhân, diện tích gieo trồng, tổng số dân số.... 4
  6. - Chỉ tiêu chất lượng: là chỉ tiêu biểu hiện các tính chất, trình độ phổ biến, mối quan hệ tổng thể. Ví dụ 1.15: chỉ tiêu năng suất lao động, giá thành đơn vị sản phẩm,.... Trước khi tiến hành nghiên cứu thống kê việc trước tiên là phải xác định hệ thống chỉ tiêu thống kê. Hệ thống chỉ tiêu thống kê là tập hợp các chỉ tiêu thống kê phản ánh các mặt, các tính chất quan trọng có liên quan với nhau, bổ sung cho nhau được gắn liền với mục tiêu nghiên cứu nhất định của một tổng thể. 1.3 Các loại thang đo trong thống kê Để lượng hoá hiện tượng nghiên cứu, tuỳ theo tính chất của dữ liệu, thống kê đo lường bằng 4 loại thang đo chủ yếu sau: 1.3.1 Thang đo định danh: Thang đo định danh là thang đo dùng các mã số để phân loại các đối tượng. Thang đo dịnh danh không mang ý nghĩa nào cả mà chỉ để lượng hoá các dữ liệu cần cho nghiên cứu. Nó thường được sử dụng cho các tiêu thức thuộc tính. Người ta thường dùng các chữ số tự nhiên như 1, 2, 3, 4... để làm mã số. Ví dụ 1.16: - Giới tính: người ta thường mã số nam là 1; nữ là 2. - Tình trạng gia đình: 1: Độc thân ; 2: Kết hôn; 3: Ly dị; 4: Khác. * Đặc điểm: Các con số trên thang đo không biểu thị quan hệ hơn kém, cao thấp nhưng khi chuyển từ số này sang số khác thì dấu hiệu đo đã có sự thay đổi về chất. Không áp dụng các phép tính khi sử dụng loại thang đo này mà chỉ đếm được tần số xuất hiện của từng biểu hiện. 1.3.2 Thang đo thứ bậc: Thang đo thứ bậc là thang đo sự chênh lệch giữa các biểu hiện của tiêu thức có quan hệ thứ bậc hơn kém. Sự chênh lệch này không nhất thiết phải bằng nhau. Nó được dùng cho cả tiêu thức thuộc tính và tiêu thức số lượng. Ví dụ 1.17: - Tiền lương của công nhân trong doanh nghiệp hàng tháng là: < 800 ngàn đồng; từ 800-1000 ngàn đồng; từ 1000-1500 ngàn đồng và > 1500 ngàn đồng. - Bậc thợ (7 bậc), chất lượng sản phẩm, xếp hạng huân huy chương... * Đặc điểm: Loại thang đo này được dùng nhiều trong nghiên cứu xã hội, đo các tiêu thức mà các biểu hiện có quan hệ thứ tự như thái độ, quan điểm của con 5
  7. người đối với các hiện tượng xã hội. Với thang đo này, có thể tính toán đặc trưng chung cho một tổng thể một cách tương đối qua tính số bình quân, còn đối với một đơn vị tổng thể thì không thực hiện được. Ví dụ 1.18: Để đánh giá độ tự tin của bạn khi được giao một công việc mới, người ta đưa ra một thang đo thứ bậc với 3 nấc: 1. Rất tự tin, 2. Tương đối tự tin, 3. Không tự tin. Con số 1, 2, 3 ở đây không có nghĩa là bạn tự tin gấp 2, gấp 3 lần mà chỉ biểu thị quan hệ hơn kém. Tuy nhiên, ta không thể xác định được mức độ cao thấp giữa các nhóm, khoảng cách giữa các biểu hiện cũng không bằng nhau. 1.3.3 Thang đo khoảng: Thang đo khoảng là thang đo thứ bậc nhưng có khoảng cách đều nhau và không có điểm gốc không (0) tuyệt đối. Ví dụ 1.19: Tiêu thức nhiệt độ không khí, 0oC là một biểu hiện; tiêu thức điểm thi, điểm 0 là một biểu hiện chứ không có nghĩa là không có điểm. * Đặc điểm: Có thể sử dụng các phép tính cộng, trừ và có thể tính được các đặc trưng của dãy số như số bình quân, phương sai... nhưng không tính được tỷ lệ giữa các trị số đo. Hạn chế cơ bản của thang đo khoảng là chưa có giá trị “không tuyệt đối” mà chỉ có giá trị 0 quy ước. Ví dụ 1.20: Nhiệt độ trung bình của thành phố A là 30oC, thành phố B là 10oC, nhưng điều đó không có nghĩa là thành phố A nóng gấp 3 lần thành phố B. 1.3.4 Thang đo tỷ lệ: Thang đo tỷ lệ là thang đo khoảng có điểm gốc không (0) tuyệt đối. * Đặc điểm: Thang đo tỷ lệ được sử dụng rất rộng rãi để đo lường các hiện tượng kinh tế – xã hội . Có thể thực hiện tất cả các phép tính với trị số đo và có thể so sánh các tỷ lệ giữa các trị số đo. 1.4 Dữ liệu dùng trong thống kê Khi nghiên cứu bất kỳ hiện tượng kinh tế nào việc đầu tiên là thu thập dữ liệu, sau đó trình bày dữ liệu và phân tích. Dữ liệu là những sự kiện và con số được thu thập, phân tích và tóm lược nhằm trình bày và giải thích về các hiện tượng nghiên cứu * Phân loại dữ liệu. Có nhiều tiêu chí để phân loại dữ liệu. Tuỳ thuộc vào mục đích, ý nghĩa và phạm vi ứng dụng mà người ta có thể lựa chọn những tiêu thức phù hợp. Ở đây trình bày một số phân loại dữ liệu được sử dụng chủ yếu trong nghiên cứu thống kê. 6
  8. - Căn cứ tính chất của thông tin: Có hai loại dữ liệu chủ yếu là dữ liệu định tính và dữ liệu định lượng. * Dữ liệu định tính là dữ liệu phản ánh tính chất và sự hơn kém về tính chất của đối tượng nghiên cứu. Ví dụ 1.21: giới tính của sinh viên (nam, hay nữ); thời gian tự học ở nhà dài hay ngắn Dữ liệu định tính được thu thập dễ hơn và người ta thường dùng các thang đo định danh hay thứ bậc để xác định. * Dữ liệu định lượng là dữ liệu phản ánh mức độ hay mức độ hơn, kém theo một tiêu thức số lượng nào đó của đối tượng nghiên cứu. Ví dụ 1.22: độ tuổi của sinh viên, thời gian tự học 1 ngày, 1 tuần. Dữ liệu định lượng trong nghiên cứu thống kê thường gặp nhiều hơn, dễ áp dụng những phương pháp tính toán, phân tích hơn. Khi xác định các dữ liệu định tính, người ta thường dùng thang đo khoảng cách hay thứ bậc. Mục đích của cách phân loại này nhằm giúp cho người nghiên cứu xác định trước các phương pháp xử lý, tổng hợp và phân tích cần sử dụng cho từng loại dữ liệu sao cho phù hợp và đáp ứng mục tiêu nghiên cứu đặt ra. - Căn cứ nguồn cung cấp: Theo nguồn cung cấp thông tin có hai loại dữ liệu: dữ liệu thứ cấp và dữ liệu sơ cấp. * Dữ liệu thứ cấp là dữ liệu thu thập từ những nguồn có sẵn. Những dữ liệu này đã qua tổng hợp, xử lý công bố hay xuất bản. Ví dụ 1.23: Những dữ liệu về kết quả học tập của sinh viên có thể lấy ở phòng đào tạo hay trợ lý đào tạo của từng khoa Dữ liệu thứ cấp có ưu điểm là thu thập nhanh, rẻ nhưng thiếu chi tiết và đôi khi không đáp ứng đúng yêu cầu nghiên cứu. Nguồn dữ liệu thứ cấp khá phong phú thường gặp ở các nguồn chủ yếu sau: - Nội bộ: Các số liệu báo cáo về tình hình sản xuất, tiêu thụ, tài chính, vật tư, nhân sự... của các phòng ban, bộ phận; các số liệu báo cáo từ các cuộc điều tra khảo sát trước đây ở từng đơn vị (doanh nghiệp, cơ quan, ban, ngành...). 7
  9. - Cơ quan thống kê nhà nước: Các số liệu do các cơ quan thống kê nhà nước (Tổng cục Thống kê, Cục Thống kê, Phòng Thống kê...) cung cấp trong các niên giám thống kê. - Cơ quan chính phủ: Số liệu do các cơ quan trực thuộc Chính phủ (Bộ, cơ quan ngang bộ, Uỷ ban nhân dân các cấp) công bố hay cung cấp. Các số liệu này thường chi tiết hơn, mang tính chất đặc thù của ngành hay địa phương. - Sách, báo, tạp chí đã xuất bản. Các số liệu này thường mang tính thời sự và cập nhật cao, mức độ tin cậy tuỳ thuộc vào nguồn số liệu của từng tờ báo hay tạp chí; - Các tổ chức, hiệp hội, viện nghiên cứu, trường đại học; - Các công ty nghiên cứu và cung cấp thông tin. * Dữ liệu sơ cấp (thông tin gốc) là dữ liệu không có sẵn, dữ liệu ban đầu thu thập trực tiếp từ đối tượng nghiên cứu. Ví dụ 1.24: Các dữ liệu có liên quan đến việc tự học của sinh viên là các dữ liệu sơ cấp, không có sẵn mà chúng ta muốn có phải điều tra từ sinh viên. - Dữ liệu sơ cấp có ưu điểm là chi tiết, độ tin cậy cao đối với các tình huống cụ thể. Song hạn chế của nó là thu thập tốn kém, phụ thuộc vào trình độ chủ quan của người nghiên cứu (nhất là những tình huống dự báo). CÂU HỎI ÔN TẬP CHƯƠNG 1 1. Trình bày các khái niệm căn bản thường được dùng trong thống kê 2. Trình bày các loại thang đo trong thống kê 8
  10. CHƯƠNG 2: THỐNG KÊ MÔ TẢ Dữ liệu mới thu thập được thường rất nhiều và rối rắm, khó nhận thức về hiện tượng nghiên cứu. Các phương pháp thống kê mô tả giúp tóm lược dữ liệu, lược bỏ những thứ rườm rà, khó hiểu, nhờ đó nhận thức được những đặc trưng cốt lõi nhất của hiện tượng 2.1 Mô tả dữ liệu cho một tiêu thức định tính bằng bảng phân phối và biểu đồ 2.1.1 Lập bảng phân phối - Trường hợp tiêu thức thuộc tính có ít biểu hiện: Mỗi biểu hiện của tiêu thức có thể hình thành 1 tổ. Ví dụ 2.1: 2 giới tính, 5 thành phần kinh tế... - Trường hợp tiêu thức thuộc tính có nhiều biểu hiện: Ghép một số tổ nhỏ thành tổ lớn tùy theo đặc điểm hiện tượng và yêu cầu về mức độ chi tiết khi phân tổ. Cần bảo đảm yêu cầu các tổ nhỏ được ghép phải giống nhau hoặc gần giống nhau về đặc điểm và tính chất. Việc ghép tổ này đạt được hai mục đích, làm cho số tổ ít đi và đảm bảo giữa các tổ có sự khác nhau về đặc điểm, tính chất. Ví dụ 2.2: Mặc dù chỉ có 5 thành phần kinh tế nhưng theo mục đích nghiên cứu, ta chỉ cần phân tổ theo 2 thành phần: Nhà nước và ngoài Nhà nước. 2.1.2 Trình bày bằng biểu đồ Phân phối của tiêu thức định tính thường được mô tả (trình bày) bằng biểu đồ hình tròn hay biểu đồ hình thanh. Trình bày dữ liệu trong bảng phân phối lên đồ thị thích hợp sẽ giúp ta mô tả tóm tắt các đặc trưng phân phối của hiện tượng nghiên cứu bằng hình ảnh 2.2 Mô tả dữ liệu cho một tiêu thức định lượng bằng bảng phân phối và biểu đồ 2.2.1 Lập bảng phân phối Căn cứ vào mức độ thay đổi lượng biến của tiêu thức mà ta phân ra hai trường hợp sau: - Trường hợp 1: Tiêu thức số lượng có ít biểu hiện Mỗi lượng biến hình thành một tổ (số tổ bằng số lượng biến). Trường hợp này được gọi là phân tổ không có khoảng cách tổ. 9
  11. Ví dụ 2.3: Phân tổ công nhân sản suất trong một công ty dệt theo số máy do mỗi công nhân đảm trách, như số nhân khẩu trong gia đình, Phân tổ công nhân doanh theo bậc thợ…. - Trường hợp 2: Tiêu thức số lượng có nhiều biểu hiện - Ta phân tổ có khoảng cách tổ và mỗi tổ có một giới hạn + Giới hạn trên: lượng biến nhỏ nhất của tổ + Giới hạn dưới: lượng biến lớn nhất của tổ + Tổ thiếu một trong hai giới hạn gọi là tổ mở. + Trị số chênh lệch giữa giới hạn trên và giới hạn dưới của mỗi tổ gọi là khoảng cách tổ - Cần chú ý mối liên hệ giữa lượng và chất trong phân tổ, xét cụ thể xem lượng biến tích luỹ đến một mức độ nào đó thì chất của hiện tượng mới thay đổi và làm nảy sinh ra một tổ khác. - Tùy theo mục đích nghiên cứu, người ta phân ra: phân tổ có khoảng cách tổ đều và phân tổ có khoảng cách tổ không đều - Phân tổ có khoảng cách tổ đều nhau: được thực hiện với những hiện tượng tương đối đồng nhất về mặt loại hình kinh tế xã hội và lượng biến mà sự biến đổi về chất đều đặn từ nhỏ đến lớn, thấp đến cao có hai trường hợp như sau: + Đối với lượng biến liên tục, việc phân tổ gồm các bước sau đây: 3 Bước 1: Xác định số tổ 𝑛 ≈ √2 × 𝑘 , với k là số quan sát (cỡ mẫu). 𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛 Bước 2: Xác định khoảng cách tổ : ℎ = 𝑛 Trong đó: xmax và xmin tương ứng là lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức Bước 3: Sắp xếp các đơn vị vào từng tổ Lưu ý: Nếu giá trị quan sát trùng với giới hạn trên của một tổ thì nó được xếp và tổ tiếp theo. Ví dụ 2.4: Phân tổ 30 công nhân tại một doanh nghiệp theo tiêu thức mức thu nhập tháng của một công nhân. Biết rằng số liệu thu thập được như sau. 10
  12. Đơn vị: 1000 đồng 3.000 3.200 3.350 3.200 3.700 3.500 3.800 3.900 4.000 3.850 3.400 3.500 3.600 3.400 3.600 3.600 3.500 3.600 3.750 3.500 3.400 3.550 4.000 3.100 3.550 3.600 3.550 3.600 3.400 3.400 4.000−3.000 Nếu dự kiến chia thành 5 tổ thì ℎ = = 200 5 Dựa vào h = 200 ta thành lập các tổ và sắp xếp số công nhân vào các tổ thích hợp. Khi đó ta có bảng phân tổ công nhân theo mức thu nhập tháng: Mức thu nhập tháng của một công nhân Số công nhân (1000 đồng) (người) Từ 3000 đến dưới 3.200 2 Từ 3.200 đến dưới 3.400 3 Từ 3.400 đến dưới 3.600 12 Từ 3.600 đến dưới 3.800 8 Từ 3.800 đến 4.000 5 Tổng 30 Nếu số tổ được phân không theo yêu cầu cho trước thì ta tính số tổ 𝑛 = 3 √2 × 𝑘 ≈ 4, sau đó tính khoảng cách tổ h và phân tổ tương tự như trên. + Đối với lượng biến rời rạc, các tổ được thiết lập theo quy định như sau: giới hạn dưới của tổ sau lớn hơn giới hạn trên của tổ trước (thường là một đơn vị) và trị số của khoảng cách tổ được xác định theo công thức dưới đây: xmax − xmin − (n − 1) h= 𝑛 11
  13. Ví dụ 2.5: Có tài liệu về số công nhân của 20 doanh nghiệp sản xuất công nghiệp như sau: Doanh 1 2 3 4 5 6 7 8 9 10 nghiệp Số công 1.200 1.304 1.500 1.670 1.400 1.430 1.350 1.240 1.700 1.800 nhân Doanh 11 12 13 14 15 16 17 18 19 20 nghiệp Số công 1.650 2.050 2.120 1.980 2.400 2.883 2.540 2.760 2.300 2.130 nhân Giả sử chia 20 doanh nghiệp này thành bốn tổ có khoảng cách đều nhau theo tiêu thức số công nhân, khi đó: (2.883−1.200)−(4−1) ℎ= = 420 công nhân 4 Dựa vào h = 420, ta thành lập các tổ và sắp xếp các đơn vị tổng thể vào các tổ thích hợp như sau: Số công nhân của doanh nghiệp Số doanh nghiệp 1.200 – 1.620 7 1.621 – 2.041 5 2.042 – 2.462 5 2.463 – 2.883 3 Tổng 20 + Phân tổ có khoảng cách tổ không đều: được áp dụng khi hiện tượng có lượng biến trên các đơn vị tổng thể biến động không đều. Khi đó ta phân tổ dựa trên việc phân tích quan hệ lượng - chất, có nghĩa là khi lượng biến thay đổi làm cho chất thay đổi thì phải hình thành tổ mới, còn khi lượng biến thay đổi mà chất vẫn chưa thay đổi thì ghép các đơn vị đó vào một tổ. 12
  14. Ví dụ 2.6: Để nghiên cứu lực lượng lao động của một nước, một địa phương người ta phân tổ dân số theo độ tuổi như sau: + < 6 tuổi: giáo dục mầm non + 6 – 18 tuổi: giáo dục phổ thông + 19 – 55 tuổi: trong độ tuổi lao động + > 55 tuổi: ngoài độ tuổi lao động nhưng có khả năng lao động 2.2.2 Trình bày bằng biểu đồ Phân phối của tiêu thức định lượng thường được mô tả bằng các loại biểu đồ như biểu đồ điểm, biểu đồ phân phối, biểu đồ hình cung hay biểu đồ cành và lá 2.3 Mô tả một tiêu thức định lượng bằng các chỉ tiêu thống kê 2.3.1 Các chỉ tiêu đo lường khuynh hướng tập trung. Khi cần nhận thức khái quát nhất về một tiêu thức định lượng điều trước tiên chúng ta cần biết là tâm điểm của biến. Các chỉ tiêu thống kê đo lường khuynh hướng tập trung đáp ứng yêu cầu này. Có 3 loại chỉ tiêu thường dùng nhất là số trung bình, trung vị và mode 2.3.1.1 Số trung bình Số bình quân cộng được tính bằng cách lấy tổng lượng biến của tiêu thức chia cho tổng số đơn vị tổng thể (tổng các tần số). a)Trường hợp dữ liệu mẫu 𝑥1 +𝑥1 +𝑥3 +⋯+𝑥𝑛 ∑𝑛 𝑖=1 𝑥𝑖 + Với dữ liệu không có tần số: 𝑥̅ = = 𝑛 𝑛 Trong đó: - 𝑥̅ : Số trung bình mẫu - xi : các lượng biến (i = 1, 2,...., n) - n: số đơn vị tổng thể. 𝑥1 ×𝑓1 +𝑥2 ×𝑓2 +⋯.+𝑥𝑛 ×𝑓𝑛 ∑𝑛 𝑖=1 𝑥𝑖 ×𝑓𝑖 + Với dữ liệu có tần số : 𝑥̅ = = ∑𝑛 𝑓1 +𝑓2 +⋯.+𝑓𝑛 𝑖=1 𝑓𝑖 Trong đó: - xi là các lượng biến (i = 1, 2,...., n) - fi là các tần số (quyền số) của lượng biến (i = 1, 2, 3,..., n) Ví dụ 2.7 : Có số liệu về tiền lương của 50 công nhân thể hiện như sau: 13
  15. Tiền lương (1000 đồng) (xi ) Số công nhân (fi) xi x fi 500 5 2.500 650 8 5.200 800 20 16.000 950 10 9.500 1000 7 7.000 Cộng 50 40.200 Tiền lương bình quân tháng của một công nhân : ∑𝑛 𝑖=1 𝑥𝑖 ×𝑓𝑖 40.200 𝑥̅ = ∑𝑛 = = 804 (1.000 đồng) 𝑖=1 𝑓𝑖 50 Vậy tiền lương bình quân 1 công nhân/1 tháng là 804 ngàn đồng.  Một số trường hợp đặc biệt: - Với dữ liệu được phân tổ có khoảng cách tổ ∑𝑛𝑖=1 𝑥𝑖 × 𝑓𝑖 𝑥̅ = ∑𝑛𝑖=1 𝑓𝑖 Trong đó: - 𝑥𝑖 = (𝑥𝑖𝑚𝑖𝑛 + 𝑥𝑖𝑚𝑎𝑥 )/2: trị số giữa tổ i - fi là các tần số (quyền số) của lượng biến (i = 1, 2, 3,..., n) Ví dụ 2.8: có bảng phân phối tần số 600 người tiêu dùng Độ tuổi Tần số (fi) Trị số giữa (xi) Dưới 16 20 10,5 16-25 180 20,5 26-45 260 35,5 46-60 100 53 Trên 60 40 68 Trong đó, tổ đầu và tổ cuối gọi là tổ mở có trị số giữa được tính dựa vào khoảng cách tổ của tổ gần chúng nhất Trị số giữa của tổ thứ nhất: (15+(15-9))/2 =10,5 Trị số giữa của tổ cuối: (61+(61+14))/2=68 14
  16. Tuổi trung bình của 600 người tiêu dùng ∑𝑛 𝑖=1 𝑥𝑖 ×𝑓𝑖 10,5×20+20,5×180+35,5×260+53×100+68×40 𝑥̅ = ∑𝑛 = = 35,25 (tuổi) 𝑖=1 𝑓𝑖 20+180+260+100+40 - Trường hợp tính số trung bình có thể dùng quyền số là số tương đối kết cấu của từng bộ phận trong tổng thể đó. 𝑓𝑖 ∑𝑛 ∑𝑛 𝑖=1 𝑥𝑖 × ∑𝑛 𝑖=1 𝑥𝑖 ×𝑓𝑖 ∑ 𝑓𝑖 𝑖=1 𝑥𝑖 ×𝑑𝑖 Công thức tính: 𝑥̅ = ∑𝑛 = 𝑓𝑖 = ∑𝑛 𝑖=1 𝑓𝑖 ∑𝑛 𝑖=1 𝑖=1 𝑑𝑖 ∑ 𝑓𝑖 𝑓 Trong đó: 𝑑𝑖 = ∑ 𝑖 là tỉ trọng của từng bộ phận trong tổng thể 𝑓𝑖 + 𝑥̅ = ∑𝑛𝑖=1 𝑥𝑖 × 𝑑𝑖 : nếu di biểu hiện số lần ∑𝑛 𝑖=1 𝑥𝑖 ×𝑑𝑖 + 𝑥̅ = : nếu di biểu hiện bằng số % 100 Ví dụ 2.9: Có số liệu về mức lương và tỷ trọng số công nhân nhận mức lương đó trong tổng số công nhân như sau: Tiền lương (1000 đồng) (xi ) Số công nhân (di) (100% 500 10 650 16 800 40 950 20 1000 14 Cộng 100 Áp dụng công thức: ∑𝑛 𝑖=1 𝑥𝑖 ×𝑑𝑖 500×10+650×16+800×40+950×20+1000×14 𝑥̅ = = = 804 (1.000 đồng) 100 100 b) Trường hợp dữ liệu tổng thể Các công thức tính số trung bình tổng thể tương tự số trung bình mẫu.Tuy nhiên để phân biệt người ta thường dùng ký hiệu khác nhau như sau: ∑𝑛 𝑖=1 𝑥𝑖 + Với dữ liệu không có tần số: 𝜇̅ = 𝑁 15
  17. Trong đó: - 𝜇̅ : Số trung bình tổng thể - xi : các lượng biến (i = 1, 2,...., n) - N: số đơn vị tổng thể của tổng thể ∑𝑛 𝑖=1 𝑥𝑖 ×𝑓𝑖 + Với dữ liệu có tần số : 𝜇̅ = ∑𝑛 𝑖=1 𝑓𝑖 Trong đó: - xi là các lượng biến (i = 1, 2,...., n) - fi là các tần số (quyền số) của lượng biến (i = 1, 2, 3,..., n) 2.3.1.2 Mode (Mo) a) Khái niệm: Mode là biểu hiện của một tiêu thức xuất hiện nhiều lần nhất trong tổng thể hay trong một dãy phân phối b) Cách tính mode * Đối với dãy số lượng biến không có khoảng cách tổ: Mode là lượng biến có tần số lớn nhất. * Đối với dãy số lượng biến có khoảng cách tổ: - Nếu các tổ có khoảng cách tổ bằng nhau thì tổ nào có tần số lớn nhất là tổ chứa mode. Trị số mode được tính theo công thức 𝑓0 − 𝑓0−1 M0 = x0min + 𝑑0 (𝑓0 − 𝑓0−1 ) + (𝑓0 − 𝑓0+1 ) Trong đó: - M0 là ký hiệu của mode - x0min: giới hạn dưới của tổ chứa M0 - d0: khoảng cách tổ chứa M0 - f0: tần số của tổ chứa M0 - f0-1: tần số của tổ đứng trước tổ chứa M0 - f0+1: tần số của tổ đứng sau tổ chứa M0 Ví dụ 2.10 : Có tài liệu về NSLĐ tháng của công nhân trong một doanh nghiệp như sau: 16
  18. NSLĐ (tấn/người) (xi) Số công nhân (người) (fi) 40 – 45 10 45 – 50 20 50 – 55 25 55 – 60 30 60 – 65 15 Cộng 100 Yêu cầu: Tính mode về năng suất lao động tháng của công nhân Trước hết, ta xác định được tổ có năng suất lao động từ 55 – 60 (tấn/người) là tổ có chứa mode. Áp dụng công thức tính M0 ta có: 30−25 𝑀0 = 55 + 5 × (30−25)+(30−15) = 56,25 (tấn/người) - Nếu các tổ có khoảng cách tổ không bằng nhau thì tổ nào có mật độ phân phối lớn nhất tổ đó sẽ chứa mode. 𝑓 Mật độ phân phối: ℎ = 𝑑 Công thức tính mode được tính như trên nhưng tần số sẽ được thay bằng mật độ ℎ0 −ℎ0−1 phân phối. M0 = x0min + 𝑑0 (ℎ 0 −ℎ0−1 )+(ℎ0 −ℎ0+1 ) Mode kém nhạy bén với sự biến thiên của tiêu thức, không nên vận dụng mode với những dãy số lượng biến có đặc điểm phân phối không bình thường. Trong một số trường hợp, một dãy số phân phối có thể có nhiều Mode, có thể lại không có Mode. Khi đó ta không nên tính Mode 17
  19. 2.3.1.3 Số trung vị (Me) a) Khái niệm: Số trung vị là lượng biến của đơn vị đứng ở vị trí chính giữa trong dãy số lượng biến. Số trung vị phân chia dãy số lượng biến làm hai phần, mỗi phần có số đơn vị tổng thể bằng nhau. b) Cách tính số trung vị * Dãy số lượng biến không phân tổ: Trước hết cần sắp xếp lượng biến theo thứ tự từ nhỏ đến lớn. - Nếu số lượng biến lẻ thì số trung vị là lượng biến đứng ở vị trí giữa dãy số - Nếu số đơn vị tổng thể chẳn thì số trung vị sẽ là trung bình cộng giữa hai lượng biến của hai đơn vị đứng giữa. * Dãy số lượng biến phân tổ - Không có khoảng cách tổ: Ta xác định tổ chứa trung vị. Đó là tổ đầu tiên có ∑ 𝑓𝑖 tần số tích luỹ (tần số cộng dồn) bằng hoặc vượt một nửa tổng các tần số (𝑠𝑒 ≥ ) 2 Ví dụ 2.11: Xét ví dụ về NSLĐ của công nhân doanh nghiệp A: NSLĐ (Sản phẩm) xi Số công nhân (Người) fi Tần số tích luỹ (Si) 3.000 15 15 3.500 30 45 4.000 45 90 4.500 55 145 5.000 40 185 5.500 15 200 Tổng 200 Trung vị của dãy số lượng biến trên là 4.500 sản phẩm. Điều này có nghĩa là 50% số công nhân có mức NSLĐ từ 4.500 sản phẩm trở xuống và 50% số công nhân có mức NSLĐ từ 4.500 sản phẩm trở lên NSLĐ 18
  20. - Có khoảng cách tổ, cần phải xác định tổ chứa trung vị, đó là tổ đầu tiên có tần ∑ 𝑓𝑖 số tích luỹ (tần số cộng dồn) bằng hoặc vượt một nửa tổng các tần số (𝑠𝑒 ≥ ), sau 2 đó tính trị số của trung vị theo công thức sau: ∑ 𝑓𝑖 − 𝑆𝑒−1 𝑀𝑒 = 𝑥𝑒𝑚𝑖𝑛 + 𝑑𝑒 × 2 𝑓𝑒 Trong đó: - Me: số trung vị - xemin: giới hạn dưới của tổ chứa Me - de: khoảng cách tổ có chứa Me - fe: tần số của tổ có chứa Me - ∑ 𝑓𝑖 : tổng các tần số - Se-1: tổng các tần số của các tổ đứng trên tổ chứa Me Ví dụ 2.12: Có tài liệu về năng suất lao động năm N của công nhân trong một doanh nghiệp như sau: NSLĐ (tấn/người) (x) Số công nhân (người) (f) Tần số tích luỹ 40 – 45 10 10 45 – 50 20 30 50 – 55 25 55 55 – 60 30 85 60 – 65 15 100 Cộng 100 Yêu cầu: Tìm số trung vị về năng suất lao động của công nhân của doanh nghiệp trên. Trước hết, ta xác định được tổ có mức năng suất lao động từ 50 – 55 (tấn/người) là tổ có số trung vị. Áp dụng công thức tính Me ở trên ta có: 19
nguon tai.lieu . vn