Xem mẫu

Tạp chí Khoa học - Công nghệ Thủy sản

Số 2/2015

VAÁN ÑEÀ TRAO ÑOÅI

GIẢI PHÁP LỰA CHỌN MÔ HÌNH HỒI QUY ĐƠN BIẾN
SOLUTION FOR SELECTING UNIVARIATE REGRESSION MODEL
Phạm Văn Thông1
Ngày nhận bài: 27/8/2014; Ngày phản biện thông qua: 27/11/2014; Ngày duyệt đăng: 10/6/2015

TÓM TẮT
Trong nhiều nghiên cứu, các nhà khoa học đã thực hiện phân tích hồi quy đơn biến để xem xét sự phụ thuộc của một
biến (biến phụ thuộc) vào một biến khác (biến giải thích) để ước lượng hay dự đoán giá trị trung bình của biến phụ thuộc
trên cơ sở giá trị biết trước của các biến giải thích. Đây là việc làm thường xuyên của các nhà khoa học, tuy nhiên họ chưa
đưa ra những căn cứ khoa học lựa cho việc lựa chọn mô hình của mình. Tác giả đã tìm hiểu và giới thiệu 11 dạng mô hình
hồi quy đơn biến, đồng thời cung cấp những cơ sở khoa học giúp các nhà khoa học, học viên lựa chọn mô hình hồi quy đơn
biến phù hợp nhất cho nghiên cứu của mình.
Từ khóa: Hồi quy đơn biến

ABSTRACT
In many studies, scientists have conducted univariate regression analyses to examine the dependence of a variable (a
dependent variable) on another variable (an explanatory variable). Then they can estimate or predict the average value of
dependent variables basing on known-value of the explanatory variables. Scientists have carried out in this way frequently;
however, they have not shown scientific foundations of their univariate regression models. The author have studied and
introduced 11 types of univariate regression models, and provided scientific foundations in order to help scientists and
students choose the best univariate regression models in their researches .
Keyword: Univariate Regression
I. MỞ ĐẦU
Hồi quy đơn biến là mô hình thống kê được sử dụng
để dự đoán giá trị của biến phụ thuộc (dependence
variable) hay còn gọi là biến kết quả dựa vào những
giá trị của một biến độc lập (independence variable)
hay còn gọi là biến nguyên nhân.
Hiện nay, các nhà nghiên cứu, các học viên cao
học… thường hồi quy theo mô hình đường thẳng
(linear) mà chưa đưa ra được cơ sở lý luận khoa
học để giải thích vì sao chọn mô hình đường thẳng
hay bất kỳ dạng mô hình nào khác. Một số khác đưa
ra dẫn chứng chưa thuyết phục như dạng mô hình
này đơn giản, dễ tính toán.
Bài báo này cung cấp cho các nhà nghiên cứu,
các học viên cao học và độc giả nói chung cơ sở lý
luận khoa học đúng đắn giải thích cho việc lựa mô
hình hồi quy của mình.

1

II. NỘI DUNG
1. Phân tích các dạng mô hình
Với sự phát triển mạnh mẽ của công nghệ
thông tin, việc hồi quy không cần nhiều thời gian
tính toán như trước mà nó được trợ giúp bởi rất
nhiều phần mềm từ đơn giản như Microsoft Excel
đến phần mềm PASW Statistics 18 hay phần mềm
R, phần mềm Eview, phần mềm Stata… Tuy nhiên
trong bài báo này tôi muốn đề cập một số khía cạnh
của hai phần mềm đơn giản và thông dụng hiện nay
là Microsoft Excel 2010 và PASW Statistics 18.
- Microsoft Excel 2010 là công cụ phổ thông,
đơn giản trong tính toán, có hỗ trợ hồi quy đơn biến,
tuy nhiên số lượng mô hình mà Excel 2010 đưa ra ít
(chỉ 6 dạng mô hình). Khi hồi quy từ Excel 2010, kết
quả chỏ có phương trình hồi quy với hệ số tương
quan giữa biến độc lập và biến phụ thuộc mà chưa
cung cấp được các chỉ số để đánh giá mô hình

ThS. Phạm Văn Thông: Viện Khoa học và Công nghệ khai thác thủy sản - Trường Đại học Nha Trang

194 • TRƯỜNG ĐẠI HỌC NHA TRANG

Tạp chí Khoa học - Công nghệ Thủy sản

Số 2/2015
9. Logistic: Y = 1 / (1/u + (b0 * (b1X)) hoặc ln(1/y-1/u)=
ln (b0) + (ln(b1)*X). u là giá trị giới hạn trên, nó mang
giá trị dương và lớn hơn giá trị lớn nhất của biến
phụ thuộc. Ví dụ giá trị lớn nhất của biến phụ thuộc
là 100 thì u chọn là 101 (u=101).
10. Growth: Y = e(b0 + (b1 * X)) hoặc ln(Y) = b0 + (b1 * X)
11. Exponential: Y = b0 * (e(b1 * X)) hoặc ln(Y) = ln(b0) + (b1 * X)
Chú giải: b0 là các hằng số; b1 là hệ số hồi quy
được; X là biến độc lập; Y là biến phụ thuộc.
Tiêu chí đánh giá [1,2]:
- Tham số R bình phương hiệu chỉnh (adjusted
R square) cho biết mức độ % sự biến thiên của biến
phụ thuộc được giải thích bởi biến độc lập. R bình
phương hiệu chỉnh càng cao càng tốt vì biến độc lập
giải thích được nhiều cho biến phụ thuộc.
- Giá trị Sig (P-value) của bảng anova dùng để
đánh giá sự phù hợp (tồn tại) của mô hình. Giá trị
Sig nhỏ (thường
nguon tai.lieu . vn