Xem mẫu
- Phaân tích döõ lieäu baèng SPSS
CHÖÔNG 5: CAÙC PHEÙP BIEÁN ÑOÅI VAØ THAO TAÙC TREÂN TAÄP
DÖÕ LIEÄU
1. Maõ hoùa laïi (Recode)
Recode laø coâng cuï duøng ñeå maõ hoùa laïi caùc giaù trò trong
moät bieán thaønh caùc giaù trò maõ hoùa môùi phuø hôïp vôùi
ñoøi hoûi cuûa quaù trình phaân tích döõ lieäu. Ví duï ñoái vôùi
caâu hoûi nguoàn goác nhaän bieát quaûng caùo cuûa saûn
phaåm X, ngöôøi traû lôøi coù theå traû lôøi cuï theå treân baùo
Saøi Goøn, Tuoåi Treû, Taïp chí Söùc Khoûe vaø Ñôøi soáng,
Treân ñaøi HTV7, Treân ñaøi VTV3, … Coù theå ban ñaàu caùc
nguoàn quaûng caùo ñöôïc maõ hoùa moät caùch rieâng bieät.
Tuy nhieân do nhu caàu xöõ lyù sau naøy, ngöôøi nghieân cöùu
muoán nhoùm caùc giaù trò ñöôïc maõ hoùa rieâng bieät naøy
thaønh ba loaïi nguoàn quaûng caùo chính laø Baùo, Taïp Chí
vaø Tivi. Coâng cuï Recode cho pheùp ta ñònh laïi caùc giaù trò
rieâng bieät veà nguoàn quaûng caùo ban ñaàu thaønh ba
nguoàn quaûng caùo chung laø Baùo, Tivi vaø taïp chí.
SPSS cung caáp cho ta hai loaïi Recode laø Recode treân cuøng
moät bieán (Recode into same variables) vaø recode vaøo bieán
khaùc (Recode into different variable).
1.1. Maõ hoùa laïi treân cuøng moät bieán (Recode into
same variables)
Recode treân cuøng moät bieán laø maõ hoùa laïi nhöõng giaù trò
trong moät bieán hieän höõu thaønh nhöõng giaù trò môùi vaø
caùc giaù trò môùi naøy seõ naèm ngay trong bieán hieän höõu
vaø thay theá caùc giaù trò cuû treân bieán ñoù. Khi söû duïng
coâng cuï naøy ta seõ maát ñi caùc giaù trò ñaõ khai baùo ban
ñaàu trong bieán maø ta thöïc hieän leänh Recode. Chuù yù caùc
giaù trò vöøa ñöôïc taïo ra chöa coù nhaõn, do ñoù sau khi thöïc
hieän leänh ta phaûi tieán haønh khai baùo nhaõn cho giaù trò
(ñaõ ñeà caäp trong phaàn khai baùo bieán). Phöông phaùp naøy
ñöôïc thöïc hieän qua caùc böôùc sau:
- Choïn transform/recode töø thanh menu chính. ÔÛ ñaây ta
löïa choïn Recode into same variable ñeå tieán haønh
Bieân soaïn: Ñaøo Hoaøi Nam 19
- Phaân tích döõ lieäu baèng SPSS
ñònh laïi giaù trò cuûa bieán treân cuøng moät bieán. Ta coù
hoäp thoaïi nhö hình 5-1:
Hình 51
- Chuyeån caùc bieán caàn maõ hoùa laïi sang hoäp thoaïi
variables, nhaán thanh Old and New Values ñeå chuyeån caùc
giaù trò cuû caàn thay ñoåi thaønh caùc giaù trò môùi. Ta coù
hoäp thoaïi Old and New values nhö hình 5-2:
Hình 52
- Old value duøng ñeå khai baùo giaù trò cuû caàn chuyeån
ñoåi. Giaù trò cuû naøy coù theå laø moät giaù trò ñôn
leû(Value), moät giaù trò khuyeát maëc ñònh hay giaù trò
khuyeát khai baùo (Systemmissing or Usermissing),
moät daõy caùc giaù trò (Range), hoaëc toaøn boä caùc giaù
trò naøo ñoù trong bieán (All other values). New value
duøng ñeå khai baùo giaù trò môùi seõ thay theá cho giaù trò
cuû töông öùng. Nhaán thanh Add ñeå löu söï chuyeån ñoåi
naøy. Caùc giaù trò chuyeån ñoåi coù theå söûa chöûa hoaëc
loaïi boû baèng caùch di chuyeån veät toái ñeán bieåu thöùc
theå hieän söï chuyeån ñoåi trong hoäp thoaïi Old>New vaø
nhaán thanh Change cho söï thay ñoåi hoaëc Remove ñeå loaïi
boû.
- Neáu vieäc ñònh laïi giaù trò cuûa caùc giaù trò cuûa bieán
coù moät soá ñieàu kieän keøm theo, ta coù theå duøng
Bieân soaïn: Ñaøo Hoaøi Nam 20
- Phaân tích döõ lieäu baèng SPSS
coâng cuï if ñeå ñònh ra caùc ñieàu kieän cho leänh recode.
Hoäp thoaïi If Cases nhö hình 5-3:
Hình 53
- Trong hoäp thoaïi If Cases, maëc ñònh laø khoâng coù ñieàu
kieän naøo caû, pheùp ñònh laïi giaù trò cuûa bieán ñöôïc
thöïc hieän cho taát caû caùc quan saùt, ôû ñaây hieån thò
laø Include all cases. Choïn leänh include if case
satisfies condition ñeå xaùc ñònh caùc ñieàu kieän trong
vieäc ñònh laïi giaù trò cuûa bieán. Chuyeån teân bieán caàn
ñònh laïi caùc giaù trò vaøo hoäp thoaïi beân phaûi. Luùc
naøy pheùp ñònh laïi giaù trò cuûa bieán noùi treân chæ
ñöôïc thöïc hieän ñoái vôùi caùc quan saùt naøo thoûa maõn
ñöôïc bieåu thöùc ñieàu kieän ñöôïc theå hieän trong hoäp
thoaïi ñieàu kieän naøy. Ví duï chæ thöïc hieän leänh recode
ñoái vôùi nhöõng tröôøng hôïp quan saùt ôû khu vöïc (bieán
kvuc) TP.HCM (coù giaù trò maõ hoùa laø 2) ta khai baùo
bieåu thöùc ñieàu kieän nhö sau kvuc = 2.
1.2. Maõ hoùa laïi vaøo moät bieán khaùc (Recode into
different variables)
Trong tröôøng hôïp ñònh laïi caùc giaù trò hieän taïi cuûa moät
bieán thaønh caùc giaù trò môùi trong moät bieán môùi ta seõ löïa
choïn transform/recode/into different variable vaø ta coù
hoäp thoaïi nhö hình 5-4:
Hình 54
Söû duïng phöông phaùp recode vaøo moät bieán môùi maùy tính
seõ töï ñoäng taïo ra moät bieán môùi treân cô sôû döõ lieäu ñeå
chöùa caùc giaù trò môùi vöøa ñöôïc taïo ra, ñoàng thôøi ta cuõng
vaãn löu giöõ ñöôïc bieán cuû vôùi caùc giaù trò maõ hoùa cuû
treân cô sôû döõ lieäu. Chuù yù caùc giaù trò vöøa ñöôïc taïo ra
chöa coù nhaõn, do ñoù sau khi thöïc hieän leänh ta phaûi tieán
Bieân soaïn: Ñaøo Hoaøi Nam 21
- Phaân tích döõ lieäu baèng SPSS
haønh khai baùo nhaõn cho giaù trò (ñaõ ñeà caäp trong phaàn
khai baùo bieán). Vieäc maõ hoùa laïi caùc giaù trò vaøo trong
moät bieán môùi ñöôïc thöïc hieän qua caùc böôùc sau:
- Chuyeån teân bieán caàn ñònh laïi giaù trò vaøo trong hoäp
thoaïi variables. Khai baùo teân bieán môùi vaø nhaõn bieán
môùi seõ chöùa caùc giaù trò vöøa ñöôïc maõ hoùa laïi trong
hoäp thoaïi Output variable. Nhaán thanh change ñeå xaùc
nhaän söï khaùi baùo naøy.
- Caùc coâng cuï If vaø Old and New Values cuõng coù yù
nghóa vaø thao taùc töông töï nhö tröôøng hôïp ñònh laïi giaù
trò cho cuøng moät bieán, ñaõ ñöôïc ñeà caäp ôû phaàn
treân.
Coâng cuï naøy coù öa ñieåm laø ta vöøa taïo ra ñöôïc moät bieán
môùi vôùi caùc giaù trò ñöôïc maõ hoùa theo caùch môùi nhöng
ñoàng thôøi vaãn giöõa ñöôïc bieán goác vôùi caùc giaù trò maõ
hoùa ban ñaàu. Trong khi vôùi phöông phaùp maõ hoùa laïi döõ
lieäu treân cuøng moät bieán, caùc giaù trò maõ hoùa môùi seõ
choàng leân caùc giaù trò cuû vaø ta ñaõ maát ñi caùc giaù trò
maõ hoùa ban ñaàu treân bieán ñoù.
2. Coâng cuï töï ñoäng maõ hoùa laïi (Automatic Recode)
Laø phöông phaùp maõ hoùa töï ñoäng caùc giaù trò daïng chuoåi
sang daïng soá vaøo trong moät bieán môùi. Bieán môùi naøy seõ
chöùa caùc con soá nguyeân lieân tuïc, moãi con soá nguyeân
trong bieán môùi seõ ñaïi dieän cho caùc giaù trò daïng chuoåi
gioáng nhau .
Ví duï khi ban ñaàu ta nhaäp döõ lieäu ñòa baøn nghieân cöùu
(quaän) nhö Bình Thaïnh, Quaän 1, Quaän 2, Taân Bình, … ôû daïng
chuoåi. Ta coù theå recode caùc giaù trò naøy thaønh caùc giaù trò
soá nhö 1, 2, 3 moät caùc töï ñoäng baèng coâng cuï Automatic
Recode. Vaø moãi con soá nguyeân naøy seõ ñaïi dieän cho töøng
ñòa baøn nghieân cöùu, nhö Quaän 1 ñöôïc chuyeån thaønh 1,
quaän 2 laø 2, …, Quaän Taân Bình laø 19. Ñoái vôùi caùch Recode
naøy caùc giaù trò nguyeân thuûy (quaän 1, quaän 2, …) seõ ñöôïc
söõ duïng nhö laø nhaõn cuûa giaù trò ñaõ ñöôïc recode trong
bieán môùi ñöôïc taïo ra töø leänh Automatic Recode. Caùc giaù trò
daïng chuoåi ñöôïc maõ hoùa theo thöù töï alphabe.
3. Löïa choïn caùc quan saùt (Select Cases)
Coâng cuï Select Cases ñöa ra moät vaøi phöông phaùp cho pheùp
ta löïa choïn ra nhöõng nhoùm nhoû caùc tröôøng hôïp quan saùt
döïa treân tieâu chuaån hay ñieàu kieän cuï theå. Ta cuõng coù
theå duøng phöông phaùp naøy ñeå löïa choïn moät maãu ngaãu
nhieân caùc tröôøng hôïp quan saùt töø toång theå döõ lieäu. Ñeå
Bieân soaïn: Ñaøo Hoaøi Nam 22
- Phaân tích döõ lieäu baèng SPSS
thöïc hieän leänh löïa choïn caùc quan saùt naøy ta choïn
Data/select cases töø menu ta seõ coù hoäp thoaïi nhö hình 5-5:
Trong hoäp thoaïi Select Cases caùc bieán ñöôïc lieät keâ ôû
beân traùi hoäp thoaïi, Beân phaûi hoäp thoaïi lieät keâ caùc daïng
löïa choïn. Löïa choïn All Cases laø traïng thaùi löïa choïn maëc
ñònh vaø ôû traïng thaùi naøy coù yù nghóa laø toaøn boä caùc
tröôøng hôïp quan saùt ñang ñöôïc löïa choïn.
Chuù yù sau khi thöïc hieän vieäc choïn löïa caùc tröôøng hôïp.
Caùc thao taùc thoáng keâ trong SPSS luùc naøy chæ thöïc hieän
treân caùc tröôøng hôïp ñöôïc löïa choïn. Do ñoù sau khi thöïc hieän
vieäc phaân tích treân caùc tröôøng hôïp ñöôïc löïa choïn, ta caàn
traû döõ lieäu laïi traïng thaùi ban ñaàu (kh6ng coù löïa choïn caùc
tröôøng hôïp) baèng caùch choïn All Cases trong phaàn Select
cuûa hoäp thoaïi Select Cases.
Trong phaàn Unselected Cases cho bieát traïng thaùi cuûa caùc
tröôøng hôïp khoâng ñöôïc löïa choïn. Filtered chæ ra caùc
tröôøng hôïp khoâng ñöôïc choïn vaãn ñöôïc giöõ laïi trong taäp tin
nhöng seõ bò loaïi tröø ra moïi phaân tích thoáng keâ. Select Cases
taïo ra moät bieán loïc (FILTER_$), vôùi caùc tröôøng hôïp ñöôïc
choïn coù giaù trò 1 vaø caùc tröôøng hôïp khoâng ñöôïc choïn coù
giaù trò 0. Deleted cho pheùp loaïi boû toaøn boä caùc tröôøng
hôïp khoâng ñöôïc choïn ra khoûi döõ lieäu.
Ñeå nhaän bieát ñöôïc caùc tröôøng hôïp naøo ñöôïc choïn hoaëc
khoâng ñöôïc choïn ta coù theå nhìn vaøo caùc giaù trò trong bieán
FILTER_$, caùc tröôøng hôïp ñöôïc choïn coù giaù trò 1 vaø
nhöõng tröôøng hôïp khoâng ñöôïc choïn coù giaù trò 0. Hoaëc ta
coù theå nhìn vaøo maøn hình Data ñeå phaân bieät caùc tröôøng
hôïp. Vôùi caùc tröôøng hôïp khoâng ñöôïc löïa choïn seõ coù moät
gaïch cheùo trong thanh soá thöù töï haøng beân traùi maøn hình
(Xem hình 20). Coù theå duøng coâng cuï Sort Cases ñeå xaép
Bieân soaïn: Ñaøo Hoaøi Nam 23
- Phaân tích döõ lieäu baèng SPSS
xeáp theo thöù töï caùc tröôøng hôïp ñöôïc choïn hay khoâng ñöôïc
choïn (Sort cases theo bieán FILTER_$).
Hình 55
Ñeå tieán haønh choïn löïa caùc tröôøng hôïp ta coù theå duøng
caùc caùch sau:
- Löïa choïn coâng cuï If conditions are satisfied (xem
hình 5-6) cho pheùp ta löïa choïn caùc tröôøng hôïp döïa treân
caùc bieåu thöùc ñieàu kieän. Moät bieåu thöùc ñieàu kieän
cho ta caùc giaù trò ñuùng hoaëc sai cuûa caùc tröôøng hôïp.
Neáu keát quaû cuûa bieàu thöùc ñieàu kieän laø ñuùng,
tröôøng hôïp ñoù ñöôïc löïa choïn. Neáu keát quaû naøy laø
sai hoaëc thieáu thì caùc tröôøng hôïp ñoù khoâng ñöôïc
choïn. Ví duï ñoái vôùi bieán giôùi tính (GTinh)coù hai giaù trò
laø Nam: 1 vaø Nöõ: 2. Ta tieán haønh choïn caùc tröôøng
hôïp laø Nam baèng caùch choïn bieán giôùi tính trong hoäp
beân traùi vaø chuyeån sang hoäp beân phaûi. Hieãn thò
bieåu thöùc ñieàu kieän nhö sau Gtinh=1. Luùc ñoù caùc
tröôøng hôïp naøo thoûa maõn ñieàu kieän Gtinh=1 seõ ñöôïc
löïa choïn. Caùc bieåu thöùc ñieàu kieän coù theå bao goàm
teân bieán, caùc haèng soá, caùc toaùn töû, caùc con soá,
caùc haøm soá, …
- Coâng cuï random sample of cases (hình 5-7) cho pheùp
chuùng ta löïa choïn moät maãu ngaãu nhieân döïa treân
moät tyû leä phaàn traêm hoaëc moät soá chính xaùc caùc
tröôøng hôïp seõ löïa choïn.
- Coâng cuï Base range (hình 5-8) cho pheùp löïa choïn caùc
tröoøng hôïp theo soá thöù töï haøng hieãn thò beân traùi
maøn hình döõ lieäu cuûa SPSS
Bieân soaïn: Ñaøo Hoaøi Nam 24
- Phaân tích döõ lieäu baèng SPSS
Hình 56
Hình 57
Hình 58
4. Taùch taäp döõ lieäu (Split File)
Coâng cuï Split File cho pheùp taùch döõ lieäu trong taäp döõ
lieäu ñang quan saùt thaønh nhöõng nhoùm nhoû rieâng bieät vaø
sau khi thöïc hieän leänh Split file naøy caùc phaân tích xöõ lyù
thoáng keâ seõ cho ta caùc keát quaû thoáng keâ ñaõ ñöôïc thöïc
hieän rieâng bieät theo töøng nhoùm nhoû döõ lieäu naøy.
Ñeå thöïc hieän leänh naøy ta choïn Data/Split File töø menu ta
coù hoäp thoaïi nhö hình 5-9:
Bieân soaïn: Ñaøo Hoaøi Nam 25
- Phaân tích döõ lieäu baèng SPSS
Hình 59
Vieäc phaân taùch naøy döïa treân vieäc phaân döõ lieäu thaønh
nhöõng nhoùm töông ñöông vôùi caùc giaù trò trong bieán ñöôïc
löïa choïn ñeå tieán haønh phaân nhoùm. Ñöôïc söû duïng cho
vieäc phaân tích döïa treân nhöõng giaù trò cuûa moät hay nhieàu
bieán ñaõ ñöôïc phaân nhoùm. Neáu ta löïa choïn vieäc phaân
taùch döïa treân nhieàu bieán, döõ lieäu seõ ñöôïc nhoùm theo
thöù töï bieán ñöôïc khai baùo trong hoäp thoaïi Groups Based On
list.
- Choïn Compare groups: Caùc döõ lieäu phaân tích seõ ñöôïc
taùch theo caùc giaù trò cuûa bieán ñöôïc löïa choïn ñeå
taùch döõ lieäu (hieãn thò trong hoäp Groups Based On
list), vaø vieäc taùch naøy mang tính chaát so saùnh do ñoù
khi tieán haønh phaân tích döõ lieäu caùc phaân tích döïa
treân söï phaân taùch naøy nhöõng vaãn ñöôïc theå hieän
treân cuøng moät baûng.
- Choïn Organize output by groups: Caùc döõ lieäu phaân
tích seõ ñöôïc taùch theo caùc giaù trò cuûa bieán ñöôïc löïa
choïn ñeå taùch döõ lieäu (hieãn thò trong hoäp Groups
Based On list), vaø vieäc taùch naøy mang tính chaát toå
chöùc laïi döõ lieäu thaønh nhöõng nhoùm nhoû do ñoù khi
tieán haønh phaân tích döõ lieäu caùc phaân tích döïa treân
söï phaân taùch vaø ñöôïc theå hieän moät caùc rieâng bieät
giöõa caùc nhoùm phaân taùch
Chuù yù sau ki tieán haønh phaân tích treân söï phaân taùch, ñeå
trôû laïi traïng thaùi bình thöôøng cuûa döõ lieäu ñoøi hoûi phaûi
boû ñi leänh taùch döõ lieäu vöøa ñöa ra baèng caùch choïn phaàn
Analyze all cases, do not create groups trong hoäp thoaïi
Slipt Files
5. Coâng cuï tính toaùn giöõa caùc bieán (Compute)
Coâng cuï compute ñöôïc duøng ñeå tính toaùn giöõa caùc giaù trò
trong caùc bieán vaø keát quaû seõ ñöôïc löu giöõ trong moät
bieán môùi hoaëc laø moät bieán khaùc saún coù hoaëc bieán
chöùa ñöïng giaù trò ñang tính toaùn.
Bieân soaïn: Ñaøo Hoaøi Nam 26
- Phaân tích döõ lieäu baèng SPSS
Ñeå thöïc hieän coâng cuï naøy ta truy xuaát coâng cuï compute
variable töø transform treân thanh menu ta coù hoäp thoaïi nhö
hình 5-10:
Hình 510
- Target variable chöùa ñöïng teân bieán seõ nhaän giaù trò
ñöôïc tính. Ta coù theå khaùi baùo kieåu vaø gaùn nhaõn cho
caùc giaù trò cuûa bieán baèng caùch nhaán vaøo thanh
Type&lable. OÂ Numeric Expression chöùa ñöïng caùc
bieåu thöùc soá ñöôïc duøng ñeå tính giaù trò cho bieán ñích
(bieán chöùa ñöïng giaù trò môùi), bieåu thöùc naøy coù theå
duøng teân caùc bieán saün coù, caùc haèng, caùc toaùn töû
vaø caùc haøm soá. Chuùng ta co theå soaïn caùc bieåu
thöùc tính toaùn vaøo thaüng oâ Numeric Expression, vaø
coù theå söõ duïng caùc coâng cuï ñöôïc hieån thò trong hoäp
thoaïi nhö caùc phieám (+), (), Function,…
- Coâng cuï if duøng ñeå ñònh ra nhöõng ñieàu kieän caàn
thieát keøm theo trong tính toaùn neáu coù, ñöôïc söû duïng
gioáng nhöù gioáng nhö coâng cuï if trong hoäp thoaïi
recode, ñaõ ñöôïc ñeà caäp ôû phaàn treân.
6. Coâng cuï ñeám (Count)
Bieân soaïn: Ñaøo Hoaøi Nam 27
- Phaân tích döõ lieäu baèng SPSS
Coâng cuï naøy ñöôïc duøng ñeå taïo ra moät bieán môùi chöùa
keát quaû soá laàn xuaát hieän (soá ñeám) cuûa moät giaù trò hay
nhieàu giaù trò ñöôïc chæ ñònh ra trong danh saùch caùc bieán
ñöôïc choïn trong ô variables trong moãi tröôøng hôïp. Töø menus
ta choïn Transform/count ñeå coù ñöôïc hoäp thoaïi nhö hình 5-
11
Hình 511
Moät bieán môùi seõ ñöôïc taïo ra khi ta thöïc hieän thuû tuïc Count
goïi laø bieán ñích (Taget variable) seõ chöùa ñöïng giaù trò
coäng doàn moãi khi gaëp ñöôïc giaù trò caàn ñeám trong moät
hoaëc nhieàu bieán ñaõ ñöôïc khai baùo tröôùc trong hoäp thoaïi
Numeric variables.
Giaù trò caàn ñeám seõ ñöôïc ñònh roõ trong phaàn Define
values (hình 5-12). Giaù trò khai baùo ñeå ñeám coù theå laø
nhöõng giaù trò cuï theå naøu ñoù (Value), hoaëc nhöõng giaù trò
roãng (System missing) hoaëc laø moät daõy caùc giaù trò
(range). Sau khi khai baùo giaù trò caàn ñeám ta duøng thanh
Add ñeå xaùc nhaän giaù trò caàn ñeám vaøo trong hoäp thoaïi
Values to count. Söû duïng Change hoaëc Remove ñeå thay theá
Bieân soaïn: Ñaøo Hoaøi Nam 28
- Phaân tích döõ lieäu baèng SPSS
hoaëc loaïi boû giaù trò caàn ñeám (giaù trò ñaõ ñöôïc ñaùnh daáu
baèng veát ñen).
Hình 512
Coâng cuï If duøng ñeå xaùc ñònh caùc ñieàu kieän neáu coù khi
thöïc hieän leänh Count, (gioáng nhö coâng cuï if trong phaàn
recode ñaõ ñöoïc ñeà caäp ôû treân)
7. Hôïp nhaát caùc taäp döõ lieäu (Merge files)
SPSS cho pheùp ta hôïp caùc döõ lieäu quan saùt töø trong moät
taäp döõ lieäu beân ngoaøi vaøo taäp döõ lieäu ñang söû duïng.
Hoaëc hôïp caùc bieán môùi trong taäp döõ lieäu beân ngoaøi vaøo
taäp döõ lieäu ñang hoaït ñoäng. Caû hai ñeàu taïo ra moät taäp
döõ lieäu môùi coù theå chöùa taát caû caùc quan saùt ñöôïc hôïp
laïi hoaëc taát caû caùc bieán ñöoïc hôïp tuøy theo ta choïn Add
Cases hay Add Variables
7.1. Theâm vaøo caùc quan saùt (Add Cases)
Coâng cuï Add Cases cho pheùp ta hôïp döõ lieäu trong taäp döõ
lieäu ñang hoaït ñoäng vôùi döõ lieäu trong moät taäp döõ lieäu
beân ngoaøi, vôùi ñieàu kieän taäp döõ lieäu ñoù phaûi chöùa caùc
bieán gioáng nhö bieán trong taäp döõ lieäu ñang hoaït ñoäng. Sau
khi thao taùc, moät taäp döõ lieäu môùi (chöa ñöôïc khai baùo
teân, vaø ta phaûi tieán haønh löu vaø khai baùo teân môùi) seõ
ñöôïc taïo ra chöùa caùc döõ lieäu trong caû hai taäp döõ lieäu
vöøa ñöôïc hôïp laïi vôùi nhau. Trong tröôøng hôïp hai taäp döõ
lieäu hôïp vôùi nhau nhöng coù caùc bieán khaùc nhau (khaùc
nhau veà teân bieán hoaëc loaïi bieán) thì sau khi hôïp taäp döõ
lieäu môùi seõ töï ñoäng loaïi boû caùc bieán khaùc nhau naøy, ta
coù theå seõ bò maát döõ lieäu chöùa trong caùc bieán bò loaïi boû
naøy.
Coâng cuï naøy raát thích hôïp cho vieäc hôïp nhaát döõ lieäu
nghieân cöùu ôû caùc khu vöïc khaùc nhau, ví duï nhö moät cuoäc
khaûo saùt ñöôïc tieán haønh ôû ba khu vöïc Haø Noäi, Ñaø Naüng,
vaø TP.HCM, döõ lieäu thu thaäp veà seõ ñöôïc nhaäp, chænh söûa
cho ba khu vöïc rieâng bieät. Tuy nhieân sau ñoù ta coù theå tieán
haønh hôïp döõ lieäu ôû ba khu vöïc naøy vaøo moät taäp döõ lieäu
thoáng nhaát ñeå tieán haønh phaân tích vaø xöõ lyù. Chuù yù
phaûi thoáng nhaát veà caùc teân bieán, loaïi bieán vaø soá löôïng
bieán trong caû ba khu vöïc tröôùc khi nhaäp 3 file naøy laïi vôùi
nhau.
Bieân soaïn: Ñaøo Hoaøi Nam 29
- Phaân tích döõ lieäu baèng SPSS
Choïn Data/Merge Files/Adds Cases (Xem hình 5-13)
Hình 513
Hoäp thoaïi Read File cho pheùp ta löïa choïn taäp döõ lieäu seõ
ñöôïc hôïp vôùi taäp döõ lieäu ñang hoaït ñoäng (working file).
Nhaán Open ñeå xaùc nhaän vieäc löïa choïn naøy
Sau khi löïa choïn xong taäp döõ seõ ñöôïc keát hôïp, ta seõ coù
moät hoäp thoaïi môùi nhö hình 5-14:
Hình 514
Unpaired Variables: lieät keâ caùc bieán khoâng gioáng
nhau giöõa hai taäp döõ lieäu ñang ñöôïc tieán haønh hôïp
nhaát laïi, caùc bieán khoâng gioáng nhau naøy seõ bò loaïi
ra vaø khoâng coù trong taäp döõ lieäu môùi ñöôïc taïo ra töø
vieäc hôïp nhaát hai taäp döõ lieäu ban ñaàu. Caùc bieán
naøy ñöôïc kyù hieäu khaùc nhau vôùi kyù hieäu (*) ñaïi
dieän cho caùc bieán trong taäp döõ lieäu ñang hoaït ñoäng
vaø (+) ñaïi dieän cho caùc bieán trong taäp döõ lieäu ñöôïc
truy xuaát töø beân ngoaøi. Nhöõng bieán ñöôïc lieät keâ
Bieân soaïn: Ñaøo Hoaøi Nam 30
- Phaân tích döõ lieäu baèng SPSS
trong hoäp thoaïi Unpaired Variables laø nhöõng bieán coù
nhöõng ñaëc ñieåm nhö sau:
- Hai bieán coù teân bieán ñöôïc khai baùo khaùc nhau
- Nhöõng bieán coù daïng döõ lieäu khaùc nhau
- Caû hai bieán bieán cuøng laø daïng chuoåi nhöng lai
khoâng baèng nhau veà soá kyù töï trong chuoåi.
Cac bieán naøy nhö ñaõ noùi seõ bò loaïi boû ra khoûi taäp
döõ lieäu vöøa hôïp nhaát, ñieàu naøy ñoàng nghóa ta bò
maát döõ lieäu sau khi hôïp nhaát, do ñoù caàn phaûi khaéc
phuïc sai soùt naøy ñeå baûo ñaûm tính ñaày ñuû cuûa döõ
lieäu sau khi hôïp nhaát. Caùc bieán naøy seõ ñöôïc hôïp laïi
vôùi nhau baèng caùnh ñaùnh daáu hai bieán ñoù (trong
hoäp thoaïi Unpaired Variables) vaø nhaán thanh Pair,
luùc ñoù döõ lieäu trong hai bieán naøy seõ ñöôïc hôïp nhaát
vaø ñöôïc chöùa ñöïng trong bieán laáy teân bieán gioáng nhö
teân bieán trong taäp tin ñang hoaït ñoäng. Hoaëc ta coù
theå duøng coâng cuï Rename ñeå khai baùo laïi teân bieán
hoaëc kieåu bieán cho gioáng nhau.
Hoäp thoaïi Variables in New Working Data File lieät keâ caùc
bieán seõ coù trong taäp tin môùi ñöôïc taïo ra töø vieäc hôïp
nhaát hai taäp döõ lieäu ban ñaàu. Toaøn boä caùc bieán
trong hai taäp tin ban ñaàu thoûa maõn caùc ñieàu kieän
gioáng nhau veà teân vaø loaïi döõ lieäu (soá hoaëc chuoåi)
seõ ñöôïc lieät keâ vaøo hoäp thoaïi naøy
Chuùng ta cuõng coù theå loaïi boû nhöõng bieán maø
chuùng ta khoâng muoán coù trong taäp döõ lieäu hôïp
nhaát. Baèng caùch ñaùnh daáu caùc bieán ñoù (trong oâ
variables in new data working file) vaø chuyeån sang
oâ Unpaired Variables
1.2. Theâm vaøo caùc bieán (Add Variables)
Coâng cuï Add Variables cho pheùp hôïp nhaát döõ lieäu trong taäp
tin ñang hoaït ñoäng vôùi moät taäp tin beân ngoaøi vôùi ñieàu
kieän taäp tin beân ngoaøi naøy phaûi chöùa ñöïng cuøng caùc
quan saùt vôùi taäp tin ñang söû duïng, nhöng khaùc nhau veà
bieán (khai baùo teân bieán khaùc vôùi taäp tin ñang ñöôïc söû
duïng), quaù trình naøy seõ taïo ra moät taäp döõ lieäu môùi chöùa
cuøng caùc quan saùt nhöng taäp hôïp taát caû caùc bieán khaùc
nhau trong hai taäp döõ lieäu ban ñaàu.
Coâng cuï naøy thích hôïp vôùi caùc cuoäc nghieân cöùu ñöôïc chia
laøm nhieàu giai ñoaïn. Ví duï nhö nghieân cöùu veà möùc ñoä
aûnh höôûng cuûa moät chöông trình quaûng caùo, ngöôøi ta
thöôøng nghieân cöùu moät soá ñoái töôïng ngöôøi traû lôøi veà
Bieân soaïn: Ñaøo Hoaøi Nam 31
- Phaân tích döõ lieäu baèng SPSS
saûn phaåm xaép ñöôïc quaûng caùo tröôùc khi tung chöông trình
quaûng caùo ñoù ra thò tröôøng, goïi laø Pre-test. Sau ñoù seõ
tieán haønh moät cuoäc nghieân cöùu nöõa treân ñuùng caùc ñoái
töôïng ñoù sau khi chöông trình quaûng caùo ñaõ ñöôïc tung ra thò
tröôøng, ta goïi laø Post-test. Phaân tích thoáng keâ ñoøi hoûi moät
soá so saùnh (nhö Paired-sample t test) caùc yù kieán cuûa nhöõng
ngöôøi tieâu duøng naøy tröôùc vaø sau khi coù chöông trình
quaûng caùo. Ñeå thöïc hieän coâng vieäc naøy caàn chuù yù
nhöõng ñieåm sau:
- Caùc quan saùt (Cases) trong caû hai taäp tin caàn hôïp nhaát
bieán phaûi ñöôïc xaép xeáp theo cuøng moät thöù töï, thoâng
thöôøng thöù töï naøy ñöôïc quaûn lyù baèng moät taäp tin
chöùa caùc giaù trò laø soá baûng caâu hoûi. Chuù yù caùc
baûng caâu hoûi cuûa ñoái töôïng nghieân cöùu trong laàn
phoûng vaán tröôùc phaûi gioáng vôùi soá baûng caâu hoûi
duøng ñeå phoùng vaán chính ñoái töôïng ñoù trong laàn sau.
Khi loaïi boû baûng caâu hoûi naøo cuûa laàn phoûng vaán
tröôùc hoaëc sau ta phaûi loaïi boû luoân baûng caâu hoûi ñoù
tröôùc khi tieán haønh hôïp nhaát.
- Thoâng thöôøng ta duøng moät hay nhieàu bieán khoùa ñeå
baûo ñaûm caùc tröôøng hôïp khôùp vôùi nhau (thöôøng söû
duïng bieán ID chöùa soá baûng caâu hoûi). Ñieàu phaûi baûo
ñaûm tröôùc khi tieán haønh hôïp nhaát bieán giöõa hai taäp
döõ lieäu naøy laø ta phaûi xaép xeáp döõ lieäu trong hai bieán
khoùa cuûa hai taäp döõ lieäu theo thöù töï töø nhoû ñeán lôùn.
- Caùc bieán coù teân gioáng nhau trong taäp tin ñang hoaït
ñoäng vaøo taäp tin beân ngoaøi seõ bò loaïi tröø khoûi taäp tin
môùi ñöôïc taïo.
Töø taäp döõ lieäu ñang thao taùc ta môû coâng cuï Data/Merge
Files/Adds Variables töø menu, SPSS seõ truy suaát hoäp thoaïi
Add Variables: Read File ñeå ta löïa choïn taäp döõ lieäu seõ
ñöôïc hôïp vôùi taäp döõ lieäu ñang hoaït ñoäng. Nhaán Open ñeå
xaùc nhaän vieäc löïa choïn naøy (gioáng nhö tröôøng hôïp Adds
Cases - Xem hình 5-13). Sau khi löïa choïn ñöôïc taäp döõ lieäu seõ
Bieân soaïn: Ñaøo Hoaøi Nam 32
- Phaân tích döõ lieäu baèng SPSS
hôïp bieán vôùi taäp döõ lieäu ñang hoaït ñoäng. SPSS seõ truy
suaát cho ta hoäp thoaïi nhö hình 5-15:
Hình 515
- Excluded Variables lieät keâ caùc bieán seõ bò loaïi tröø ra
khoûi bieán môùi hôïp thaønh. Nhöõng bieán naøy laø nhöõng
bieán coù teân bieán gioáng nhau. Bieán trong taäp tin ñang
hoaït ñoäng ñöôïc kyù hieäu laø (*), vaø nhöõng bieán trong
taäp tin beân ngoaøi laø (+). Neáu muoán caùc bieán gioáng
teân nhau naøy coù trong taäp döõ lieäu môùi ta phaûi tieán
haønh rename noù laïi vaø chuyeån noù sang hoäp thoaïi chöùa
caùc bieán seõ coù trong taäp tin môùi (New Working Data
File)
- Key Variables. Bieán khoùa döïa vaøo ñoù caùc quan saùt
gioáng nhau ñöôïc xaùc ñònh. Chuù yù bieán khoùa naøy phaûi
coù cuøng teân ôû caùc hai taäp tin caàn hôïp nhaát. Caùc
tröôøng hôïp khoâng thoûa maõn vôùi bieán khoùa thì vaãn bao
haøm trong taäp döõ lieäu môùi nhöng seõ khoâng ñöôïc hôïp
vôùi caùc tröôøng hôïp trong taäp tin khaùc. Nhöõng tröôøng
hôïp naøy chæ chöùa ñöïng giaù trò rieâng bieät cuûa taäp döõ
lieäu maø noù bao haøm töø tröôùc (tröôùc khi tieán haønh hôïp
nhaát) vaø caùc tröôøng hôïp naøy seõ coù giaù trò khuyeát
trong caùc bieán chöùa ñöïng trong taäp tin thöù hai maø ta seõ
hôïp nhaát.
_____o0o______
Bieân soaïn: Ñaøo Hoaøi Nam 33
nguon tai.lieu . vn