Xem mẫu
Sö dông ch¬ng tr×nh Stata ®Ó khai th¸c sè liÖu
§iÒu tra Møc sèng hé gia ®×nh (VLSS) *
néi dung
CH¬NG I: GIÍI THIÖU CHUNG VÒ CH¬NG TR×NH STATA...............................1
1. TÆ CHØC LU TR÷ D÷ LIÖU TRONG STATA (DATASET IN STATA)...................................................2 2. KHËI ®ÉNG VΜ THO¸T KHÁI STATA (OPEN AND EXIT)..................................................................3 3. GIAO DIÖN STATA 7 (STATA INTERFACE)..................................................................................3 4. BIªN B¶N LΜM VIÖC (LOG FILE)................................................................................................6 5. NHËP VΜ LU D÷ LIÖU (USE, INPUT AND AND SAVE) ...................................................................7
CH¬NG II: KHAI TH¸C D÷ LIÖU.............................................................................10
1. CÊU TRÓC LÖNH TRONG STATA (STATA COMMAND SYNTAX).....................................................10 2.TO¸N TÖ VΜ HΜM SÈ (OPERATORS AND FUNCTIONS).................................................................13 3. M« T¶ D÷ LIÖU (DATA REPORTING).......................................................................................14 4. BIªN TËP VΜ SÖA CH÷A D÷ LIÖU (DATA MANIPULATION)...........................................................26 5. QUYÒN SÈ TRONG VHLSS (WEIGHT)...................................................................................40
CH¬NG III: KIÓM ®ÞNH GI¶ THIÕT V PH©N TÝCH HÅI QUY..................44
1. ¦ÍC LÎNG VΜ KIÓM ®ÞNH GI¶ THIÕT (ESTIMATION AND HYPOTHESIS TESTING)..............................44 2. PH©N TÝCH T¬NG QUAN VΜ HÅI QUY (CORRELATION AND REGRESSION)....................................51
CH¬NG IV: VÏ ®Å THÞ...............................................................................................57
1. VÏ ®Å THÞ (GRAPH).............................................................................................................57 2. MÉT SÈ LO¹I ®Å THÞ THÊNG DÏNG.........................................................................................66 3. LU TR÷ VΜ HIÓN THÞ ®Å THÞ (SAVING AND GRAPH USING)......................................................73
CH¬NG V: LËP TR×NH TRONG STATA................................................................75
1. GIÍI THIÖU CHUNG VÒ CH¬NG TR×NH DO-FILE.........................................................................75 2. LOCAL VΜ GLOBAL MACROS...................................................................................................79 3. TÝCH V« HÍNG VΜ MA TRËN (SCALAR AND MATRIX)..................................................................82 4. LÖNH ®IÒU KIÖN VΜ VSSNG LÆP........................................................................................85 5. GIÍI THIÖU VÒ FILE ADO.......................................................................................................87
TI LIÖU THAM KH¶O............................................................................................88
PHÔ LÔC.......................................................................................................................88
Ch¬ng I: Giíi thiÖu chung vÒ ch¬ng tr×nh Stata
1
1. Tæ chøc lu tr÷ d÷ liÖu trong Stata (Dataset in Stata)
Stata lµ phÇn mÒm thèng kª sö dông ®Ó qu¶n lý, ph©n tÝch sè liÖu vµ vÏ ®å thÞ. Stata cho phÐp lu tr÷ th«ng tin vÒ c¸c ®Æc ®iÓm cña c¸c ®èi tîng nghiªn cøu. Sè liÖu lu tr÷ trong Stata cã thÓ ®îc hiÓn thÞ díi d¹ng b¶ng nh vÝ dô sau:
hhcode headname 101 Nguyen Van A 102 Le Thi B
103 Tran Van C
hhsize incomepc 6 2100 5 3210 10 1200
Quan s¸t (b¶n ghi)
Mçi mét hµng ngang cña b¶ng sè liÖu ®îc gäi lµ mét quan s¸t (observation), hay mét b¶n ghi (record) lu tr÷ sè liÖu vÒ mét ®èi tîng nghiªn cøu. ë vÝ dô trªn cã 3 quan s¸t lu tr÷ sè liÖu vÒ M· hé (hhcode); Tªn chñ hé (headname); Quy m« hé (hhsize); Thu nhËp b×nh qu©n (incomepc) cña 3 hé gia ®×nh.
BiÕn (trêng; thuéc tÝnh)
Th«ng tin vÒ ®èi tîng nghiªn cøu ®îc thu thËp vµ lu tr÷ theo c¸c ®Æc ®iÓm cña chóng. C¸c ®Æc ®iÓm nµy ®îc gäi lµ biÕn (variable), hay trêng (field). BiÕn ®îc xem lµ c¸c cét cña b¶ng sè liÖu. ë vÝ dô trªn cã 4 biÕn, víi tªn lµ hhcoed, hedname, hhsize, vµ incomepc. Tªn biÕn dµi tõ 1 ®Õn 32 ký tù, ®îc b¾t ®Çu ch÷ hoÆc dÊu g¹ch díi (_). Tªn biÕn chØ bao gåm ch÷, sç vµ dÊu g¹ch díi. C¸c ký tù ®Æc biÖt kh¸c kh«ng thÓ dïng ®Ó ®Æt tªn cho biÕn.
BiÕn x¸c ®Þnh (identifying variables)
Th«ng thêng trong c¸c biÕn sÏ cã c¸c biÕn dïng ®Ó nhËn d¹ng quan s¸t, ®îc gäi lµ biÕn x¸c ®Þnh. Nhê cã c¸c biÕn x¸c ®Þnh nµy mµ c¸c quan s¸t cã thÓ ph©n biÖt ®îc víi nhau. Mçi mét quan s¸t cã mét gi¸ trÞ cña c¸c biÕn nµy. ë vÝ dô trªn, biÕn x¸c ®Þnh lµ hhcode, ®èi víi mçi mét quan s¸t biÕn hhcode nhËn mét gi¸ trÞ.
C¸c ®Æc ®iÓm cña biÕn
C¸c biÕn cã thÓ ®îc g¸n nh·n (chó thÝch). VÝ dô biÕn hhcode cã thÓ ®îc g¸n nh·n lµ “M· hé”.
BiÕn cã thÓ ®îc ®Þnh d¹ng (format) lµ biÕn sè vµ biÕn ký tù víi c¸c lo¹i lu tr÷ kh¸c nhau. BiÕn sè cã thÓ lu tr÷ díi lo¹i byte; int; long; float; double. Cßn biÕn ký tù th× cã thÓ lu tr÷ díi d¹ng str1 ®Õn str80 cho c¸c ®é dµi kh¸c nhau.
KiÓu lu tr÷ d¹ng sè byte int long float
double
Dung lîng (Byte) 1 2 4 4
8
Gi¸ trÞ nhá nhÊt
-127
-32,767
-2,147,483,647 -10^36 -10^308
Gi¸ trÞ lín nhÊt
126 32,766
2,147,483,646 10^36 10^308
KiÓu
Sè nguyªn Sè nguyªn Sè nguyªn Sè thùc Sè thùc
C¸c biÕn sè cã thÓ bao gåm c¸c biÕn rêi r¹c vµ liªn tôc. C¸c biÕn nh lµ quy m« hé gia ®×nh, giíi tÝnh chñ hé, vïng ®Þa lý, tr×nh ®é gi¸o dôc lµ c¸c biÕn rêi r¹c (discrete) (hay cßn gäi lµ biÕn ph©n lo¹i (categorical)). C¸c biÕn nµy cã thÓ ®îc lu tr÷ díi d¹ng byte,
2
int, vµ long. C¸c biÕn liªn tôc (continuous) nh thu nhËp, chi tiªu cña hé th× lu tr÷ díi d¹ng float hoÆc double.
BiÕn ký tù (string) dïng ®Ó lu tr÷ c¸c lo¹i ký tù. VÝ dô biÕn headname lµ biÕn kiÓu ký tù dïng ®Ó lu tr÷ tªn cña chñ hé.
KiÓu lu tr÷ Byte d¹ng ch÷
str1 1 str2 2
...
str80 80
§é dµi lín nhÊt
1 2
80
2. Khëi ®éng vµ tho¸t khái Stata (Open and exit)
Stata ®îc khëi ®éng t¬ng tù nh c¸c ch¬ng tr×nh tin häc øng dông kh¸c, b»ng c¸ch kÝch vµo biÓu tîng cña tÖp wstata.exe trong Windows explorer, hoÆc chän b»ng c¸ch chän Start -> Program -> Stata. Ch¬ng tr×nh ®îc tho¸t ra b»ng lÖnh exit tõ cöa sæ lÖnh Stata Command, hoÆc tuú chän exit trong thùc ®¬n (menu) File.
3. Giao diÖn Stata 7 (Stata interface)1
Sau khi Stata ®îc khëi ®éng, giao diÖn cña Stata sÏ ®îc hiÖn lªn, bao gåm thanh thùc ®¬n (menu bar) ë trªn cïng, díi ®ã lµ thanh c«ng cô (tool bar) vµ c¸c cöa sæ (windows).
1 Phiªn b¶n Stata 8 cã giao diÖn t¬ng tù nh phiªn b¶n Stata 7. Kh¸c biÖt lín nhÊt lµ Stata 8 cã thªm tuú chän Statistics trong thanh thùc ®¬n. Tuú chän nµy cho phÐp thùc hiÖn c¸c mét sè lÖnh thèng kª b»ng c¸c tuú chän qua giao diÖn cöa sæ mµ kh«ng ph¶i gâ c¸c lÖnh trong cöa sæ Command.
3
C¸c cöa sæ cña Stata
C¸c cöa sæ cña Stata ®îc më ra b»ng viÖc lùa chän c¸c tuú chän ë thanh thùc ®¬n Windows (menu bar). C¸c cöa sæ nµy bao gåm:
Results Graph Viewer
Command Review Variables Data editor
Do-file editor
HiÓn thÞ c¸c lÖnh vµ kÕt qu¶ HiÓn thÞ ®å thÞ
HiÓn thÞ cöa sæ trî gióp (help) vµ hiÓn thÞ néi dung c¸c file v¨n b¶n (text)
Dïng ®Ó gâ c¸c c©u lÖnh
HiÓn thÞ c¸c lÖnh ®· thùc hiÖn
HiÓn thÞ danh s¸ch c¸c biÕn cña tÖp sè liÖu HiÓn thÞ vµ söa ch÷a sè liÖu díi d¹ng b¶ng
HiÓn thÞ cöa sæ ®Ó so¹n th¶o ch¬ng tr×nh
Thanh thùc ®¬n (Menu bar)
B»ng c¸ch kÝch vµo thanh thùc ®¬n vµ c¸c tuú chän trong ®ã, Stata sÏ thùc hiÖn c¸c lÖnh kh¸c nhau. Thanh thùc ®¬n bao gåm c¸c nhãm lÖnh sau ®©y:
4
File
Open View Save Save as File name Log
Save graph Print graph Print results
Exit
Më file sè liÖu
Xem c¸c file cña Stata trong cöa sæ Viewer Lu file sè liÖu
Lu file sè liÖu díi tªn míi
Chän tªn file ®Ó ®a vµo cöa sæ lÖnh §ãng, më, xem l¹i log file
Lu gi÷ file ®å thÞ In ®å thÞ
In kÕt qu¶
Tho¸t khái Stata
Edit
Copy text Copy tables Paste
Table copy options Graph copy options
Prefs
Windows
Results Graph Log Viewer Command Review Variables
Help/Search Data editor Do-file editor
Help
Sao chÐp v¨n b¶n (text) Sao chÐp b¶ng biÓu D¸n
Lùa chän sao chÐp b¶ng sè liÖu
Lùa chän sao chÐp ®å thÞ (kh«ng cã trong Stata 7)
C¸c tuú chän vÒ mµu s¾c, ph«ng ch÷, vµ kÝch cì
Më cöa sæ kÕt qu¶ Më cöa sæ ®å thÞ Më cöa sæ log file
Më cöa sæ trî gióp (help) vµ xem néi dung file Më cöa sæ c©u lÖnh
Më cöa sæ c¸c lÖnh ®· thùc hiÖn
Më cöa sæ danh s¸ch c¸c biÕn cña tÖp sè liÖu Më cöa sæ trî gióp (help)
Më cöa ®Ó xem sè liÖu lu tr÷ díi d¹ng b¶ng Më cöa sæ viÕt ch¬ng tr×nh
C¸c trî gióp liªn quan ®Õn viÖc sö dông Stata
Thanh c«ng cô (tool bar)
5
...
- tailieumienphi.vn
nguon tai.lieu . vn