- Trang Chủ
- Báo cáo khoa học
- Dự báo thời gian sống sót của bệnh nhân ung thư vú di căn bằng mạng nơron và cây hồi quy một tiếp cận mới
Xem mẫu
- dù B¸O thêi gian sèng sãt cña bÖnh nh©n ung
th− vó di c¨n b»ng m¹ng n¬ron vµ c©y håi quy -
mét tiÕp cËn míi
TrÞnh Quèc Anh2, Bernard Assenlain1, Thu Hoµng2
1
Institut Curie, Paris, France,
2
UniversitÐ RenÐ Descartes, Paris, France
Chóng t«i ®· ph©n tÝch sè liÖu thu ®−îc tõ 1477 bÖnh nh©n n÷ trªn 18 tuæi bÞ ung th−
vó biÓu m« cã di c¨n ®−îc ®iÒu trÞ b»ng nhiÒu liÖu ph¸p kh¸c nhau t¹i ViÖn Curie, Paris
(Ph¸p) tõ n¨m 1977 ®Õn 1998 ®Ó nghiªn cøu kh¶ n¨ng sèng sãt vµ sö dông c©y håi quy
vµ m« h×nh m¹ng n¬ ron trong ®ã cã 15 n¬ ron tiÕp nhËn th«ng tin tõ 14 yÕu tè ®−îc
chän vµ cã yÕu tè thêi gian ®Ó x¸c ®Þnh nguy c¬ tö vong thevoooo«o thêi gian cña bÖnh
nh©n. ViÖc kÕt hîp hai ph−¬ng ph¸p thèng kª ®Ó nghiªn cøu thêi gian sèng sãt cña bÖnh
nh©n cho kÕt qu¶ tèt h¬n m« h×nh Cox vµ cho thÊy mèi liªn quan tiÒm Èn gi÷a c¸c yÕu tè
tiªn l−îng bÖnh.
I. §Æt vÊn ®Ò cña bÖnh nh©n vµ do ®ã ®¸nh gi¸ sai hiÖu
qu¶ cña ®iÒu trÞ.
Nghiªn cøu vÒ sù sèng sãt (survival
analysis) lµ mét nghiªn cøu quan träng C¸c nghiªn cøu vÒ sù sèng sãt th−êng
trong ®iÒu trÞ bÖnh, nhÊt lµ ®èi víi nh÷ng sö dông m« h×nh håi quy cña Cox (1) ®Ó
bÖnh hiÓm nghÌo v× nã gióp ng−êi thÇy −íc l−îng nguy c¬ tö vong cña bÖnh nh©n
thuèc cã ®−îc nh÷ng c¶i tiÕn hîp lý trong (hazard) vµ tõ ®ã dù b¸o thêi gian sèng
qu¸ tr×nh ®iÒu trÞ bÖnh nh»m kÐo dµi thêi sãt. Tuy nhiªn, m« h×nh nµy khã thÓ hiÖn
gian sèng cña bÖnh nh©n. Ung th− vó tõ ®−îc sù t¸c ®éng qua l¹i tù nhiªn gi÷a
l©u nay ®· ®−îc xem lµ mét c¨n bÖnh c¸c yÕu tè nguy c¬ cña bÖnh (risk factors)
®iÓn h×nh cÇn nghiªn cøu sèng sãt vµ vµ do vËy kh«ng ®¸nh gi¸ ®−îc chÝnh x¸c
ngµy cµng ®−îc quan t©m nhiÒu h¬n, thÓ kh¶ n¨ng sèng sãt cña bÖnh nh©n.
hiÖn qua sè l−îng c¸c c«ng tr×nh nghiªn Víi môc ®Ých øng dông to¸n häc vµ tin
cøu kh«ng ngõng t¨ng lªn. Thèng kª trªn häc vµo nghiªn cøu sù sèng sãt cña bÖnh
toµn thÕ giíi cña National Library of nh©n ung th− vó biÓu m« di c¨n, chóng t«i
Medicine (Mü) theo chñ ®Ò "Surival tiÕn hµnh nghiªn cøu nµy n»m gi¶i quyÕt
analysis"vµ "breast cancer" cho thÊy tõ c¸c môc tiªu sau ®©y:
n¨m 1998 ®Õn n¨m 2001 sè bµi b¸o ®· - Ph©n tÝch mèi liªn quan ®¬n biÕn vµ
t¨ng lªn h¬n 1,5 lÇn, tõ 262 ®Õn 418 bµi. ®a biÕn gi÷a mét sè yÕu tè víi thêi gian
Khã kh¨n lín th−êng gÆp trong nghiªn sèng sãt cña bÖnh nh©n ung th− vó biÓu
cøu sèng sãt lµ viÖc mÊt th«ng tin vÒ m« di c¨n.
bÖnh nh©n trong qu¸ tr×nh theo dâi ®iÒu trÞ - M« t¶ mèi liªn quan tiÒm Èn gi÷a mét
bëi c¸c nguyªn nh©n kh¸ch quan kh«ng sè yÕu tè víi sù sèng sãt b»ng m¹ng n¬
mong muèn; vÝ dô bÖnh nh©n bÞ tai n¹n ron.
giao th«ng hay chuyÓn chç ë. Mét ®iÒu trÞ
- X©y dùng c©y håi quy dù b¸o thêi
cã tû lÖ mÊt th«ng tin cao sÏ g©y ra sai
gian sèng sãt cña bÖnh nh©n.
lÖch lín vÒ −íc ®o¸n thêi gian sèng sãt
82
- II. §èi t−îng vµ ph−¬ng ph¸p ung th− æn ®Þnh, cßn nÕu kÝch th−íc ®o
nghiªn cøu ®−îc t¨ng lªn trªn 25% hoÆc xuÊt hiÖn
tæn th−¬ng míi th× cho lµ cã ung th− tiÕn
1. Sè liÖu:
triÓn.
C¸c sè liÖu ®−îc thu thËp tõ 1477
- Thêi gian bÖnh tiÕn triÓn ®−îc tÝnh tõ
bÖnh nh©n n÷ trªn 18 tuæi bÞ ung th− vó
lóc bÖnh nh©n ®−îc chän ngÉu nhiªn tíi
biÓu m« cã di c¨n ®−îc ®iÒu trÞ t¹i ViÖn
lóc cã ung th− tiÕn triÓn hoÆc tíi ngµy
Curie, Paris (Ph¸p) tõ n¨m 1977 - 1998,
theo dâi cuèi cïng. Thêi gian sèng sãt lµ
lo¹i trõ c¸c bÖnh nh©n sau:
thêi gian tõ lóc ®−îc chän ngÉu nhiªn cho
- BÖnh nh©n cã sè l−îng b¹ch cÇu ®¹t ®Õn lóc chÕt hoÆc ®Õn ngµy cuèi cïng
d−íi 1,5 x 109/L hay cã sè l−îng tiÓu cÇu ®−îc theo dâi. NÕu chÕt tr−íc khi ®−îc
d−íi 100 x 109/L; trõ khi hiÖn t−îng øc ®¸nh gi¸ ®¸p øng th× ®−îc coi lµ ung th−
chÕ tuû x−¬ng lµ do chÝnh tuû x−¬ng. tiÕn triÓn.
- BÖnh nh©n cã nång ®é bilirubin cao 2. §iÒu trÞ ban ®Çu gåm cã 900 ng−êi
h¬n Ýt nhÊt 1,5 lÇn nång ®é b×nh th−êng, ®−îc phÉu thuËt (chiÕm 63% tæng sè
cã tiÒn sö bÞ suy tim ø huyÕt, chØ cã di c¨n bÖnh nh©n) trong ®ã 281 ng−êi ®−îc c¾t
ë n·o lµ b»ng chøng cã ung th− lan to¶. bá tuyÕn vó, 619 ng−êi ®−îc c¾t bá tuyÕn
ViÖn Curie ®· sö dông 8 thö nghiÖm vó vµ bãc phÇn ngùc (lumpectomy). cã
kh¸c nhau cña ho¸ trÞ liÖu c¬ b¶n cã 364 (25%) bÖnh nh©n kh«ng ®−îc mæ vµ
anthrracyclin ®Ó ®iÒu trÞ bÖnh nh©n bÞ ung ®−îc ®iÒu trÞ b¶o tån b»ng x¹ trÞ hay ®iÒu
th− vó biÓu m« [7]. C¸c bÖnh nh©n ®−îc trÞ ng¾n ngµy. Tæng céng cã 115 (78%)
®¸nh gi¸ tr−íc khi ®−îc ®iÒu trÞ dùa trªn bÖnh nh©n dïng chiÕu x¹ nh− lµ mét ®iÒu
c¸c kiÓm tra kü l−ìng vÒ l©m sµng nh− ®o trÞ chÝnh hay lµ mét bæ trî cña ®iÒu trÞ. Cã
c¸c tæn th−¬ng cã thÓ sê thÊy ®−îc, ®Õm 166 (12%) bÖnh nh©n kh«ng ®−îc ®iÒu trÞ
c¸c tÕ bµo m¸u, th¨m dß chøc n¨ng gan, t¹i chç v× cã di c¨n sím. Sè bÖnh nh©n
®Þnh l−îng nång ®é c¸c ®iÖn gi¶i vµ canxi, ®−îc ho¸ trÞ liÖu tr−íc lµ 446 (31%). BÖnh
chôp X quang phæi, x−¬ng. Tr−íc mçi ®ît nh©n ®−îc lùa chän theo trÞ liÖu tr−íc dùa
®iÒu trÞ, c¸c th«ng sè cña tõng bÖnh nh©n trªn ®¸nh gi¸ cña thÇy thuèc vÒ nguy c¬
l¹i ®−îc cËp nhËt nh»m ph¸t hiÖn c¸c t¸i ph¸t. Ho¸ trÞ liÖu tr−íc bao gåm kÕt
triÖu chøng míi hoÆc triÖu chøng bÖnh hîp 5 - FU, foxorubicin,
nh©n lªn ®ßi hái ph¶i ®iÒu chØnh liÒu. C¸c cyclophosphamide ë 165 (39,4%) bÖnh
t¹ng cã thÓ bÞ di c¨n ®−îc chôp c¾t líp vµ nh©n; CMF (cyclophosphamide,
chôp X quang vµo c¸c th¸ng thø 4, 8, 12, methotrexate, 5-FU) ë 92 ng−êi (21,9%);
18. cyclophosphamide, melphalan,
HiÖu qu¶ cña c¸c thö nghiÖm ®iÒu trÞ methotrexate ë 98 ng−êi (23,4%). Cã 64
®−îc ®¸nh gi¸ theo c¸c tiªu chuÈn cña tæ bÖnh nh©n ®−îc ®iÒu trÞ b»ng phèi hîp
chøc chèng ung th− quèc tÕ, nh−: thuèc kh¸c kh«ng cã anthracycline
- §iÒu trÞ ®−îc coi lµ cã ®¸p øng toµn (15,3%) vµ 27 bÖnh nh©n ®−îc dïng hãa
phÇn nÕu c¸c di c¨n ®· ®−îc ph¸t hiÖn trÞ liÖu kh«ng theo kiÓu ®Æc hiÖu nµo. Cã
kh«ng cßn n÷a vµ lµ cã ®¸p øng mét phÇn 78 bÖnh nh©n ch−a dïng ho¸ trÞ liÖu bæ
nÕu tÝch sè cña hai kÝch th−íc dµi nhÊt sung ®· ®−îc dïng tamoxifen.
vu«ng gãc nhau cña tæn th−¬ng ®o ®−îc 3. C¸c yÕu tè chÝnh ¶nh h−ëng ®Õn
gi¶m ®i Ýt nhÊt 50%. sù sèng sãt
- NÕu kÝch th−íc khèi di c¨n ®o ®−îc Trªn sè liÖu ung th− kÓ trªn, chóng t«i
(trõ ë x−¬ng) gi¶m d−íi 50% th× cho lµ chän ra 14 yÕu tè cã ¶nh h−ëng quan
83
- träng ®Õn kh¶ n¨ng sèng sãt cña bÖnh h−ëng cña c¸c trÞ sè kh¸c nhau nµy lªn
nh©n ung th− vó di c¨n. C¸c yÕu tè nµy kh¶ n¨ng sèng sãt cña bÖnh nh©n lµ cã ý
(xem b¶ng 1) ®−îc sè ho¸ theo c¸c trÞ sè nghÜa thèng kª hay kh«ng vµ hÖ sè nguy
rêi r¹c trõ nång ®é LHD (trïng víi kÕt qu¶ c¬ t−¬ng ®èi (Relative Risk - RR) lµ tû sè
cña Pierga et al. [7]: so s¸nh nguy c¬ tö vong cña bÖnh nh©n
- C¸c ®Æc ®iÓm cña bÖnh nh©n: tuæi khi nhËn c¸c gi¸ trÞ rêi r¹c kh¸c nhau ®ã.
trªn/d−íi 50, cã/ kh«ng m·n kinh 4. Ph−¬ng ph¸p x©y dùng m¹ng n¬
(menopause) chØ sè Karnovsky trªn/d−íi ron vµ c©y håi quy
60 Chóng t«i sö dông m« h×nh m¹ng n¬
- 10 th«ng sè cña bÖnh bao gåm: thêi ron gåm 15 n¬ ron tiÕp nhËn th«ng tin tõ
gian tõ lóc chÈn ®o¸n ung th− ®Çu tíi lóc 14 yÕu tè ®· ®−îc chän (b¶ng 1) vµ cã
cã di c¨n kÝ hiÖu lµ DFI (disease free thªm yÕu tè thêi gian t ®Ó x¸c ®Þnh nguy
interval) trong/ngoµi kho¶ng 6 - 24 th¸ng, c¬ tö vong theo thêi gian cña bÖnh nh©n
cã/kh«ng dïng x¹ trÞ hoÆc ho¸ trÞ tr−íc, [9]
kÝch th−íc cña h¹ch lín/nhá (nodal
III. KÕt qu¶ vµ bµn luËn
involvement), c¬ quan di c¨n (ë phæi,
mµng phæi, gan, x−¬ng, da) vµ sè vÞ trÝ di 1. Ph©n tÝch mèi liªn quan ®¬n biÕn
c¨n. theo m« h×nh cña Cox [1]
- Nång ®é LDH (lactic dehydrogenase) C¸c kÕt qu¶ ph©n tÝch ®−îc tr×nh bµy ë
b¶ng 1.
Kh¶ n¨ng sèng sãt cña bÖnh nh©n
®−îc ®o b»ng thêi gian sèng sãt. §èi víi
mét yÕu tè cã trÞ sè rêi r¹c, kiÓm ®Þnh toµn
côc Wald ®−îc ¸p dông ®Ó kiÓm tra ¶nh
B¶ng 1: Ph©n tÝch ®¬n biÕn kh¶ n¨ng sèng sãt trªn 1477 bÖnh nh©n bÞ ung th− vó di
c¨n
HÖ sè nguy c¬
Thêi gian sèng
C¸c yÕu tè Sè quan t−¬ng ®èi (víi
Tû lÖ % sãt (tÝnh theo P
(tªn viÕt t¾t) s¸t kho¶ng tin cËy
trung vÞ)
95)
Tuæi theo n¨m lóc chÈn ®o¸n ung th− vó di c¨n (age)
< 50 625 42% 26 1,00
> 50 852 58% 23 1,12 (1,06-1,19)
- Ho¸ trÞ liÖu bæ sung (chem)
Kh«ng 992 67% 26 1,00
Cã 485 33% 20 1,39 (1,24 - 1,56) 24 th¸ng 1118 76% 27 1,00 6 th¸ng 359 24% 16 1,85 (1,61 - 2,13)
- Trung vÞ cña thêi gian sèng sãt lµ 24 l−îng di c¨n nªn kh¶ n¨ng sèng sãt cña
th¸ng kÓ tõ ngµy ®−îc chän ngÉu nhiªn cho bÖnh nh©n. ThËt vËy, nÕu chØ cã mét c¬
®iÒu trÞ c¬ b¶n. Thêi gian theo dâi trung quan bÞ di c¨n th× hÖ sè nguy c¬ (RR) chØ
b×nh lµ 155 th¸ng. Kho¶ng thêi gian th«ng phô thuéc vµo c¬ quan ®ã vµ di c¨n vµo
th−êng ®Ó cã ung th− tiÕn triÓn lµ sau 12 gan lµ yÕu tè cã ý nghÜa ¶nh h−ëng ®Õn kh¶
th¸ng. §é tuæi bÞ t¸i ph¸t ung th− th−êng n¨ng sèng cña bÖnh nh©n (RR = 1,76; p =
gÆp lµ 53 tuæi (trong kho¶ng 23 - 79); 0,02). Tr−êng hîp cã 2 n¬i bÞ di c¨n th× hÖ
kho¶ng thêi gian trung b×nh tõ lóc chuÈn bÞ sè nguy c¬ cßn cao h¬n n÷a nÕu cã mét vÞ
ung th− ®Çu tíi lóc t¸i ph¸t ung th− lµ 32 trÝ bÞ di c¨n lµ gan (RR = 2,58 p < 0,001 ®èi
th¸ng. Cã 24% (351) bÖnh nh©n bÞ ung th− lËp víi RR = 1,65; p = 0,028). Víi tr−êng
di c¨n ë phæi vµ trong sè nµy cã 150 bÖnh hîp cã 3 n¬i bÞ di c¨n, ta còng thu ®−îc kÕt
nh©n (11%) bÞ di c¨n ë 2 chç. qu¶ kh¸c biÖt t−¬ng tù khi cã 1 di c¨n ë gan
(RR = 3,43; p < 0,001) vµ khi kh«ng cã di
2. Ph©n tÝch mèi liªn quan ®a biÕn
c¨n nµo ë gan (RR = 1,7; p = 0,02).
(b¶ng 2)
C¸c kÕt qu¶ tr×nh bµy trong b¶ng 2
chøng tá cã mèi liªn quan râ rÖt (qua gi¸ trÞ
p - value) gi÷a c¬ quan bÞ di c¨n vµ sè
B¶ng 2: T¸c ®éng cña mèi quan hÖ vÞ trÝ - sè l−îng lªn kh¶ n¨ng sèng sãt cña
bÖnh nh©n ung th− vó di c¨n
Thêi gian HÖ sè nguy c¬
Sè
Tû lÖ sèng sãt t−¬ng ®èi (víi
VÞ trÝ di c¨n quan P
% (tÝnh theo kho¶ng tin cËy
s¸t
trung vÞ) 95)
< 0,01
ChØ cã di c¨n ë da 30 2% 30.5 1,00 ,02
ChØ cã di c¨n ë gan 93 7% 25 1,76 (1,09 - 2,85) ,17
ChØ cã di c¨n ë phæi 79 6% 25 1,42 (0,86 - 2,33) ,98
ChØ cã di c¨n ë mµng 48 3% 51 0,99 (0,61 - 1,63) ,10
phæi
ChØ cã di c¨n ë x−¬ng 207 15% 30 1,45 (0,93 - 2,28) ,028
Di c¨n ë 2 n¬i, kh«ng bÞ ë 260 18% 28 1,65 (1,06 - 2,59) 3 n¬i, kh«ng bÞ 290 21% 23 1,71 (1,09 - 2,69) 3 n¬i, cã di 252 18% 13 3,43 (2,16 - 5,43)
c¨n ë gan
86
- TCNCYH 24 (4) 2003
KiÓm ®Þnh toµn côc Wald víi p < 0,001 chØ h×nh cøng nh¾c, chñ quan. Mét m¹ng n¬ ron
ra r»ng quan hÖ bËc 2 vÞ trÝ - sè l−îng cña di nh©n t¹o cã thÓ kh¾c phôc ®−îc c¸c nh−îc
c¨n lµ cã ý nghÜa trong sù sèng sãt cña bÖnh ®iÓm nµy.
nh©n. C¸c nghiªn cøu kh¸c cña chóng t«i còng M« h×nh m¹ng n¬ ron nh©n t¹o (artificial
chøng minh r»ng cßn cã nhiÒu mèi quan hÖ neural network model) lÇn ®Çu ®−îc ®−a ra bëi
kh¸c gi÷a c¸c yÕu tè bÖnh (trong b¶ng 1) ¶nh Mc Culloch vµ Pitts vµo n¨m 1943 dùa trªn ý
h−ëng lªn kh¶ n¨ng sèng sãt cña bÖnh nh©n. t−ëng cña mét m¹ng n¬ ron sinh häc: mét n¬
Nh− vËy, quan hÖ vÞ trÝ - sè l−îng cña di c¨n ron thÇn kinh nhËn c¸c tÝn hiÖu ®iÖn kÝch thÝch,
¶nh h−ëng rÊt râ ®Õn nguy c¬ tö vong cña biÕn ®æi vµ truyÒn chóng cho c¸c n¬ ron kÕ
bÖnh nh©n ung th− vó biÓu m« di c¨n. Ngoµi cËn... ®Ó cuèi cïng c¬ thÓ c¶m nhËn ®−îc kÝch
ra, Cutler et al [2] cßn nªu lªn tÇm quan träng thÝch vµ cã ph¶n øng phï hîp. M« h×nh n¬ ron
cña vÞ trÝ bÞ di c¨n ®Çu tiªn ®èi víi tiªn l−îng McCulloch vµ Pitts (h×nh 1) m« t¶ mèi quan hÖ
bÖnh. NhiÒu t¸c gi¶ kh¸c ®· kh¼ng ®Þnh r»ng di gi÷a p kÝch thÝch tè x1..., xp cã ®é m¹nh yÕu
c¨n ë gan, ë t¹ng vµ ë n·o Ýt cã gi¸ trÞ tiªn t−¬ng øng lµ w1,...,wp víi ®¸p øng y cña n¬ ron.
l−îng vµ di c¨n ë x−¬ng cã gi¸ trÞ tiªn l−îng H×nh 1: m« h×nh n¬ ron cña McCulloch vµ
h¬n [6, 11]. Trong ph©n tÝch cña chóng t«i th× Pitts (1943) víi hµm kÝch ho¹t bËc thang
nång ®é LDH lµ mét yÕu tè tiªn l−îng chÝnh. Nh− vËy, nÕu xem ®¸p øng y lµ th«ng tin ®i
Th«ng sè nµy kh«ng ®−îc nãi ®Õn nhiÒu trong ra (kÕt qu¶ xö lý th«ng tin) cña n¬ ron th× y
c¸c nghiªn cøu tr−íc ®©y vÒ tiªn l−îng ung th− còng lµ tæ hîp cña tÊt c¶ c¸c th«ng tin vµ quan
vó nh−ng ý nghÜa l©m sµng cña nã ®· ®−îc ®Ò hÖ cña p kÝch thÝch ®Çu vµo x1,..., xp. NÕu coi p
cËp [10]. ®Çu vµo nµy lµ p yÕu tè bÖnh vµ ®Çu ra y lµ
3. M¹ng n¬ ron vµ c©y håi quy trong kh¶ n¨ng sèng sãt cña bÖnh nh©n th× c¸c
nghiªn cøu vÒ sù sèng sãt th«ng sè cña m¹ng n¬ ron w1,... w2 cho ta biÕt
C¸c kÕt qu¶ thèng kª trªn (b¶ng 1, 2) cho møc ®é ¶nh h−ëng cña c¸c yÕu tè bÖnh vµ
thÊy r»ng, kh¶ n¨ng sèng sãt cña bÖnh nh©n quan hÖ gi÷a chóng ®èi víi sù sèng sãt cña
ung th− vó di c¨n phô thuéc vµo rÊt nhiÒu yÕu bÖnh nh©n. VÝ dô ®¬n gi¶n nµy cho thÊy r»ng,
tè vµ nhÊt lµ vµo c¸c quan hÖ phøc t¹p kh¸c m¹ng n¬ ron hoµn toµn cã thÓ m« t¶ ®−îc
nhau cña nh÷ng yÕu tè nµy. Ngoµi ra còng quan hÖ phøc t¹p gi÷a c¸c yÕu tè bÖnh (®Çu
ph¶i kÓ ®Õn mèi t−¬ng t¸c gi÷a mét yÕu tè víi vµo x) víi kh¶ n¨ng sèng sãt cña bÖnh nh©n
mét quan hÖ ®Ó t¹o thµnh mét quan hÖ míi (®Çu ra y) [3].
cÊp cao h¬n. C¸c ph−¬ng ph¸p thèng kª §Ó viÖc ®¸nh gi¸ thèng kª ®−îc chÝnh x¸c,
th−êng sö dông hiÖn nay trong nghiªn cøu chóng t«i ®· lo¹i bá 269 bÖnh nh©n kh«ng cã
sèng sãt nh− m« h×nh cña Cox, m« h×nh håi ®Çy ®ñ c¸c gi¸ trÞ quan s¸t trªn 14 yÕu tè ®·
quy logistic [8] ®Òu kh«ng cã kh¶ n¨ng tù t×m nªu vµ cßn l¹i 1028j bÖnh nh©n cã ung th− vó
kiÕm vµ ph¸t hiÖn c¸c t−¬ng t¸c gi÷a c¸c yÕu di c¨n. M¹ng n¬ ron ®−îc häc b»ng ph−¬ng
tè vµ chóng ta th−êng ph¶i dïng c¸c m« h×nh ph¸p häc Bayes (Bayesian learning) nh»m thu
®ã cïng víi c¸c quan hÖ ®Þnh tr−íc ®−îc lùa ®−îc tÊt c¶ c¸c th«ng tin cÇn thiÕt tõ mäi bÖnh
chän theo chñ quan cña c¸c thÇy thuèc. C¸ch nh©n, kÓ c¶ c¸c bÖnh nh©n bÞ mÊt theo dâi
lµm nµy kh«ng thÓ ®¸nh gi¸ ®−îc toµn diÖn vÒ trong qu¸ tr×nh ®iÒu trÞ hay bÞ chÕt v× nguyªn
¨n bÖnh nhÊt lµ víi thêi gian, khi gi¸ trÞ cña c¸c nh©n kh¸c (censored cases). §Ó kiÓm tra ®é
yÕu tè kh«ng thÓ ®−a ra ®−îc kÞp thêi nh÷ng chÝnh x¸c cña m¹ng n¬ ron trong viÖc dù b¸o
c¶i tiÕn ®iÒu trÞ theo sù ph¸t triÓn cña bÖnh hay thêi gian sèng sãt, chóng t«i chia ngÉu nhiªn
t×m ra ®−îc mét ph−¬ng ph¸p ®iÒu trÞ míi hiÖu sè bÖnh nh©n thµnh 2 tËp: tËp häc (training
qu¶ nÕu hä vÉn bÞ rµng buéc bëi nh÷ng m« set) gåm 608 bÖnh nh©n dïng cho viÖc x¸c
87
- TCNCYH 24 (4) 2003
®Þnh m¹ng n¬ ron vµ tËp thö (test set) gåm 600 l¹i kh«ng thÓ hiÖn ®−îc t−êng minh c¸c quan
bÖnh nh©n cßn l¹i ®−îc dïng ®Ó kiÓm nghiÖm hÖ nµy.
kÕt qu¶ dù ®o¸n. §Ó ®¸nh gi¸ sù chÝnh x¸c cña - M« h×nh c©y håi qui sö dông c¸c kÕt qu¶ thu
dù b¸o, chóng t«i sö dông chØ sè c - index cña ®−îc tõ m¹ng n¬ ron còng chØ thÓ hiÖn ®−îc
Harrell ®o tû lÖ dù b¸o ®óng víi kÕt qu¶ quan phÇn nµo c¸c t−¬ng t¸c cã ý nghi·.
s¸t [4]. C¸c kÕt qu¶ thu ®−îc chøng tá r»ng m«
Chóng t«i hiÖn ®ang sö dông mét sè m«
h×nh d¹ng n¬ ron (0,664 < c-index < 0,690) cho
h×nh ph©n tÝch kh¸c nh− Randon Forest,
kÕt qu¶ dù b¸o thêi gian sèng sãt chÝnh x¸c
Support Vector Machine ®Ó so s¸nh víi m«
h¬n so víi kÕt qu¶ cña m« h×nh Cox (0,657 <
h×nh m¹ng n¬ ron.
c-index < 0,659) [5]
Bµi viÕt tuy sö dông c¸c nghiªn cøu vµ sè
MÆt kh¸c, ®Ó gióp thÇy thuèc cã thÓ x¸c
liÖu t¹i viÖn Curie (Ph¸p) nh−ng hy väng sÏ giíi
®Þnh ®−îc nguy c¬ cña tõng bÖnh nh©n ngay tõ
thiÖu ®−îc mét tiÕp cËn míi vÒ nghiªn cøu
lóc ®iÒu trÞ ban ®Çu, chóng t«i ®· x©y dùng c©y
sèng sãt ë ViÖt Nam trong nç lùc nh»m ®−a
håi quy dù ®o¸n thêi gian sèng sãt dùa trªn
c¸c øng dông cña To¸n häc vµ Tin häc vµo lÜnh
c¸c kÕt qu¶ thu ®−îc tõ m« h×nh m¹ng n¬ ron
vùc Y tÕ cô thÓ lµ ®iÒu trÞ bÖnh nh©n ung th−
(h×nh 2)
vó.
Dùa trªn c©y håi quy (h×nh 2) chóng t«i x©y
Tµi liÖu tham kh¶o
dùng 3 nhãm tiªn ®o¸n ph©n lo¹i bÖnh nh©n.
Nhãm bÖnh nh©n cã thêi gian sèng sãt dµi h¬n 1. Cox DR. Regression model and life
c¶ (A) gåm nh÷ng bÖnh nh©n kh«ng cã di c¨n ë tables (with discussion) J.Royal Statistical
gan, nång ®é LDH < 322 U/l, chØ sè Karnovsky > Soiety B 1972; 34; 187 - 220.
60, kh«ng ®iÒu trÞ ho¸ trÞ liÖu tr−íc vµ cã thêi gian 2. Cutler SJ, Ardyce JA, Taylor SG III
DFI rÊt ng¾n hoÆc rÊt dµi. Nhãm cã nguy c¬ cao Classification of patients with disseminate cancer
nhÊt (C) lµ nh÷ng bÖnh nh©n bÞ ung th− di c¨n ë of the breast. Cancer 1969; 24: 861 - 9.
gan, cã nång ®é LDH >313 U/l hoÆc Ýt h¬n 313 3. Farragi D, Simon R. A neural network
U/l nh−ng cã h¬n 2 ®iÓm bÞ di c¨n, thêi gian DFI model for survival data. Statistics in Medecine
ng¾n hoÆc dµi. Nh÷ng bÖnh nh©n cßn l¹i thuéc 1995; 14; 73 - 82.
nhãm B. Kh¶ n¨ng sèng sãt cña 3 nhãm nµy trªn
4. Harrell EF, Lee KL, and Mark ®Æc biÖt.
tËp kiÓm ®Þnh 600 bÖnh nh©n ®−îc m« t¶ b»ng
Multivarite prognostic models: Issues in
®−êng cong x¸c suÊt Kaplan Meier (h×nh 3) víi
Developing Models, Evaluating Assumptions
thêi gian sèng sãt trung b×nh cña nhãm nguy c¬
and Adequacy, and Measuring and Reducing
thÊp (A) lµ 44 th¸ng, cña nhãm nguy c¬ cao (C)
Errors, Statistic in Medecine 15 (1996) 361 -
lµ 15 th¸ng vµ cña nhãm cßn l¹i (B) lµ 23 th¸ng.
387.
Ta còng thu ®−îc kÕt qu¶ thêi gian sèng sãt
t−¬ng tù trªn tËp häc 608 bÖnh nh©n ban ®Çu: 45 5. Hoang T, Trinh QA, Asselain B.
th¸ng víi nhãm A, 13 th¸ng víi nhãm C vµ 23 Construction and validation of a prognostic
th¸ng ®èi víi nhãm B. model for metastatic breast cancer using
Bayesian neural network and regression tree.
V. KÕt luËn Intelligent data Analysis in Medecine and
- Quan hÖ vÞ trÝ - sè l−îng cña di c¨n ¶nh Pharmacology 2002, Workshop Notes, 37 - 43,
h−ëng rÊt râ ®Õn nguy c¬ tö vong cña bÖnh www.cs.uu.nl/~lucas/in damap
nh©n bÞ ung th− vó biÓu m« di c¨n. 2002/indamap2002-proc.pdf.
- M¹ng n¬ ron dù b¸o kh¶ n¨ng sèng sãt tèt 6. Hortobagyi JY, Smith TL, Legha SS,
h¬n m« h×nh Cox nhê kh¶ n¨ng tæ hîp ®−îc Swenerton KD, Gehan EA, Yap HY et al.
c¸c quan hÖ tiÒm Èn gi÷a c¸c yÕu tè nh−ng nã Multivariate analysis of prognostic factors in
88
- TCNCYH 24 (4) 2003
metastatic breast cancer. J. Clin. Oncol 1983; Starting Artificial Intelligence Researchers
1: 776 - 86. Symposium. Amsterdam: IOS Press, 2002; pp
167 - 177.
7. Pierga JY, Asselain B, Jouve M, et al.
Effect of Adjuvant Chemotherapy on Outome in 10. Yamamoto N, Watanabe, T, Katsumata
Patients with Metastatic Breast Carcinoma N, et al. Construction and validation of a
Treated with Firstline Doxorubicin Containing practical pognostic index for patients with
Chemotherapy. Cancer 2001: 91: 1079 -89. metastatic breast cancer, J. Clin. Oncol 1998 ;
16: 2401 - 8.
8. Sargent DJ. Comparison of artificial
neural net work with other statistical 11. Zinser JW, Hortobagyi GN, Buzdar AU,
approaches: results from medical data sets. et al Clinical course or breast cancer patiens
Cancer 2001: 91 (8 Supp) piii: 1636 - 42. with lever metastases. J. Clin. Oncol. 1987; 5:
773 -82.
9. Trinh QA, Hoang T, Asselain B. Neural
Network Models for Survival Analysis using
Bayesian Learning or Backpropagation. In:
Vidal T, Liberatore P, eds. STAIRS 2002 -
Summary
Survival data of metastasis breast cancer
prognosis by neural net works and regression tree
- a new approach
In this paper, we expose a new approach to metastasis breast cancer prognosis based on a
combination of two statistical learning methods, i.e. neural net works and regression tree, applied
to survival data. The two methods allow for interactions among prognostic factors such as the
number and the sites of the metastases.
89
nguon tai.lieu . vn