Xem mẫu
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Phát hiện bất thường trong dáng đi ở người dựa
trên khung xương sử dụng mô hình Markov ẩn
Nguyễn Trọng Nguyên, Huỳnh Hữu Hưng
Khoa Công nghệ Thông tin, Đại học Bách khoa, Đại học Đà Nẵng, Việt Nam
Email: {ntnguyen, hhhung}@dut.udn.vn
Tóm tắt—Phát hiện bất thường trong dáng đi ở người là thông tin về dáng đi và thông số về thăng bằng được
bài toán đang được nghiên cứu rộng rãi trong lĩnh vực thị xác định thông qua cảm biến gắn trên người. Trong 44
giác máy tính nói chung và chăm sóc sức khỏe nói riêng. thông số thu được từ các cảm biến, 29 giá trị cho hiệu
Đây là một vấn đề phức tạp bởi sự tồn tại của nhiều loại
bất thường trong dáng đi khác nhau, ví dụ lê bước do đau
quả phân loại tốt giữa hai nhóm bệnh nhân: có và không
khớp gối hay trọng tâm cơ thể thay đổi liên tục khi đi có tiền sử chấn thương do té ngã. Kết quả dự đoán khả
khom lưng, và không phải tất cả đều có sẵn mẫu. Trong năng bị ngã trong quá khứ đạt hiệu quả gần 80% với sự
bài báo này, chúng tôi đề xuất giải pháp phát hiện dáng hỗ trợ của mô hình hồi quy. Mặc dù các nghiên cứu nêu
đi bất thường ở người dựa trên việc xây dựng một mô trên mang lại hiệu quả hứa hẹn trong việc phát hiện sự
hình dáng đi bình thường. Cụ thể, mô hình này được tạo cố trong quá trình di chuyển cũng như đánh giá nguy
ra dựa trên mối quan hệ về vị trí của một tập các khớp
cơ té ngã, nhưng việc sử dụng các cảm biến lại mang
xương và sự biến đổi của các thông số này theo thời gian.
Kết quả thực nghiệm trên 5 đối tượng với hai kiểu dáng đến sự bất tiện bởi người dùng luôn phải gắn chúng lên
đi bất thường cho thấy giải pháp đề xuất mang lại kết quả người. Bên cạnh đó, chức năng theo dõi của cảm biến
hứa hẹn trong việc giải quyết bài toán đặt ra. bị gián đoạn trong quá trình nạp lại năng lượng (ví dụ
Từ khóa—Dáng đi, chu kỳ, khung xương, phân cụm, sạc pin). Ngoài ra, chi phí cho thiết bị khá lớn khi mỗi
mô hình hóa. người cần trang bị một bộ cảm biến riêng.
Để khắc phục các hạn chế nêu trên, các nhà nghiên
I. GIỚI THIỆU cứu hướng đến các hệ thống thị giác máy tính và xây
Các chấn thương liên quan đến xương được xem như dựng các giải pháp tương ứng. Ở [4], các tác giả sử dụng
các tác nhân nguy hiểm có ảnh hưởng lớn đến sức khỏe một cặp camera đã hiệu chuẩn, gắn cố định tại ví trí cao
ở người cao tuổi. Nhiều giải pháp đánh giá sức khỏe trên tường nhà. Các camera thu ảnh với tốc độ 5 khung
người già đã được đề xuất với sự hỗ trợ của các hệ hình mỗi giây cùng với độ phân giải 640 × 480 điểm
thống tự động. Một số nghiên cứu thực hiện việc phân ảnh. Hình chiếu của đối tượng chuyển động được xác
tích dáng đi với sự hỗ trợ của các cảm biến gia tốc được định dựa trên thông tin màu và kết cấu. Các kết quả thu
gắn trong giày [1] hoặc trên người [2]. Các thiết bị này được sau đó được ánh xạ vào một không gian rời rạc
được dùng để ước lượng các thông số liên quan đến dựa trên các thông số nội và ngoại của quá trình hiệu
dáng đi như độ dài sải chân, chiều dài bước, hay tốc độ chuẩn, từ đó xây dựng đối tượng 3 chiều tương ứng. Với
di chuyển. mỗi chuỗi ảnh bước đi, các vị trí của bước chân được
Ở [1], một mô hình dáng đi bất thường ở người được đánh dấu. Cuối cùng, các thông số (liên quan đến tọa
xây dựng dựa trên kĩ thuật mô hình Markov ẩn kết hợp độ 3 chiều) của các vị trí này được tính toán. Mặc dù
với thông tin ngón chân được thu bởi cảm biến gắn trong các thông số vật lý có thể được ước tính tương đối chính
giày bao gồm các con quay hồi chuyển ba chiều và gia xác, nhưng độ phức tạp cùng với chi phí tính toán của
tốc kế có tác dụng ước lượng vận tốc góc và gia tốc của quá trình hiệu chuẩn và đồng bộ có thể trở thành vấn đề
bàn chân. Ngoài ra, bốn điện trở cảm biến lực căng và ảnh hưởng đến hiệu suất hoạt động của hệ thống, đặc
cảm biến uốn cong cũng được gắn trên đế giày để thu biệt là việc tái cấu trúc đối tượng 3 chiều.
nhận thông tin về lực. Các đặc trưng dùng cho việc mô Một số nghiên cứu khác phân tích dáng đi dựa trên
hình hóa được trích xuất dựa trên phương pháp phân ảnh màu thu từ một camera duy nhất. Giải pháp đề xuất
tích thành phần chính (PCA) [3]. Việc đánh giá dáng đi ở [5] sử dụng luồng quang học kết hợp với phân tích
được thực hiện dựa trên độ đo tương tự. Nghiên cứu [2] thành phần chính để xây dựng đặc trưng. Thuật toán
đánh giá nguy cơ té ngã ở 349 người cao tuổi dựa trên k láng giềng gần nhất (k-NN) dựa trên khoảng cách
378
ISBN: 978-604-67-0635-9 378
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Hausdorff được sử dụng để thực hiện việc phân lớp. tôi chỉ sử dụng xương thuộc phần nửa dưới cơ thể, bao
Hạn chế lớn nhất của giải pháp này là khả năng tích gồm xương hông, xương đùi, cẳng chân và bàn chân.
hợp vào các hệ thống xử lý theo thời gian thực bởi chi Các xương này cung cấp thông tin đáng tin cậy trong
phí tính toán dựa trên luồng quang học khá lớn. Ngoài việc phân biệt các kiểu bước đi khác nhau. Lưu ý rằng
ra, mức độ tổng quát hóa của giải pháp không được khái niệm khung xương trong bài báo này ý chỉ dạng
đảm bảo bởi việc thực nghiệm chỉ được áp dụng trên thông tin được cung cấp bởi Kinect, không hoàn toàn
hai bộ dữ liệu thu bởi một người duy nhất. Ở [6], các giống xương trong lĩnh vực sinh học, y tế. Đối với việc
nhà nghiên cứu mã hóa hình dạng đối tượng dựa trên bước đi bình thường, tư thế người thường thỏa mãn một
việc chia lưới. Thông tin về chuyển động của đối tượng số điều kiện nhất định, ví dụ góc hình học tương ứng
được xây dựng bằng cách ghép nối chuỗi các vectơ đặc với các khớp xương sẽ nằm trong một miền giá trị cụ
trưng tương ứng với các khung hình theo thời gian. Mỗi thể, tùy thuộc từng loại khớp. Nhiều nghiên cứu đã chỉ
mẫu như vậy được phân loại dựa trên bộ phân lớp máy ra rằng con người thực hiện việc di chuyển bằng cách
vectơ tựa (SVM). Mặc dù độ chính xác đạt được 70- lặp lại một dạng thức chuyển động nhất định [7]. Ngoài
80%, việc đánh giá dáng đi trong một khoảng thời gian ra, sự tuần hoàn trong chuyển động của các bộ phận
theo phương pháp trên vẫn tồn tại hạn chế. Sự xuất hiện cơ thể cũng có thể được quan sát rõ đối với việc bước
của một vài tư thế bất thường (ví dụ trường hợp ảnh thu đi bình thường, trong khi sự ngẫu nhiên thường tồn tại
được bị ảnh hưởng bởi nhiễu) trong một chuỗi chuyển trong dáng đi bất thường.
động bình thường sẽ làm sai lệch đáng kể kết quả phân Sự bất thường trong dáng đi ở người có thể không
lớp. Giải pháp được đề xuất trong bài báo này hướng tồn tại cả trong trường hợp không có sự xuất hiện của
đến việc khắc phục các hạn chế nêu trên. tư thế bất thường, mà có thể là một chuỗi các tư thế
Qua khảo sát, chúng tôi nhận thấy rằng tư thế người bình thường. Nói cách khác, thông tin về tư thế là chưa
có thể được đánh giá dựa trên khung xương, và một đủ để đánh giá dáng đi. Do đó, ta cần xem xét sự kết
chuỗi các khung xương như vậy có thể biểu diễn thông hợp của một loạt tư thế theo thời gian. Ví dụ, tư thế
tin về dáng đi. Trong bài báo này, chúng tôi đề xuất giải khác thường có thể không quan sát được trong quá trình
pháp xây dựng mô hình dáng đi bình thường nhằm phát đi lại ở người bị nhức xương (nhẹ), nhưng có thể nhận
hiện sự bất thường trong quá trình di chuyển ở người. thấy dựa trên tốc độ di chuyển. Vì vậy, chúng tôi xem xét
Đầu vào của hệ thống là khung xương và tọa độ 3 chiều dáng đi theo từng quãng thời gian, cụ thể là chu kỳ bước
của các khớp được cung cấp bởi camera Kinect. Thông đi trong nghiên cứu này, tương ứng với một chuỗi tư thế
tin này được xác định dựa trên ảnh độ sâu được thu bởi p(t). Ý tưởng chính được chúng tôi đưa ra là mô hình
hệ thống cảm biến hồng ngoại bên trong Kinect. Ảnh hóa dáng đi bình thường ở người trong một chu kỳ. Cụ
này có thể được thu với tốc độ 30 khung hình mỗi giây thể, mỗi chuỗi ảnh biểu diễn việc di chuyển được tách
và độ phân giải 640 × 480, đồng thời không bị tác động thành các chu kỳ, mỗi chu kỳ được biểu diễn bởi một
bởi ánh sáng môi trường. Tư thế người trong mỗi khung dãy các từ mã tương ứng với các vectơ đặc trưng trích
hình được chúng tôi biểu diễn bởi các góc khớp thuộc xuất từ khung xương ở tư thế p(t). Một giá trị ngưỡng
nửa dưới cơ thể và một thông số hình học liên quan. được ước lượng tự động trong quá trình huấn luyện được
Phần còn lại của bài báo được tổ chức như sau. Phần dùng để quyết định một chu kỳ là bình thường hay bất
II trình bày ý tưởng chính giải quyết vấn đề đặt ra. Giải thường. Quá trình xử lý cụ thể được trình bày chi tiết
pháp đề xuất được trình bày chi tiết trong phần III. Trong trong phần tiếp theo.
phần IV, chúng tôi tiến hành thực nghiệm và phân tích
kết quả. Cuối cùng, kết luận được đưa ra trong phần V. III. GIẢI PHÁP ĐỀ XUẤT
Tổng quan giải pháp được thể hiện ở hình 1.
II. PHÁT HIỆN DÁNG ĐI BẤT THƯỜNG
Trong một chuỗi ảnh biểu diễn quá trình bước đi ở A. Trích xuất đặc trưng
người, thông tin dễ dàng quan sát nhất là tư thế tại một Dữ liệu vào của hệ thống là chuỗi khung xương với
thời điểm t cụ thể, p(t). Thông thường, mỗi tư thế chứa các khớp cơ bản (cổ, vai, gối,...) tương ứng với cơ thể
đựng thông tin về hướng, vị trí và mối quan hệ giữa người được xác định dựa trên ảnh độ sâu cùng với mật
các đoạn xương nối tiếp trong khung xương tương ứng độ xác suất tương ứng với từng loại khớp [8]. Tập hợp
với cơ thể người. Đây được xem là đơn vị thông tin cơ các xương và khớp được sử dụng để mô tả tư thế người
bản dùng để biểu diễn dáng đi ở người theo thời gian. có thể khác nhau tùy thuộc từng bài toán. Ở đây, vì dáng
Trên thực tế, việc trích xuất thông tin tất cả các xương đi được đặc trưng bởi chuyển động của vùng xương nửa
là điều không cần thiết. Để đánh giá dáng đi, chúng dưới cơ thể, nên chúng tôi chỉ sử dụng các khớp xương
379
379
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Khung hình: F1 F2 ... Ft Ft+1 ... Fm ... Fn
−
→
v = (xC − xB , yC − yB , zC − zB ) = (v1 , v2 , v3 )
Khung xương: S1 S2 ... St St+1 ... Sm ... Sn (2)
Đặc trưng: V1 V2 ... Vt Vt+1 ... Vm ... Vn →
−u .−
→
v
= (−
ABC →u,−
→v ) = cos−1 →
u −
− →v
u 1 v 1 + u2 v 2 + u 3 v 3
Từ mã: W1 W2 ... Wt Wt+1 ... Wm ... Wn −1
= cos 2 (3)
u1 + u22 + u23 v12 + v22 + v32
Chu kỳ bước đi: C1 C2 ... Cx Sáu đặc trưng đầu tiên được ước lượng dựa trên cả ba
phương trình (1), (2) và (3), trong khi đặc trưng thứ 7 ở
Xây dựng mô hình / Nhận dạng bảng I có một ít khác biệt. Tọa độ của cả 6 khớp tương
ứng với 6 đặc trưng trước đó đều được sử dụng, chia
Hình 1: Tổng quan giải pháp đều cho mỗi chân. Giá trị góc đặc trưng được tính dựa
trên góc giữa hai vectơ pháp tuyến tương ứng với từng
mặt phẳng chân. Cho đến lúc này, tư thế người trong
mỗi khung hình được biểu diễn bởi một vectơ 7 phần
tử. Nhằm đơn giản hóa việc biểu diễn dáng đi, các vectơ
này được chuyển đổi thành một tập các từ mã.
2 1
B. Chuyển đổi vectơ sang từ mã
Quá trình này hướng đến mục tiêu biểu diễn tư thế
KP
3 KT người trong mỗi khung hình bởi một giá trị vô hướng
4
thay vì vectơ. Điều này giúp loại bỏ các sai lệch nhỏ
của cùng một tư thế (tồn tại bởi nhiễu hay bởi các dáng
6 5 người khác nhau). Việc chuyển đổi này được thực hiện
bởi giải thuật phân cụm k-means, được sử dụng khá
Hình 2: Các đặc trưng và vị trí khớp tương ứng nhiều trong các nghiên cứu về thị giác máy tính bởi
KT: các khớp tạo thành mặt phẳng chân trái tính đơn giản và hiệu quả. Các vectơ được nhóm lại dựa
KP: các khớp tạo thành mặt phẳng chân phải trên khoảng cách trong không gian. Trước hết, k tâm
tương ứng với k cụm được khởi tạo ngẫu nhiên từ các
điểm dữ liệu sẵn có. Tiếp theo, khoảng cách giữa tất cả
từ phần hông trở xuống. Để tránh bị ảnh hưởng bởi các các điểm dữ liệu đến mỗi tâm được đo. Mỗi điểm như
kích thước cơ thể khác nhau, chỉ có các giá trị góc được vậy được gán vào cụm có tâm nằm gần nó nhất. Tọa độ
sử dụng thay vì những thông tin liên quan đến độ dài tâm từng cụm được cập nhật bằng cách tính trung bình
của xương. Có tất cả 7 giá trị, gồm 6 góc khớp và 1 góc tọa độ tất cả các điểm trong cụm. Quá trình này lặp lại
mặt phẳng hình học, được chúng tôi sử dụng để mô tả cho đến khi không có sự thay đổi tâm cụm bất kỳ. Các
tư thế cơ thể người trong mỗi khung hình như trình bày vectơ bên trong mỗi cụm được chuyển đổi thành một từ
ở bảng I và minh họa trong hình 2. mã có giá trị nhất định, mỗi cụm mang một giá trị từ
Đặc trưng tương ứng với mỗi khớp được tính toán mã khác nhau.
dựa trên tọa độ ba chiều của ba khớp liên quan. Giả
C. Phân tách chu kỳ bước đi
sử ta quan tâm đến góc khớp B được tạo thành bởi
các đoạn xương BA và BC, trong đó A(xA , yA , zA ), Chúng tôi định nghĩa các chu kỳ bước đi dựa trên một
B(xB , yB , zB ) và C(xC , yC , zC ) là các khớp. Giá trị thông số vật lý có tính tuần hoàn một cách tương đối.
góc khớp B có thể được xác định dễ dàng dựa trên các Trong giải pháp đề xuất, chúng tôi chọn khoảng cách
công thức hình học sau: giữa hai mắt cá chân bởi giá trị này có biến đổi dạng
sóng theo thời gian. Tuy vậy, khoảng cách này thường
−
→ bị dao động nhẹ bởi kĩ thuật định vị khớp của Kinect.
u = (xA − xB , yA − yB , zA − zB ) = (u1 , u2 , u3 ) Do đó, việc áp dụng một bộ lọc làm mượt là điều cần
(1) thiết trước khi tiến hành phân tách chu kỳ bước đi. Kĩ
380
380
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
ID Góc đặc trưng Góc tạo thành bởi
1 Hông trái Xương hông trái Xương đùi trái
2 Hông phải Xương hông phải Xương đùi phải
3 Đầu gối trái Xương đùi trái Ống chân trái
4 Đầu gối phải Xương đùi phải Ống chân phải
5 Mắt cá chân trái Ống chân trái Bàn chân trái
6 Mắt cá chân phải Ống chân phải Bàn chân phải
7 Hai mặt phẳng chân Mặt phẳng các khớp chân trái Mặt phẳng các khớp chân phải
Bảng I: Các đặc trưng mô tả tư thế khung xương
thuật làm mượt theo hàm mũ được sử dụng với công
khoảng cách (cm)
thức tổng quát
xt t=0
st = (4)
αxt + (1 − α)st−1 t>0
với α là hệ số làm mượt (0 < α < 1), t là thứ tự khung hình
khung hình theo thời gian, xt và st lần lượt là khoảng trung vị
cách đo được và khoảng cách đã làm mượt. cực đại cực đại
Sau khi có được các giá trị khoảng cách (dạng sóng),
khoảng cách (cm)
mỗi chu kỳ bước đi được xác định dựa trên từng cặp
giá trị cực đại cục bộ liên tiếp với sự hỗ trợ của một
cửa sổ trượt có kích thước cố định. Chúng tôi sử dụng
kĩ thuật này không chỉ bởi sự đơn giản và trực quan mà chu kỳ
còn bởi khả năng ứng dụng trong các hệ thống thực thi
theo thời gian thực. Tại thời điểm t, cửa sổ trượt xem xét khung hình
một chuỗi giá trị khoảng cách từ thời điểm (t − n + 1)
đến t, với n là chiều rộng cửa sổ. Nếu giá trị cực đại Hình 3: Quá trình phân tách chu kỳ bước đi
của chuỗi nằm ở trung vị, tư thế người ở khung hình Biểu đồ trên: dữ liệu thô
tương ứng được xem như một đầu của chu kỳ, tương Biểu đồ dưới: dữ liệu đã làm mượt
ứng với điểm kết thúc của chu kỳ trước và điểm bắt đầu
của chu kỳ tiếp theo. Để tránh trường hợp vẫn tồn tại
dao động nhỏ sau khi làm mượt, các ngưỡng thống kê chuỗi bằng nhau để tính khoảng cách, ví dụ dynamic
(ví dụ độ lệch chuẩn) hoặc các kĩ thuật hồi quy có thể time warping [9]. Trong khi đó, độ dài của chuỗi, hay
được áp dụng để xử lý vấn đề này. Vì Kinect có miền thời gian thực hiện chu kỳ, là một đặc điểm quan trọng
quan sát thuộc một phạm vi độ sâu cố định nên ta có để đánh giá chu kỳ đó. Việc bước đi một quãng đường
thể ước lượng kích thước cửa sổ dựa trên vị trí lắp đặt ngắn với một quãng thời gian lớn là biểu hiện của việc
camera thực tế mà vẫn đảm bảo độ ổn định trong việc cơ thể có vấn đề.
tách chu kỳ. Một ví dụ minh họa cách tách chu kỳ dựa Mô hình dáng đi bình thường được chúng tôi xây
trên khoảng cách giữa hai mắt cá chân được trình bày dựng dựa trên kĩ thuật mô hình Markov ẩn (HMM) [10]
trong hình 3. cùng với một tập các chu kỳ tương ứng với dáng đi bình
thường. HMM được chọn bởi nó có thể biểu diễn tốt sự
D. Xây dựng mô hình dáng đi bình thường chuyển đổi giữa các tư thế trong quá trình di chuyển ở
Có nhiều kĩ thuật khác nhau thường dùng để giải quyết người. Một lý do khác nữa để chọn HMM là bởi các
bài toán nhận dạng, trong đó phổ biến nhất là so khớp vectơ đặc trưng của các chu kỳ có độ dài khác nhau.
mẫu và sử dụng mô hình. Chúng tôi sử dụng phương Điều này khá quan trọng bởi trên thực tế, độ dài của
pháp thứ hai để thực hiện việc phân loại dáng đi vì lý do những vectơ này chịu ảnh hưởng bởi tốc độ di chuyển.
chính sau đây. Các chuỗi từ mã tương ứng với các chu Cấu trúc tổng quan của mô hình chúng tôi sử dụng được
kỳ bước đi có độ dài khác nhau. Do đó các kĩ thuật so minh họa ở hình 4. Lưu ý rằng số quan sát của mô hình
khớp thường co dãn các chuỗi này nhằm tạo ra các cặp được xác định bởi tham số k trong quá trình phân cụm.
381
381
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
a11 a22 an,n
a12 a23 an−1,n
q1 q2 qn
Hình 4: Mô hình Markov ẩn với n trạng thái qi , aij là
xác suất chuyển trạng thái từ i sang j.
E. Ước lượng ngưỡng
Giá trị ngưỡng dùng để phân biệt một chu kỳ thuộc
dáng đi bình thường hay bất thường được ước lượng dựa
trên giá trị trung bình và độ lệch chuẩn của logarit xác
suất các chu kỳ huấn luyện được sinh ra bởi mô hình đã
Hình 5: Các dáng đi thử nghiệm theo thứ tự từ trên
xây dựng. Độ lệch chuẩn thường được dùng trong thống
xuống: bình thường, bất đối xứng trái-phải và khom lưng
kê để xác định một giá trị nằm gần trị trung bình (bình
thường) hay quá lớn hoặc quá nhỏ (bất thường). Công
Người Bình thường Khom lưng Bất đối xứng hai chân
thức ước lượng ngưỡng có dạng tổng quát 01 26 42 41
02 43 48 48
n 03 68 59 56
i=1 (ζi − µ)2 04 27 45 46
θ =µ+λ (5) 05 21 48 35
n
với θ là ngưỡng, λ là một hằng số, n là số lượng chu Bảng II: Số lượng chu kỳ tương ứng với từng loại dáng
kỳ huấn luyện, ζ và µ lần lượt là logarit xác suất các đi được sử dụng trong thực nghiệm
chu kỳ đó và giá trị trung bình. Lưu ý rằng µ và λ là
các giá trị âm bởi logarit xác suất không phải số dương.
Một chu kỳ bước đi được xem là bình thường nếu logarit là bước đi với giả định lưng bị đau. Lúc này, trọng tâm
xác suất của nó tương ứng với mô hình đã xây dựng lớn cơ thể có xu hướng đổ về trước và một tay đặt vào chỗ
hơn ngưỡng θ. Ngược lại, hệ thống cho rằng có sự bất đau sau lưng. Vì vậy, trọng tâm cơ thể luôn chuyển đổi
thường xảy ra trong quá trình di chuyển ở người. Trong qua lại giữa hai chân, tùy vào chân bước về phía trước,
ứng dụng thực tế, một số luật có thể được áp dụng để và cơ thể có xu hướng nghiêng về cả hai bên trong quá
nâng cao hiệu quả nhận dạng, ví dụ như yêu cầu lượng trình di chuyển. Trong trường hợp tay đặt sau lưng, vị
tối thiểu các chu kỳ bất thường trong một quãng thời trí tay được Kinect định vị không chính xác, nhưng điều
gian để xác nhận. này không ảnh hưởng đến giải pháp chúng tôi đề xuất.
Cả ba dáng đi thực nghiệm được minh họa trong hình 5.
IV. THỰC NGHIỆM VÀ KẾT QUẢ Số lượng chu kỳ bước đi (được phân tách bởi kĩ thuật
Hiện nay chưa có bộ dữ liệu chuẩn về khung xương trình bày ở phần III.C) tương ứng với từng người trong
người trong quá trình bước đi cũng như các nghiên cứu bộ dữ liệu được trình bày ở bảng II.
tương tự trên đối tượng này, do đó chúng tôi sử dụng Mô hình dáng đi bất thường được xây dựng dựa trên
dữ liệu tự ghi và một số dữ liệu mocap thu thập từ 2/3 lượng chu kỳ dáng đi bình thường được chọn ngẫu
internet. Chúng tôi xây dựng hệ thống thử nghiệm dựa nhiên, với hệ số làm mượt α trong phương trình (4)
trên ngôn ngữ C#. Dữ liệu thử nghiệm được thu bởi 5 là 0.2 và hằng số λ trong (5) là −1.28. Qua khảo sát,
người thông qua Kinect trong môi trường nhà ở thực tế. chúng tôi nhận thấy chưa có giải pháp tối ưu hóa bài
Dữ liệu được chia thành 3 nhóm, bao gồm dáng đi bình toán chọn tham số cho mô hình Markov ẩn. Vì thế việc
thường, bất đối xứng trái-phải và khom lưng. Nhóm dữ thực nghiệm được tiến hành trên một lượng lớn các mô
liệu đầu tiên được ghi khi từng người đều bước đi một hình khác nhau và chọn ra mô hình cho hiệu quả cao
cách bình thường. Nhóm thứ hai mô phỏng việc bước đi nhất. Độ chính xác nhận dạng tương ứng với hơn 400
với một khớp gối bị đau. Khi đó, chân tương ứng không mô hình Markov ẩn thử nghiệm được trình bày ở hình 6.
thể co gối như thường lệ mà phải kéo lê, dẫn đến việc Mô hình cho kết quả cao nhất bao gồm 33 quan sát
trọng tâm dồn sang chân còn lại và cả thân người có xu và 16 trạng thái với độ chính xác 86.06%. Việc sử dụng
hướng nghiêng về một bên. Dáng đi bất thường còn lại một lượng lớn hơn các trạng thái hoặc quan sát sẽ làm
382
382
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)
khớp. Việc sử dụng một ngưỡng thời gian có thể khắc
phục vấn đề này: chu kỳ quá ngắn có thể được bỏ qua
khỏi quá trình nhận dạng hoặc được nối với chu kỳ tiếp
số trạng thái
theo để tạo thành chu kỳ mới. Ngoài ra, việc xác nhận
sự bất bình thường với yêu cầu một lượng tối thiểu chu
kỳ bước đi bất thường trong một quãng thời gian cũng
có thể cải thiện độ chính xác của hệ thống.
V. KẾT LUẬN
Trong bài báo này, chúng tôi đã đề xuất giải pháp hỗ
số quan sát trợ việc đánh giá một dáng đi là bình thường hay không
Hình 6: Hiệu quả nhận dạng với các mô hình Markov bình thường ở người. Cụ thể, chúng tôi xây dựng mô
ẩn khác nhau hình dáng đi bình thường và ước lượng một ngưỡng tự
động giúp phân loại một chu kỳ bước đi có thuộc về mô
Bình thường
hình đó hay không. Đóng góp chính trong bài báo này
Bất thường là cách sử dụng những đặc trưng hình học trong khung
xương để biểu diễn dáng đi ở người theo chiều thời gian
số chu kỳ
và đánh giá trên từng phân đoạn (chu kỳ). Kết quả thực
nghiệm cho thấy giải pháp đề xuất mang lại hiệu quả
đầy hứa hẹn đồng thời đưa ra hướng cải tiến cho một
vài hạn chế còn tồn tại. Trong các nghiên cứu mở rộng,
chúng tôi sẽ tiếp tục đánh giá các đặc trưng mới và thử
áp dụng cho bài toán mô hình hóa dáng đi bệnh lý.
|ζ| TÀI LIỆU THAM KHẢO
Hình 7: Trị tuyệt đối logarit xác suất, |ζ| trong (5), được [1] M. Chen, B. Huang, and Y. Xu, “Human abnormal gait modeling
tính dựa trên mô hình Markov ẩn gồm 33 quan sát và via hidden markov model,” in Information Acquisition, 2007.
ICIA ’07. International Conference on, July 2007, pp. 517–522.
16 trạng thái. Ngưỡng được xác định tự động trong quá [2] B. Greene, A. Donovan, R. Romero-Ortuno, L. Cogan, C. N.
trình huấn luyện. Scanaill, and R. Kenny, “Quantitative falls risk assessment
using the timed up and go test,” Biomedical Engineering, IEEE
Transactions on, vol. 57, no. 12, pp. 2918–2926, Dec 2010.
[3] I. T. Jolliffe, “Principal Component Analysis and Factor Anal-
tăng chi phí tính toán, giảm khả năng áp dụng giải pháp ysis,” in Principal Component Analysis, ser. Springer Series in
Statistics. New York: Springer New York, 2002, ch. 7, pp.
này cho các hệ thống nhận dạng trực tiếp. Trong thực 150–166.
nghiệm, hệ thống của chúng tôi có thể thực thi theo [4] E. Stone and M. Skubic, “Passive in-home measurement of
thời gian thực. Giá trị tuyệt đối (nhằm nâng cao tính stride-to-stride gait variability comparing vision and kinect sens-
ing,” in Engineering in Medicine and Biology Society,EMBC,
trực quan) của logarit xác suất tương ứng với các chu 2011 Annual International Conference of the IEEE, Aug 2011,
kỳ bước đi bình thường và bất thường được biểu diễn pp. 6491–6494.
trong biểu đồ ở hình 7. [5] L. Wang, “Abnormal walking gait analysis using silhouette-
masked flow histograms,” in Pattern Recognition, 2006. ICPR
Độ chính xác trong thực nghiệm cho thấy giải pháp 2006. 18th International Conference on, vol. 3, 2006, pp. 473–
đề xuất mang lại hiệu quả hứa hẹn trong việc phát hiện 476.
sự bất thường trong quá trình bước đi ở người. Một số [6] “Automatic detection of abnormal gait,” Image and Vision Com-
puting, vol. 27, no. 1–2, pp. 108 – 115, 2009, canadian Robotic
cải tiến có thể được thực hiện để nâng cao chất lượng Vision 2005 and 2006.
của hệ thống. Một dáng đi bình thường có thể xuất hiện [7] D. A. Winter, Biomechanics and motor control of human move-
một vài chu kỳ bất thường nếu quỹ đạo chuyển động ment. John Wiley & Sons, 2009.
[8] J. Shotton, T. Sharp, A. Kipman, A. Fitzgibbon, M. Finocchio,
của các chu kỳ đó có dạng cong đáng kể. Tuy vậy, trên A. Blake, M. Cook, and R. Moore, “Real-time human pose
thực tế, người ta hiếm khi thay đổi hướng đi đột ngột recognition in parts from single depth images,” Commun. ACM,
trong nhiều chu kỳ bước đi liên tiếp. Vì vậy, hệ thống vol. 56, no. 1, pp. 116–124, Jan. 2013.
[9] “Correlation based dynamic time warping of multivariate time
có thể bỏ qua các chu kỳ có quỹ đạo cong (với mức series,” Expert Systems with Applications, vol. 39, no. 17, pp.
độ tùy chọn) để hạn chế trường hợp phân loại sai. Bên 12 814 – 12 823, 2012.
cạnh đó, một số chu kỳ với thời gian thực hiện rất ngắn [10] P. Fieguth, Statistical image processing and multidimensional
modeling. Springer Science & Business Media, 2010.
có thể tồn tại do sai số trong quá trình định vị tọa độ
383
383
nguon tai.lieu . vn