Xem mẫu

  1. ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA KHOA HỌC MÁY TÍNH TIẾU LUẬN PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC: QUÁ TRÌNH HÌNH THÀNH VÀ PHÁT TRIỂN CỦA MICROSOFT KINECT Giảng viên hướng dẫn: GS. TS. HOÀNG VĂN KIẾM Học viên thực hiện: NGUYỄN PHƯƠNG ANH Lớp: Cao học Khóa 6 MSHV: CH1101159 TP. Hồ Chí Minh, tháng 04 năm 2012
  2. LỜI CẢM ƠN Em xin bày tỏ lòng biết ơn sâu sắc đến GS. TS. Hoàng Văn Kiếm, trưởng bộ môn Kỹ thuật phần mềm khoa Công Nghệ Phần Mềm, trường Đại học Công Nghệ Thông Tin, ĐHQG TP.HCM đã tận tình hướng dẫn, cung cấp kiến thức, truyền đạt những kinh nghiệm quí báu giúp em hoàn thành tốt bài tiểu luận này. Xin cám ơn cha, mẹ, các anh, chị em trong gia đình đã hỗ trợ, lo lắng và động viên. Đồng thời, xin cám ơn tất cả các bạn đã ủng hộ, giúp đỡ chúng tôi trong quá trình thực hiện bài tiểu luận này. Dù đã có nhiều cố gắng nhưng chắc chắn sẽ không tránh khỏi những thiếu sót, em rất mong nhận được sự đóng góp ý kiến của các Thầy giáo, Cô giáo và các bạn để đề tài này được hoàn thiện hơn. Em xin chân thành cảm ơn! Tp Hồ Chí Minh, tháng 04 năm 2012 Học viên
  3. NHẬN XÉT (Của giảng viên hƣớng dẫn) ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ............................................................................................................................................................... ...............................................................................................................................................................
  4. MỤC LỤC LỜI NÓI ĐẦU................................................................................................................. 1 CHƢƠNG 1: TÌM HIỂU MICROSOFT KINECT ......................................................... 2 1. Giới thiệu về Microsoft Kinect ............................................................................. 2 2. Lịch sử phát triển................................................................................................... 2 3. Cấu trúc phần cứng của Kinect ............................................................................. 4 4. Cấu trúc của Kinect SDK ...................................................................................... 6 CHƢƠNG 2: CÂU CHUYỆN BÍ MẬT VỀ SỰ PHÁT TRIỂN KINECT ..................... 8 CHƢƠNG 3: KẾT LUẬN ............................................................................................. 15 PHỤ LỤC ...................................................................................................................... 16 TÀI LIỆU THAM KHẢO ............................................................................................. 18 MỤC LỤC HÌNH ẢNH Hình 1: Thiết bị Microsoft Kinect ................................................................................... 2 Hình 2: Gian hàng của Microsoft tại triển lãm E3 - 2009 ............................................... 3 Hình 3: Cấu trúc phần cứng bên trong Kinect................................................................. 4 Hình 4: Lƣới hồng ngoại phát ra từ Kinect ..................................................................... 5 Hình 5: Bản đồ chiều sâu của hình ảnh thu về thể hiện bằng màu gradient từ trắng(gần) đến xanh dƣơng(xa) ......................................................................................................... 5 Hình 6: Microsoft Kinect sau khi đƣợc tháo rời hoàn toàn ............................................. 6 Hình 7: Phần cứng và phần mềm của Kinect tƣơng tác với một ứng dụng .................... 6 Hình 8: Cấu trúc ứng dụng Kinect để phát triển ứng dụng trên Kinect SDK ................. 7
  5. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 1 LỜI NÓI ĐẦU Kể từ khi máy tính cá nhân đƣợc phát triển, máy tính đƣợc sản xuất hƣớng tới ngƣời dùng phổ thông nhiều hơn. Điều đó thúc đẩy tƣơng tác ngƣời-máy cũng đƣợc phát triển theo những hình thức ngày càng đơn giản hơn và tự nhiên hơn. Trong lịch sử máy tính hiện đại đã có 2 cuộc cách mạng lớn về thiết bị đã dẫn tới những thay đổi của tƣơng tác ngƣời-máy, và sắp tới có thể là cuộc cách mạng của thiết bị Kinect và các thiết bị tƣơng tự. Nỗ lực sớm nhất của việc thay đổi tƣơng tác ngƣời-máy là vào năm 1880, khi Herman Hollerith làm việc ở Cục điều tra dân số Hoa Kì, tìm cách xử lý dữ liệu dân số bằng máy. Kết quả là máy tính sử dụng bìa đục lỗ đã đƣợc tạo ra, đem tới một phƣơng thức thao tác đơn giản hơn với dữ liệu. Sau này, bàn phím tồn tại cùng với sự phát triển của các máy tính hiện đại. Nhƣng 2 điều vừa nêu vẫn chƣa phải là những cuộc cách mạng vì bìa đục lỗ quá phức tạp và thao tác với các phím mũi tên trên bàn phím vẫn chƣa quen thuộc với thói quen tự nhiên của con ngƣời. Cho tới năm 1983, chuột máy tính đầu tiên đƣợc giới thiệu cùng với máy Lisa của Apple. Đi kèm đó là sự xuất hiện của giao diện ngƣời dùng đồ hoạ (Graphical User Interface - GUI). Và đây là cuộc cách mạng đầu tiên trong tƣơng tác ngƣời-máy. Chuột máy tính sau đó đã trở nên không thể thiếu với hầu hết máy tính cá nhân. Cuộc cách mạng tiếp theo là sự phổ biến nhanh chóng và mạnh mẽ của công nghệ cảm ứng đa điểm, dẫn đầu bởi thiết bị di động mang tính cách mạng iPhone của Apple. Cảm ứng đa điểm cho phép tƣơng tác ngƣời-máy thông qua chạm và vuốt trên màn hình cảm ứng. Công nghệ này đã thay đổi hoàn toàn tƣ duy cũ của thời đại máy tính cá nhân, và đã loại bỏ hẳn bàn phím cứng trên nhiều thiết bị di động lẫn máy tính. Thiết bị Kinect cũng có thể là cuộc cách mạng tiếp theo. Khi Microsoft giới thiệu, họ coi đây là một thiết bị cách mạng trong lĩnh vực trò chơi và giải trí. Microsoft phát hành Kinect nhƣ là một cảm biến gắn thêm vào Xbox 360 và phát triển các game tƣơng tác bằng cử chỉ cơ thể trên hệ máy Xbox. Nhƣng ngay sau đó, ngƣời dùng và các lập trình viên thế giới đã tìm thấy sự thú vị trong việc phát triển các ứng dụng tƣơng tác với máy tính cá nhân sử dụng Kinect và đã bắt tay vào nghiên cứu và ứng dụng thiết bị này trong nhiều lĩnh vực khác nhau. Câu chuyện về quá trình thành và phát triển Kinect là một câu chuyện kể về sự tìm tòi sáng tạo, không ngừng vƣơn lên, không nản lòng khi đối mặt với khó khăn của đội ngũ kỹ sƣ Microsoft. Đây sẽ là một bài học bổ ích cho những cá nhân, tổ chức đang tham gia công tác nghiên cứu khoa học và sáng tạo. GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  6. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 2 CHƯƠNG 1: TÌM HIỂU MICROSOFT KINECT 1. Giới thiệu về Microsoft Kinect: Hình 1: Thiết bị Microsoft Kinect Kinect là một thiết bị đầu vào có khả năng cảm nhận chuyển động đƣợc tạo ra bởi Microsoft dùng cho dòng sản phẩm chính là máy chơi game Xbox 360 và máy tính chạy hệ điều hành Windows. Kinect có thiết kế tƣơng tự một webcam và là một thiết bị ngoại vi cho máy Xbox 360, nó cho phép ngƣời dùng điều khiển và tƣơng tác với máy Xbox 360 không cần sử dụng thiết bị điều khiển mà thông qua chính những chuyển động tự nhiên của cơ thể bao gồm cử chỉ và giọng nói. Mục đích chính của dự án này là để tăng trải nghiệm của ngƣời chơi khi sử dụng Xbox 360. Phiên bản dành cho hệ điều hành Windows đƣợc phát hành ngày 01/02/2012. Kinect đƣợc phát hành vào ngày 04/11/2010 tại Bắc Mỹ, 10/11/2010 tại Châu Âu, 18/11/2010 tại Úc, New Zealand, Singapore và ngày 20/11/2010 tại Nhật Bản. Kinect đƣợc bán chung một gói với máy Xbox 360 và game Kinect Adventures. Trong 60 ngày đầu tiên, Microsoft đã bán đƣợc hơn 8 triệu sản phẩm Kinect và Kinect đƣợc ghi nhận vào sách kỷ lục thế giới cho danh hiệu “Sản phẩm điện tử tiêu dùng có tốc độ tiêu thụ nhanh nhất thế giới”. Tính đến tháng 01/2012, Microsoft đã bán đƣợc 18 triệu Kinect. Microsoft cũng đã đƣa ra bộ công cụ hỗ trợ lập trình (Software Development Kit – SDK) cho Kinect trên hệ điều hành Windows 7 vào ngày 16/06/2011. Bộ SDK này cho phép lập trình viên có thể xây dựng các ứng dụng tƣơng tác với Kinect bằng các ngôn ngữ C++/CLI, C# hoặc Visual Basic .NET. 2. Lịch sử phát triển: Kinect lần đầu tiên đƣợc giới thiệu vào ngày 01/06/2009 tại triển lãm E3 dƣới tên mã là Project Natal. Theo truyền thống lấy tên thành phố để đặt tên mã của Microsoft, GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  7. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 3 Project Natal đƣợc lấy tên từ thành phố Natal của Brazil để ghi công Alex Kipman – một giám đốc của Microsoft, ngƣời đã khai sinh ra dự án và cũng là một ngƣời có gốc Brazil. Natal nghĩa là “một cuộc sống mới” với ngụ ý của Microsoft là “sự ra đời của một hệ thống giải trí gia đình mới”. Hình 2: Gian hàng của Microsoft tại triển lãm E3 - 2009 Ba game đã đƣợc trình diễn tại Microsoft‟s E3 2009 Media Briefing là Ricochet, Paint Party và Milo & Kate. Một bản demo cho game Burnout Paradise cũng đƣợc trình diễn bên ngoài Microsoft‟s Media Briefing. Tại E3 2009, công nghệ nhận dạng khung xƣơng cho phép ghi nhận đƣợc 4 ngƣời cùng lúc với 48 điểm xƣơng trên cơ thể ngƣời tại mức 30Hz. Trong quá trình phát triển, đội phát triển đã thử nghiệm nhiều trên game khác nhau để nâng cao khả năng của Kinect. Tiêu biểu là Beautiful Katamari và Space Invaders Extreme, vốn đã đƣợc biểu diễn tại Tokyo Game Show tháng 09/2009. Giám đốc sáng tạo Kudo Tsunoda của Microsoft cho biết việc đƣa hệ thống điều khiển của Kinect vào các game cũ thông qua hệ thống cập nhật phần mềm tự động gặp rất nhiều khó khăn. Kinect ban đầu đƣợc thiết kế riêng một bộ vi xử lý riêng nhƣng đến tháng 01/2010, các thao tác xử lý đƣợc đảm nhận trực tiếp bởi một nhân của bộ vi xử lý Xbox 360′s Xenon CPU. Alex Kipman cho biết Kinect sẽ chiếm 10-15% tài nguyên của Xbox 360. Ngày 13/06/2010, Microsoft mở hội nghị “World Premiere „Project Natal‟ for the Xbox 360 Experience” tại Galen Center. Tại đây Project Natal đã có tên gọi chính thức là Kinect, vốn là sự kết hợp giữa “kinetic” (chuyển động) và “connect” (kết nối), cũng GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  8. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 4 chính là mục tiêu mà thiết bị hƣớng tới. Microsoft cũng đã thông báo ngày phát hành tại Bắc Mỹ là 4/11/2010. Và cũng tại đây, Microsoft đã giới thiệu một thiết kế mới của Xbox 360 tƣơng thích hoàn toàn với Kinect. Ngày 16/06/2011, Microsoft chính thức phát hành bộ công cụ phát triển phần mềm phi thƣơng mại cho Kinect. Tiếp theo, ngày 01/02/2012 Microsoft chính thức phát hành phiên bản thƣơng mại của bộ công cụ phát triển phần mềm Kinect cho hơn 300 công ty của 25 nƣớc trên toàn thế giới. 3. Cấu trúc phần cứng của Kinect: Hình 3: Cấu trúc phần cứng bên trong Kinect Kinect đƣợc tạo ra dựa trên 2 nền tảng chính bao gồm nền tảng phát triển công nghệ phần mềm của Rare – một nhánh của bộ phận phát triển game của Microsoft và công nghệ camera đo chiều sâu của hãng PrimeSense tại Israel – một hãng đã phát triển thành công hệ thống có khả năng hiểu đƣợc những chuyển động xác định và dùng nó để điều khiển các thiết bị điện tử. Kinect đƣợc thiết kế theo cấu trúc một thanh ngang kết nối với một trụ nhỏ bằng một trục cơ đứng nhằm mục đích cho phép camera có thể điều chỉnh góc nhìn lên trên hoặc xuống dƣới vị trí của camera. Thiết bị bao gồm camera ảnh RGB, một bộ cảm biến chiều sâu hình ảnh và một bộ microphone ghi nhận âm thanh đa chiều, tất cả đƣợc vận hành bởi một phần mềm độc quyền. Bộ microphone của Kinect có khả năng xác định vị trí nguồn âm thanh và lọc nhiễu. Các thành phần này của Kinect cung cấp khả năng theo dõi chuyển động toàn cơ thể ngƣời dùng trong không gian 3 chiều, nhận diện khuôn mặt và nhận diện giọng nói. GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  9. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 5 Hình 4: Lƣới hồng ngoại phát ra từ Kinect Hình 5: Bản đồ chiều sâu của hình ảnh thu về thể hiện bằng màu gradient từ trắng(gần) đến xanh dƣơng(xa) Bộ cảm biến chiều sâu của Kinect bao gồm một máy chiếu hồng ngoại cùng một bộ phận cảm biến CMOS đơn sắc cho phép Kinect có thể ghi nhận hình ảnh 3 chiều dƣới bất kỳ điều kiện ánh sáng nào. Tầm hoạt động của bộ cảm biến chiều sâu này có thể điều chỉnh đƣợc, phần mềm của Kinect có thể tự xác định vùng cảm biến dựa trên gameplay và môi trƣờng vật lý xung quanh ngƣời chơi qua đó loại bỏ những nội thất trong phòng hoặc các vật cản trở tầm hoạt động. Kinect đƣợc Microsoft đăng kí độc quyền cùng với bộ phần mềm cho phép hệ thống có thể nhận biết cử chỉ, khuôn mặt, giọng nói một cách vƣợt bậc. Theo nhƣ các thông tin của các hãng bán lẻ, Kinect có thể ghi nhận 6 ngƣời cùng lúc kể cả hai ngƣời đang chơi để phân tích chuyển động của 20 khớp xƣơng mỗi ngƣời chơi. GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  10. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 6 Bộ cảm biến hình ảnh Kinect có dữ liệu video đầu ra với frame rate là 30Hz, độ phân giải 32-bit VGA (640×480px). Bộ cảm biến chiều sâu có độ phân giải 16-bit QVGA (320×240px với độ sâu 65,536 mỗi pixel) và có tầm hoạt động thực tế là từ 1.2 đến 3.5 mét. Kinect có góc quan sát là 57° theo trục ngang và 43° theo trục dọc, trong khi đó trục cơ đứng có thể nghiêng lên xuống 27°. Bộ microphone bao gồm 4 microphone riêng lẻ cho phép Kinect ghi nhận và xử lý âm thanh dƣới dạng 16-bit với tần số trung bình là 16 kHz. Hình 6: Microsoft Kinect sau khi đƣợc tháo rời hoàn toàn Kinect cần nhiều điện năng để hoạt động nên cổng USB của Xbox 360 không thể đáp ứng mà phải qua một adapter để chia thành 2 kết nối riêng là USB và kết nối nguồn, giúp cho thiết bị sẽ kết nối với Xbox 360 bằng cổng USB trong khi nguồn điện sẽ đƣợc lấy từ bo mạch của Xbox qua đƣờng AC adapter. Phiên bản Xbox 360 mới sẽ không cần adapter vì nó có các AUX port đặc biệt để cung cấp cho cổng kết nối. 4. Cấu trúc của Kinect SDK: Microsoft cung cấp bộ thƣ viện lập trình để giúp các lập trình viên sử dụng các dữ liệu ngôn ngữ tự nhiên của cơ thể trong thời gian thực. Hình 7: Phần cứng và phần mềm của Kinect tƣơng tác với một ứng dụng GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  11. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 7 Các thành phần của SDK đƣợc thể hiện trong hình sau: Applications Video Components Audio Components Windows Core Audio 5 A/V capture and transcoding 3 NUI API and Speech APIs Media Foundation | DirectShow 4 DMO codec for mic array 2 Device Device Video stream control Audio stream control User Mode setup access WinUSB device stack WinUSB camera stack USBAudio audio stack Kernel Mode Kernel-mode drivers for Kinect for Windows USB Hub Hardware 1 Motor Cameras Audio mic array Kinect sensor Kinect for Windows User-created Windows SDK components components Hình 8: Cấu trúc ứng dụng Kinect để phát triển ứng dụng trên Kinect SDK Các thành phần của SDK đƣợc thể hiện trong hình trên bao gồm: - Phần cứng: Các thành phần của phần cứng, bao gồm các bộ cảm biến Kinect và cổng USB mà thông qua đó cảm biến đƣợc kết nối với máy tính. - Trình điều khiển Kinect: Các trình điều khiển của Windows 7 cho bộ cảm biến Kinect đã đƣợc cài đặt theo SDK. Trình điều khiển này hỗ trợ: o Các cảm biến microphone của Kinect nhƣ các thiết bị âm thanh chuẩn, bạn có thể truy cập thông qua các API âm thanh tiêu chuẩn trong Windows. o Truyền dữ liệu hình ảnh bình thƣờng và hình ảnh dạng chiều sâu. o Cho phép một ứng dụng sử dụng nhiều hơn một cảm biến Kinect đƣợc kết nối với máy tính. o NUI API: Một tập hợp các API để lấy dữ liệu từ các cảm biến hình ảnh và điều khiển các thiết bị Kinect. o KinectAudio DMO: Khả năng xử lý âm thanh bao gồm loại bỏ tiếng ồn và tiếng vang, hình thành chùm tia để xác định nguồn âm thanh, và tích hợp với các hàm API nhận dạng giọng nói của Windows. o Các API chuẩn trong Windows 7: Các bộ thƣ viên về âm thanh, lời nói, và đa phƣơng tiện nhƣ mô tả trong Windows 7 SDK và Microsoft Speech SDK. GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  12. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 8 CHƯƠNG 2: CÂU CHUYỆN BÍ MẬT VỀ SỰ PHÁT TRIỂN KINECT Vào giữa năm 2007, Don Mattrick – ngƣời phụ trách kinh doanh giải trí tƣơng tác của Microsoft ở Redmond – Washington đã đƣa ra yêu cầu về một hƣớng phát triển mới cho sản phẩm Xbox 360. Trong một buổi họp hoạch định chiến lƣợc, Marc Whitten, phó giám đốc điều hành Xbox live đã giải thích rằng họ sẽ phải thay đồi nền tảng tƣơng tác với Xbox. Sau đó, họ đƣa ra một danh sách vắn tắt các yêu cầu: điều khiển bằng chuyển động, nhận diện khuôn mặt, nhận dạng giọng nói và tƣơng thích với các sản phẩm Xbox đã có trên thị trƣờng. Ý tƣởng này đã ứng dụng nguyên tắc kết hợp trong tƣ duy sáng tạo nhằm mục đích kết hợp đồng thời cả 3 tính năng nhận dạng cho ra một sản phẩm duy nhất. Vấn đề đƣợc đƣa ra không chỉ có tính mơ mộng, trên thực tế việc hiện thực nó là hoàn toàn bất khả thi. Việc tìm một chiếc camera có thể nhìn một căn phòng thì rất đơn giản. Để có 1 sản phẩm cụ thể có khả năng giải mã đƣợc các chi của ngƣời dùng và giọng nói dành cho 40 triệu ngƣời dùng Xbox là cả một giấc mơ. Để hiện thực hóa sản phẩm này, thiết bị phần cứng đòi hỏi phải có một phần mềm có khả năng phân tích hơn 1023 trƣờng hợp cần xử lý bao gồm cả cử chỉ và giọng nói trong cùng một lúc mà không gây ra bất kỳ hiện tƣợng trễ nào. Dù sao chăng nữa, các phần riêng lẻ của sản phẩm mới gần nhƣ đã có sẵn. Trung tâm nghiên cứu của Microsoft ở Bắc Kinh đã đạt đƣợc một số thành tựu nhất định trong việc nhận dạng khuôn mặt. Trung tâm nghiên cứu Redmond đã phát triển phần mềm nhận dạng giọng nói từ nhiều thập niên trƣớc. Và các kỹ sƣ phần cứng tại trung tâm Redmond đã rất bận rộn với việc tạo ra các bản mẫu cho các bộ điều khiển dựa trên gia tốc và chuyển động để chuẩn bị cho những sự đổi mới ở tƣơng lai. Họ đã ứng dụng nguyên tắc sao chép trong tƣ duy sáng tạo nhằm ứng dụng những công trình nghiên cứu đã có và tích hợp vào một sản phẩm mới. Tuy nhiên, nó vẫn luôn đòi hỏi một sự nghiên cứu thấu đáo và chạy thử trƣớc khi bất kỳ ai có thể khẳng định rằng nó có chạy đƣợc hay không hoặc là có tạo ra lợi nhuận hay không. Vấn đề lớn nhất gặp phải ở đây là: việc này chƣa đƣợc thực hiện ở bất kỳ nơi nào trên cả thế giới. Alex Kipman, 31 tuổi là ngƣời đƣợc giao nhiệm vụ hiện thực hóa yêu cầu của Mattrick. Kipman đến từ Natal tại Brazil với 16 bằng sáng chế tại Microsoft tính từ khi ông bắt đầu làm việc vào năm 2001. Kipman cho rằng việc đầu tiên phải làm là nghiên cứu khả năng máy học: khả năng huấn luyện máy tính dự đoán. Nhóm của Kipman bao gồm 15 ngƣời bắt đầu trải qua quá trình huấn luyện với các kỹ năng hoàn toàn mới nhằm làm phong phú phƣơng pháp suy nghĩ và sáng tạo. Khóa huấn luyện này đƣợc huấn luyện bởi các họa sĩ, nhạc sĩ, nhà thiết kế, nghiên cứu viên, GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  13. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 9 kỹ sƣ, một số ngƣời đến từ Hollywood, giám đốc hiệu ứng của bộ phim “Ma trận”… Họ tóm tắt lại rằng nhiệm vụ của họ là tự đặt mình là những kẻ dễ thất bại và ngu dốt, nó chính là động lực khiến họ làm việc cật lực nhằm đạt đƣợc những kết quả mới. Ở một số khía cạnh, họ ít gặp phải thách thức mới hơn các khía cạnh còn lại. Ví dụ nhƣ việc nhận dạng giọng nói đã là kết quả của một quá trình nghiên cứu lâu dài của Microsoft. Tuy nhiên ở khía cạnh nhận diện từng ngƣời một cách chính xác dựa trên khuôn mặt và hình dáng cơ thể thì rất khó. Kipman nói rằng: “Darwin đã chống lại chúng tôi, mọi ngƣời ở trong một gia đình thƣờng rất giống nhau về ngoại hình. Và chúng tôi gọi việc nhận dạng ở đây chính xác là nhận dạng đặc tính chứ không phải là nhận dạng khuôn mặt. Việc sử dụng nhận dạng khuôn mặt ở đây hoàn toàn không đem lại hiệu quả.” Việc ghi nhận chuyển động của cơ thể ngƣời để nhận dạng cử chỉ và lời nói của con ngƣời khiến máy tính phải đối mặt với khoảng 1023 trƣờng hợp có thể xảy ra. Kipman biết rằng việc này vƣợt xa hơn khả năng lập trình một cách bình thƣờng rất nhiều. Kipman biết rằng ông phải đƣa ra một khái niệm lập trình mới tại Microsoft và ông ta đã làm đƣợc – khiến cho ngôn ngữ lập trình có thể mô tả và xử lý những trƣờng hợp chƣa gặp bao giờ. Tamir Berliner, 29 tuổi cùng 4 ngƣời khác đang làm việc tại cùng một đơn vị trực thuộc bộ quốc phòng Israel là những nhà đồng sáng lập PrimeSense. Thành lập vào tháng 05/2005, Tel Aviv – tiền thân của PrimeSense có 130 nhân viên và mở ra hơn 5 chi nhánh trên toàn Châu Á. Họ tìm cách giải quyết vấn đề sử dụng một bộ cảm biến chiều sâu để để nhận dạng một ngƣời đang chuyển động. Họ đã ứng dụng nguyên tắc sao chép và nguyên tắc tự phục vụ trong tƣ duy sáng tạo bằng cách sử dụng một bộ phát hồng ngoại và một bộ thu hình ảnh hồng ngoại để thu lại lƣới hồng ngoại thiết bị đã phát ra và dựa trên đó xây dựng chiều sâu của từng điểm ảnh. Berliner cho biết bản thân họ cũng là những game thủ và học nhận thấy việc chơi game trên máy tính rất nhàm chán, họ muốn họ có thể thực hiện các thao tác của nhân vật trong game để điều khiển chính nhân vật của mình. Giới thiệu sản phẩm lần đầu tiên vào tháng 03/2006, hai tháng sau, PrimeSense đƣa bản nâng cấp của sản phẩm đến hội chợ E3 ở Los Angeles – một hộp nhựa màu trắng, dài 30cm, rộng 10cm, bao gồm 1 camera RGB, một cảm biến hồng ngoại và một nguồn sáng. Khi lần đầu tiên Kipman đƣợc nhìn thấy sản phẩm này, ông ta đã nhanh chóng nhận ra đƣợc những gì có thể làm với thiết bị này. Team Xbox đã bí mật ký hợp đồng với PrimeSense – cung cấp chip cảm biến chiều sâu và các thiết kế liên quan. Tại đây, nguyên tắc phân nhỏ và nguyên tắc lấy “rẻ” thay cho “đắt” trong tƣ duy sáng tạo đã đƣợc áp dụng nhằm mục đích thu nhỏ bộ camera cảm biến và hạ giá thành sản phẩm. Raghu Murthi – giám đốc bộ phận sản GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  14. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 10 xuất phần cứng cho Xbox - cho hay: “Các thiết bị phần cứng phải đƣợc thu nhỏ tối đa và gần nhƣ không tồn tại trong con mắt ngƣời dùng. Qua đó, ngƣời dùng có thể tƣơng tác với hệ thống nhƣng không thể biết rằng Microsoft đã làm điều đó bằng cách nào.” Vào đầu năm 2008, Kudo Tsunoda, 36 tuổi, tham gia vào bộ phận phát triển game của Microsoft từ Electronic Arts để phát triển Gears of War 2. Trong một buổi họp giới thiệu Tsunoda với các đồng nghiệp tại Redmond, Kipman đến và mang theo thiết bị đƣợc tạo ra dựa trên bộ camera cảm biến của PrimeSense. Kipman mô tả về sản phẩm này một cách rất đơn giản – nó thể hiện góc nhìn 3 chiều, không âm thanh, không RGB – nhƣng ngay lập tức Tsunoda đã hoàn toàn bị chinh phục. Anh ta nhắc đi nhắc lại rằng: “Đây quả thực là một điều tuyệt vời, chúng ta có thể làm hàng trăm thứ với thiết bị này.” Cuộc họp của họ đã kéo dài hơn 4 tiếng đồng hồ. Sau đó, sự phấn khích của Tsunoda đã giảm bớt ngay sau một phép thử thực tế. Tsunoda gọi lại cho Kipman và cho rằng họ không thể làm đƣợc bởi vì họ có thể theo dõi chuyển động nhƣng các chuyển động này không có gia tốc nhất định và có rất nhiều dạng chuyển động khác nhau. Tuy nhiên họ cũng thống nhất rằng họ có thể tích hợp microphone để nhận dạng giọng nói và một camera RGB để giúp ngƣời chơi có thể nhìn thấy chính mình một cách rõ ràng trên màn hình. Nguyên tắc kết hợp trong tƣ duy sáng tạo đã đƣợc áp dụng nhằm tạo ra một thiết bị với nhiều tính năng hơn. Cũng giống nhƣ Kipman, Tsunoda cũng có một nhóm nghiên cứu đã có kinh nghiệm tạo bản mẫu cho khoảng 70 game. Khi team của Kipman tạo ra bản mẫu cho một khung xƣơng di chuyển dựa trên cấu trúc cơ thể ngƣời, họ kết hợp cùng làm việc với team của Tsunoda. Nhận dạng con ngƣời lúc nào cũng là một rào cản lớn đối với họ và việc nhận dạng âm thanh cũng gặp khó khăn trong quá trình khử nhiễu. Nhóm của Kipman và Tsunoda làm việc chung với nhau và đối mặt với deadline vào ngày 18/08/2008, một cuộc họp với các nhân viên của Microsoft và quyết định tính sống còn của dự án. Họ mang đến một bộ cảm biến và nói với mọi ngƣời rằng: “Chúng tôi sẽ không nói bất cứ điều gì về mặt công nghệ. Chúng tôi không nói chúng tôi đã làm những gì. Tất cả những gì bạn cần làm là trải nghiệm nó, hãy ngồi xuống và chơi. Nó là một chiếc ô tô, hãy lái nó theo cách bạn thƣờng lái.” Marc Whitten đã mỉm cƣời, cuộc họp trở nên sáng sủa khi những công nghệ sử dụng đƣợc Kipman giải thích. Mọi ngƣời đều nhận thấy sức mạnh của công nghệ mới này. Kipman đã có thêm thời gian nhƣng nhiều câu hỏi lớn vẫn chƣa đƣợc giải đáp. Giáo sƣ Blake, 54 tuổi, làm việc tại trung tâm nghiên cứu của Microsoft tại Cambridge từ năm 1999 đã có 32 bằng sáng chế cho Microsoft. Ông là một trong những chuyên gia đi đầu của thế giới trong lĩnh vực thị giác máy (Computer Vision). Ông nổi tiếng với các nghiên cứu nhƣ theo dõi nhịp đập tim thông qua hình ảnh, công cụ tẩy nền của hình ảnh trong Office 2010, hệ thống tìm kiếm bằng lazer cho phép máy GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  15. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 11 bay trực thăng quân đội theo dõi mặt đất… Vào năm 2001, Blake xuất bản một bài báo khoa học cùng với một nhà nghiên cứu khác của Microsoft tên là Kentaro Toyama. Bài báo đƣa ra một hƣớng tiếp cận mới để theo dõi sự chuyển động của các vật thể. Tên của bài báo là “Probabilistic Tracking in a Metric Space”, bài báo đã giả dụ rằng chuyển động của một vũ công ba lê có thể đƣợc theo dõi bằng cách đƣa ra một xác suất có thể để một khung hình có thể đi đến một khung hình kế tiếp (có thể hiểu là dự đoán trƣớc chuyển động dựa trên xác suất thống kê). Nguyên tắc giải “thiếu” đã đƣợc Blake áp dụng để đƣa ra một kết quả mang tính gần đúng cho bài toán. Bằng cách nhập vào các dữ liệu thô mô tả di chuyển của vũ công tại mỗi khung hình, hệ thống máy tính có thể đƣa ra đƣợc khung hình kế tiếp gần đúng nhất so với chuyển động của vũ công. Hƣớng tiếp cận này đƣợc Blake mô tả “nhƣ là một cuốn tranh lật hoạt hình với các tƣ thế nguyên mẫu” đã tạo ra một làn sóng mới trong lĩnh vực nghiên cứu máy học và đoạt giải thƣởng Marr. Nó cũng gây ảnh hƣởng đến một post-doc đang làm việc tại Oxford tên là Andrew Fitzgibbon, một chuyên gia trong lĩnh vực thị giác máy. Vào năm 2007, Fitzgibbon, 42 tuổi đã xuất bản một bài báo “The Joint Manifold Model for Semi-supervised Multi-valued Regression” mô tả cách sử dụng xác suất để dự đoán chuyển động của cơ thể. Tuy nhiên hƣớng tiếp cận này gặp phải một rào cản khá lớn đó là: nó chỉ hoạt động đƣợc với khoảng 50 chuyển động của cơ thể, thời gian xử lý rất chậm – mất khoảng 1 phút để đƣa ra khung hình tiếp theo của chuyển động. Tại điểm này, nhóm của Kipman tìm thấy một bài báo từ Toshiba – nơi mà các nhà nghiên cứu đang cố gắng theo dõi chuyển động theo thời gian thực với một camera bình thƣờng chứ không phải một camera 3 chiều. Blake nói rằng họ đã dựa trên nghiên cứu của ông và Toyama và mở rộng phạm vi của nó lên. Cuốn tranh lật hoạt hình của Blake chỉ có khoảng 100 trang nay đã lên tới 50,000 trang dƣới nghiên cứu của Toshiba và có thể theo dõi tất cả các trạng thái của cơ thể. Tuy nhiên các nghiên cứu của Toshiba đã đƣợc Blake cho rằng chƣa thể ứng dụng đƣợc bởi vì hoán vị các chuyển động của cơ thể là quá lớn dẫn đến việc áp dụng xác suất không đem lại hiệu quả. “Nếu mỗi điểm của cơ thể đƣợc chia làm 10 bộ góc, có tới 1030 khả năng cho chuyển động kế tiếp. Nó sẽ không chính xác.”, Blake nói. Câu trả lời cho bài toán đến từ nghiên cứu tiến sĩ của Jamie Shotton, một nhà nghiên cứu mới ra trƣờng làm việc tại bộ phận của Blake. Shotton đã khiến cho máy tính có khả năng phân biệt bò, cỏ hoặc máy bay trong một tấm hình đồng quê bằng cách cho máy tính học theo từng pixel một. Anh ta đã huấn luyện cho máy tính có khả năng nhận diện 21 danh mục vật thể khác nhau. Một cách tình cờ, Kipman đã đọc đƣợc bài báo của Shotton viết về việc theo dõi cử động của bàn tay. Kipman nhận xét rằng bài viết đƣợc viết khá chi tiết và mang tính GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  16. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 12 lạc quan. Vào ngày 18/08/2008, Kipman đã gọi cho Shotton và trình bày ý tƣởng của mình. Shotton đã bàn luận với Fitzgibbon và nhận đƣợc câu trả lời rằng ý tƣởng đó không thể hiện thực đƣợc. Nhóm của Kipman đã chủ động mang thiết bị bay tới Cambridge và cho Shotton xem khả năng của bộ camera cảm biến 3 chiều. Màn hình cho thấy một bộ khung ngƣời đang đựa vẽ lên trên một bộ nền, bộ nền hiển thị những gì bộ cảm biến chiều sâu nhìn thấy. Một khi hệ thống nhân dạng đƣợc hình dáng cơ thể ngƣời, nó sẽ vẽ lên bộ khung tƣơng ứng. Vấn đề gặp phải với bộ xƣơng ở đây là cơ thể ngƣời luôn chuyển động một cách không thể dự đoán trƣớc và các chuyển động này không hoàn toàn giống nhau. Vì vậy hệ thống thƣờng xuyên bị lỗi khi tay, chân hoặc đầu chuyển động. Nếu họ quay lại sử dụng phƣơng pháp của Blake, dữ liệu huấn luyện sẽ rất lớn và dữ liệu này sẽ không phù hợp với bộ nhớ của Kinect. Họ bắt đầu suy nghĩ đến phƣơng pháp chia cơ thể ra làm nhiều phần khác nhau. Tại đây, nguyên tắc phân nhỏ trong tƣ duy sáng tạo đã đƣợc áp dụng. Cuối cùng Shotton quyết định quay lại nghiên cứu giải pháp cũ trong việc cho máy tính học theo từng pixel. Đây chính là khoảnh khắc đột phá: nếu hệ thống đƣợc huấn luyện để nhận dạng từng phần riêng biệt của cơ thể - với sự trợ giúp của bộ cảm biến chiều sâu – hệ thống sẽ nhận dạng đƣợc chuyển động trong bất kỳ trạng thái nào. Fitzgibbon chạy một đoạn video mô tả các bộ phận của cơ thể ngƣời cánh tay trái xuống đến bàn chân phải đã đƣợc tô màu, mỗi một bộ màu chuyển động cùng với cơ thể khi nó di chuyển. 31 phần của cơ thể khác nhau có 31 màu khác nhau. Nguyên tắc thay đổi màu sắc trong tƣ duy sáng tạo đã đƣợc áp dụng để đánh dấu các bộ phận khác nhau cảu cơ thể sau khi phân nhỏ. Shotton cho rằng nếu có thể huấn luyện hệ thống với hàng triệu trạng thái chuyển động khác nhau của cơ thể, bạn có thể điều chỉnh thuật toán sao cho nó có thể bỏ qua các giai đoạn bạn thay đổi từ trạng thái chuyển động này sang trạng thái chuyển động khác, hoặc là hình dạng của bạn (mập lên hay ốm đi) và lƣu giữ thông tin quan trọng nhất đó là điểm ảnh đó thuộc về bộ phận nào của cơ thể. Những chuyển động của ngón tay cũng có thể đƣợc giải quyết vì giới hạn độ phân giải của camera ngày nay đã đƣợc mở rộng. Họ đặt tên cho hệ thống mới này là hệ thống “Exemplar” và bắt đầu huấn luyện thuật toán với 100 tấm ảnh con ngƣời do máy tính sinh ra. Vào tháng 06/2009, hệ thống đã sẵn sàng để đƣợc công bố tại triển lãm E3 ở Los Angeles. Sáu tháng sau, nhóm đã bàn giao lại kết quả nghiên cứu cho nhóm nghiên cứu ở Redmond. Shotton đã không đƣợc chơi thử bất kỳ game nào cho đến tháng 08/2010 và anh ta đã rất ngạc nhiên với những gì mà nhóm nghiên cứu ở Redmond đã làm đƣợc. Riêng Blake, niềm vui thú lớn nhất của ông là dự án này đã mở ra tƣơng lai của việc tƣơng tác ngƣời – máy. GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  17. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 13 Dự án máy học này tiếp tục phát triển và đƣợc phát triển phần mềm bởi nhóm của Ben Kilgore. “Chúng tôi chia mọi thứ làm 3-4 vấn đề chính để giải quyết, mỗi vấn đề chính bao gồm khoảng 20 vấn đề nhỏ”, Kilgore nói. Trong vấn đề nhận dạng giọng nói, công việc rất nhiều, họ phải xây dựng các mô hình âm học riêng cho ngôn ngữ của từng nƣớc mà sản phẩm của họ có hỗ trợ. Một lần nữa, nguyên tắc phân nhỏ trong tƣ duy sáng tạo lại tiếp tục đƣợc ứng dụng trong việc giải quyết vấn đề. Tại thời điểm này, việc kiểm thử một cách khắt khe là vấn đề sống còn của phần cứng, phần mềm và game cho thiết bị đã bắt đầu đƣợc phát triển. Việc kiểm thử phần cứng bao gồm cho phép ngƣời chơi sử dụng trong các điều kiện nhiệt độ, độ ẩm và ánh sáng khác nhau. Nguyên tắc gây ứng suất sơ bộ đã đƣợc áp dụng trong quá trình kiểm thử phần cứng nhằm tránh những sai sót không mong muốn khi đặt thiết bị trong những môi trƣờng khác nhau. Raghu Murthi cho biết việc kiểm thử đƣợc thực hiện trong các lò hấp lớn để có thể đƣa ra các điều kiện nhiệt độ cao thấp khác nhau, việc kiểm thử hệ thống microphone và hệ thống âm thanh đƣợc thực hiện trong các tòa nhà không có tiếng vang và không có âm thanh ảnh hƣởng từ bên ngoài. Nhóm của Kipman và Tsunoda đã gặp Andreas – giám đốc sáng tạo của Rare, 39 tuổi với 15 năm kinh nghiệm làm việc tại Rare và đã trình bày với anh ta những gì họ đã làm đƣợc cho đến lúc này. Và khi Burton - giám đốc điều hành của Rare theo dõi màn hình với bộ xƣơng của chính mình đang di chuyển theo từng cử động của anh ta, Burton đã rất khiếp sợ. Anh ta nói: “Đó là khoảnh khắc Natal của chúng tôi, tôi đƣợc điều khiển bộ xƣơng của chính mình, thật là một điều kì diệu. Tôi đã ngồi tại văn phòng của Kudo cho đến khi anh ta đƣa cho chúng tôi bộ công cụ phát triển phần mềm cho thiết bị đó, tôi mới chịu rời khỏi.” Họ trở về và bắt đầu tạo bản mẫu cho các trò chơi. Andreas đã từng là một cầu thủ bóng đá bán chuyên nghiệp tại đội Crystal Palace và nhận thấy họ có thể phát triển trò chơi đá bóng trong 3 chiều. Anh ta cho rằng việc dắt bóng rất phức tạp và nếu họ làm đƣợc thì sẽ chứng minh đƣợc sức mạnh công nghệ của họ. Vậy là họ bắt đầu xây dựng bản mẫu cho trò chơi đá bóng và đã thành công. Vào Noel năm 2008, họ tập trung vào việc thực hiện 3 ý tƣởng chính và một trong số đó là thể thao. Andreas cho biết họ muốn cạnh tranh trực tiếp với Wii Sports. Do mục tiêu của họ là thị trƣờng khách hàng gia đình nên họ chọn các môn thể thao thông dụng nhất. Họ tạo bản mẫu cho khoảng 20 môn thể thao từ đua ngựa đến đua xe đạp trong đó tập trung nhất vẫn là trò chơi đá bóng. Các lập trình viên gặp phải những khó khăn nhất định khi chuyển môi trƣờng làm việc từ PC sang Xbox. Riêng đối với trò chơi đá bóng, việc theo dõi chuyển động chân thiếu độ chính xác và độ trễ bị tăng lên bởi vì những điển đó nằm ở vị trí thấp nhất của cơ thể. Vấn đề này mất 3 tháng để giải quyết. Andreas vui mừng: “Chƣa tới 2 năm, GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  18. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 14 chúng tôi đã có công nghệ mới, phần mềm mới, thiết bị mới và một định nghĩa khác khi nói đến trò chơi.” Một khu vực rông khoảng 36 hecta trong công viên Warwichshire đƣợc sử dụng để kiểm tra khả năng của Kinect. Trong ngày cuối cùng sửa lỗi trò chơi Kinect Sports, và trong một chuỗi các tòa nhà xung quanh văn phòng trung tâm, rất nhiều ngƣời trong số 200 nhân viên của công ty đang đổ mồ hôi một cách đúng nghĩa để bảo đảm rằng 10 môn thể thao tích hợp trong game này từ bowling đến boxing đã sẵn sàng để ra mắt vào ngày 04/11 tại Mỹ và 6 ngày sau tại Châu Âu. Tại phòng kiểm thử ở tầng dƣới, hai ngƣời phụ nữ trong trang phục thể thao đang chơi bóng bàn bằng cách quơ tay một cách điên cuồng trong không khí và một ngƣời phụ nữ khác đấm bốc một cách hăng hái vào không khí. Trên tầng trên, nơi mà các nhà phát triển ngồi cùng với các nhà thiết kế, lập trình viên và các nhà quản lý, khung cảnh hiện ra rất kỳ quái: một ngƣời đang chạy tại chỗ ngay cửa phòng của anh ta, một ngƣời la to “Goal kick!” và ngƣời thứ 3 hiện ra với các cử chỉ biểu hiện rằng anh ta đang cố gắng ném đi một cây lao trong tƣởng tƣợng. Burton cho biết đây là nơi mà chiếc Kinect đầu tiên bị hƣ. Đồng nghiệp của anh ta, Andreas cho biết: “Tòa nhà này là nơi mà bạn có thể tìm thấy nhiều Kinect nhất tại đất nƣớc này.” “Vào ngày 04/11, đó sẽ không phải là ngày mà Kinect dừng lại sự phát triển của nó, tất cả chỉ mới là sự bắt đầu.” GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  19. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 15 CHƯƠNG 3: KẾT LUẬN Kinect tuy là một sản phẩm hoàn toàn mang tính thƣơng mại nhƣng có thể xem nhƣ một biểu tƣợng cho sự sáng tạo và khả năng khám phá của con ngƣời trong thế kỷ 21. Nó đã mở ra một kỷ nguyên mới trong việc tƣơng tác ngƣời-máy và mở ra các hƣớng phát triển mới trong các lĩnh vực y tế, giáo dục, quốc phòng… Qua câu chuyện về sự hình thành và phát triển của Kinect, chúng ta nhận thấy mọi điều kỳ diệu đều xuất phát từ ý tƣởng. Một ý tƣởng tốt nếu đƣợc đầu tƣ một cách đúng đắn sẽ từng bƣớc đi đến thành công. Bên cạnh đó, việc nghiên cứu cần có sự hỗ trợ đắc lực của các cá nhân, tổ chức có cùng định hƣớng nghiên cứu nhằm đạt đƣợc một mục đích chung. Với Kinect, cá nhân tiêu biểu cho sự thành công của dự án này là Kipman, ông đã không ngừng tìm tòi, nghiên cứu và ứng dụng các giải pháp để có lời giải cuối cùng cho bài toán của mình. Câu chuyện cũng cho thấy việc bồi dƣỡng các kỹ năng tƣ duy sáng tạo là một bƣớc tiến nhằm thay đổi các lối mòn trong suy nghĩ và đƣa chúng ta đến gần với những giải pháp mới để giải quyết vấn đề một cách chính xác và hoàn thiện hơn. Chúng ta cũng thấy rõ sự thành công của dự án này cũng có một phần đóng góp không nhỏ về tiềm lực tài chính cũng nhƣ tiềm lực về công nghệ đã nghiên cứu trƣớc của Microsoft. Dựa trên đó, chúng ta phải hiểu rằng việc nghiên cứu trƣớc hết phải dựa trên cơ sở vững chắc về kiến thức cơ bản và khả năng nắm bắt công nghệ mới, tiềm lực tài chính cũng là một động lực thúc đẩy sự thành công của công tác nghiên cứu và sáng tạo. ----- o0o ----- GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
  20. Tiểu luận PPLSTKH: Quá trình hình thành và phát triển của Microsoft Kinect Trang 16 PHỤ LỤC (Các nguyên tắc tƣ duy sáng tạo đã đƣợc phân tích trong bài viết) 1) Nguyên tắc phân nhỏ:  Chia đối tƣợng thành các phần độc lập.  Làm đối tƣợng trở nên tháo lắp đƣợc.  Tăng mức độ phân nhỏ đối tƣợng. 2) Nguyên tắc kết hợp:  Kết hợp các đối tƣợng đồng nhất hoặc các đối tƣợng dùng cho các hoạt động kế cận.  Kết hợp về mặt thời gian các hoạt động đồng nhất hoặc kế cận. 3) Nguyên tắc gây ứng suất sơ bộ:  Gây ứng suất trƣớc với đối tƣợng để chống lại ứng suất không cho phép hoặc không mong muốn khi đối tƣợng làm việc ( hoặc gây ứng suất trƣớc để khi làm việc sẽ dùng ứng suất ngƣợc lại ). 4) Nguyên tắc giải “thiếu” hoặc “thừa”:  Nếu nhƣ khó nhận đƣợc 100 hiệu quả cần thiết, nên nhận ít hơn hoặc nhiều hơn “một chút”. Lúc đó bài toán có thể trở nên đơn giản hơn và dễ giải hơn. 5) Nguyên tắc tự phục vụ  Đối tƣợng phải tự phục vụ bằng cách thực hiện các thao tác phụ trợ, sửa chữa.  Sử dụng phế liệu, chát thải, năng lƣợng dƣ. 6) Nguyên tắc sao chép ( copy)  Thay vì sử dụng những cái không đƣợc phép, phức tạp, đắt tiền, không tiện lợi hoặc dễ vỡ, sử dụng bản sao.  Thay thế đối tƣợng hoặc hệ các đối tƣợng bằng bản sao quang học (ảnh, hình vẽ) với các tỷ lệ cần thiết.  Nếu không thể sử dụng bản sao quang học ở vùng biểu kiến ( vùng ánh sáng nhìn thấy đƣợc bằng mắt thƣờng ), chuyển sang sử dụng các bản sao hồng ngoại hoặc tử ngoại. 7) Nguyên tắc “rẻ” thay cho “đắt”: GVHD: GS. TS. Hoàng Văn Kiếm Học viên: Nguyễn Phƣơng Anh
nguon tai.lieu . vn