Xem mẫu

  1. Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) ỨNG DỤNG AI-VISION PHÁT HIỆN SỰ CỐ TRÊN BĂNG CHUYỀN TRONG NHÀ MÁY SẢN XUẤT THÔNG MINH Đinh Hữu Đức, Nguyễn Văn Thành, Đinh Triều Dƣơng, Hoàng Văn Xiêm Khoa Điện tử - Viễn thông, trƣờng Đại học Công nghệ, Đại học Quốc Gia Hà Nội Email: hducbkeee92@gmail.com, nvthanhch1@gmail.com, duongdt@vnu.edu.vn, xiemhoang@vnu.edu.vn Tóm tắt—Ngày càng có nhiều sự quan tâm đến của Deloittecho[5] cho thấy chỉ 5% các nhà sản xuất ý tưởng về các nhà máy thông minh với 92% giám Hoa Kỳ đã chuyển đổi hoàn toàn ít nhất một nhà máy đốc điều hành sản xuất tin rằng đây là con đường thông minh, trong khi khoảng 30% báo cáo các sáng của tương lai, với lượng dữ liệu đang tăng lên từng kiến nhà máy thông minh đang diễn ra. AI là rất quan ngày mô hình nhà máy thông minh là một môi trọng đối với việc kích hoạt nhà máy thông minh và trường nơi máy móc và thiết bị có thể cải thiện quy việc triển khai AI trong các hoạt động công nghiệp trình thông qua tự động hoá và tối ưu hoá, do đó cũng là một thách thức lớn [5]. cần tận dụng các giải pháp thông minh hơn để làm Hiện nay, nhiều máy móc đã vƣợt qua khả năng cho toàn bộ quy trình của nhà máy hiệu quả và có nhận diện, phân tích hình ảnh bằng mắt thƣờng của thể mở rộng. Cho đến thời điểm hiện tại thì công con ngƣời. Thị giác máy tính đƣợc xem là một trong nghệ trí tuệ nhân tạo (AI) đang mang đến cho các những lĩnh vực thuộc AI và mang lại nhiều ứng dụng nhà máy sản xuất một khả năng chưa từng có để thực tiễn cho cuộc sống của con ngƣời. Một số ứng đẩy mạnh năng lực sản xuất, tối ưu hóa chuỗi cung dụng phổ biến trong đời sống con ngƣời đƣợc nhiều ứng và tăng tốc độ nghiên cứu và phát triển, nhưng ngƣời biết đến nhƣ nhận diện giao thông [7], nhận thực tế thì chưa có nhiều nghiên cứu và ứng dụng diện biển số xe, nhận diện mặt ngƣời hoặc nhận diện AI trong nhà máy sản xuất thông minh. Để giải các đồ vật, loài cây, hoa [6]. quyết việc đưa ra các giải pháp thông minh hơn Trong bài viết này chúng tôi xin đề xuất một trong nhà máy sản xuất, trong bài báo này chúng nghiên cứu về việc ứng dụng AI-Vision trong việc tôi đề xuất hệ thống ứng dụng AI – Vision để giám nhận diện và cảnh báo tình trạng sản phẩm trên dây sát và phát hiện với khoảng cách sản phẩm nằm sát chuyền sản xuất điện thoại di động trong nhà máy mép băng chuyền
  2. Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) liệu chuẩn và đa dạng, do đó phƣơng pháp đƣợc đề chuyển trên băng tải sau đó đƣợc camera chụp và ghi xuất này của chúng tôi hoàn toàn hứa hẹn tính chính lại gửi về cho PC thông qua hệ thống truyền thông xác cao do mô hình học máy có đƣợc dựa trên bộ dữ TCP/IP bởi các dây kết nối, tại đây máy tính có nhiệm liệu rất dồi dào trong quá trình sản xuất của nhà máy vụ là trung tâm điều khiển tiếp nhận hình ảnh từ vì vậy việc đào tạo trở nên rất dễ dàng và khả năng camera gửi về, xử lý, phát hiện và gán nhãn cho sản phát hiện lỗi phát sinh đạt hiệu quả cao nhất. phẩm điện thoại đã đặt OK hay NG tƣơng ứng trên băng tải. Phƣơng pháp và thuật toán để xử lý hình ảnh phân loại sản phẩm đƣợc sử dụng trong bài báo này dựa vào hai thuật toán SVM và CNN đƣợc triển khai trên ngôn ngữ python và thƣ viện xử lý ảnh OpenCV. Dƣới đây là một số thông số chi tiết trong thành phần hệ thống vision trong phƣơng án đƣợc đề xuất:  Camera : Basler Ace 2 Pro – 10 Megapixel – 60 fps (khung hình trên giây)  PC : Intel® Core™ i7-4800MQ @2.7 GHz , RAM 4 GB, hệ điều hành Window 10, 64-bit  Môi trường kiểm thử: Anacoda 3 - python 3, openCV 2  Băng chuyền : Kích thƣớc 500x1600mm  Dây kết nối. Hình 2: Mô tả hệ thống Hình 1: Mô tả hệ thống ứng dụng AI-Vision vào việc quản lý và cảnh báo các trường hợp gây lỗi sản phẩm trên băng chuyền. B. Mô tả cách xác định sản phẩm Trong phần tiếp theo của bài báo này, chúng tôi trình bày về đề xuất hệ thống ứng dụng AI-Vision vào phát hiện lỗi trên băng tải (phần II) và các phƣơng pháp AI để đào tạo sẽ đƣợc giới thiệu trong phần III. Tiếp đó, phần IV sẽ trình bày về kết quả thực nghiệm thực tế và các phân tích đánh giá, đây là cơ sở cho phần kết luận chúng tôi nêu trong phần V. II. ĐỀ XUẤT HỆ THỐNG A. Xây dựng hệ thống Hình 3: Mô tả trạng thái sản phẩm [OK] [NG] Để quan sát xác định đƣợc lỗi có phát sinh đối với sản phẩm hay không, trong nghiên cứu của chúng tôi Cách tiếp cận đƣợc đề xuất trong nghiên cứu của đề xuất sử dụng hệ thống AI-vision (hình 2), cách tiếp bài báo này để nhận biết sản phẩm điện thoại có lỗi hay cận này đƣợc thực hiện để phân loại sản phẩm mà không đƣợc xử lý qua một PC nhƣ thể thiện trong hình không làm thay đổi cấu trúc của dây chuyền sản xuất 2. Tại đây PC sẽ chứa tất cả tập dữ liệu đào tạo và kiểm thực tế. Hệ thống vision của chúng tôi đƣợc đƣợc xây tra cùng với chƣơng trình phân loại để nhận hình ảnh dựng bao gồm một camera có độ phân giải cao: 10 gửi về, các hình ảnh sẽ đƣợc thay đổi với cùng kích megapixel với tốc độ xử lý 60 fps (khung hình trên thƣớc và đƣợc xử lý để đƣa ra phán định. Các lỗi đƣợc giây) và một nguồn sáng từ đèn Led để đảm bảo độ xem xét trong phân loại ở đây đƣợc chia thành 2 loại sáng không bị biến đổi nhiều trong quá trính quan sát chính : OK (All correct) và NG (Not good), trong loại sản phẩm. Mỗi panel (sản phẩm điện thoại) đƣợc vận sản phẩm [NG] gồm 2 loại lỗi điện thoại đặt sát mép ISBN 978-604-80-5958-3 329
  3. Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) băng tải hoặc điện thoại bị đặt xếp chồng lên nhau chi Kết hợp hai điều kiện trên, có y(w.x + b)>= 1. tiết thể hiện trong hình 3. Sản phẩm OK là sản phẩm Khoảng cách của siêu phẳng và đến là . không nằm sát mép của băng tải với khoảng cách >8mm và không bị đặt chồng lấn tác động vào nhau. Cần tìm siêu phẳng với lề lớn nhất, là giải bài toán Cách phân loại sản phẩm [OK] hay [NG] này dựa theo tối ƣu tìm w và b sao cho: đạt cực đại với ràng kinh nghiệm và dữ liệu chạy trực tiếp trong dây truyền buộc (w. + b) >= 1. Tƣơng đƣơng với bài toán cực nhà máy dựa trên đó để thiết lập tập dữ liệu đào tạo. Các sản phẩm OK sau đó sẽ tiếp tục đƣợc robot gắp đi, tiểu hóa: với điều kiện: (w. + b) ≥ 1, mọi còn đối với trƣờng hợp phát sinh NG hệ thống sẽ dừng i=1…r. Lời giải cho bài toán tối ƣu này là cực tiểu hóa và cảnh báo để đƣợc khắc phục kịp thời. hàm Lagrange: III. CÁC PHƢƠNG PHÁP AI-VISION L(w,b,α)= | | ∑ α (| | ) A. Phương pháp sử dụng thuật toán SVM SVM là một giải thuật máy học dựa trên lý thuyết Trong đó, α là các hệ số Lagrange, α≥0. học thống kê do Vapnik and Chervonenkis (1974), Lời giải tìm siêu phẳng tối ƣu trên có thể mở rộng Vapnik (1999) xây dựng. Bài toán cơ bản của SVM là trong trƣờng hợp dữ liệu không thể tách rời tuyến tính bài toán phân loại hai lớp: Cho trƣớc r điểm trong bằng cách ánh xạ dữ liệu vào một không gian có số không gian n chiều (mỗi điểm thuộc vào một lớp kí chiều lớn hơn bằng cách sử dụng một hàm nhân K hiệu là +1 hoặc –1), mục đích của giải thuật SVM là (kernel). Một số hàm nhân thƣờng dùng nhƣ: tìm một siêu phẳng (hyperplane) phân hoạch tối ƣu - Hàm tuyến tính có dạng K(x,y)=x.y cho phép chia các điểm này thành hai phần sao cho - Hàm đa thức có dạng K(x.y)= ) các điểm cùng một lớp nằm về một phía với siêu - Hàm RBF (Radial Basis Function) có dạng phẳng này [8]. Hình 4 cho một minh họa phân lớp với SVM trong mặt phẳng. K(x, y) = Với khả năng vƣợt trội của SVM về tính hiệu quả, độ chính xác, khả năng xử lý các bộ dữ liệu một cách linh hoạt, việc sử dụng máy vectơ hỗ trợ SVM đã và đang là sự lựa chọn tối ƣu nhất trong việc giải quyết các bài toán phân loại/dự báo trong một số các ngành khoa học [9]. Bài viết này áp dụng phƣơng pháp phân lớp sử dụng máy vectơ hỗ trợ SVM cho bài toán cảnh báo trên dây chuyền sản xuất điện thoại. Hình 4: Ví dụ minh họa phân lớp với SVM. Xét tập r mẫu huấn luyện {( , ), ( , ),… ( , )}. Trong đó là một vector đầu vào đƣợc biểu Hình 5: Áp dụng thuật toán SVM trong việc cảnh báo diễn trong không gian X  , là một nhãn lớp; các trường hợp sản phẩm lỗi trên băng chuyền  1,1. Siêu phẳng tối ƣu phân tập dữ liệu này thành hai lớp là siêu phẳng có thể tách rời dữ liệu  Bƣớc 1: Đọc dữ liệu ảnh. thành hai lớp riêng biệt với lề (margin) lớn nhất. Tức  Bƣớc 2: Sử dụng thuật toán HOG (Histogram Of là, cần tìm siêu phẳng : y = w.x + b = 0 và hai siêu Oriented Gradient). Thuật toán này sẽ tạo ra các phẳng , hỗ trợ song song với và có cùng bộ mô tả đặc trƣng nhằm mục đích phát hiện vật khoảng cách đến . Với điều kiện không có phần tử thể. Từ một bức ảnh, ta sẽ lấy ra 2 ma trận quan nào của tập mẫu nằm giữa và , khi đó: trọng giúp lƣu thông tin ảnh đó là độ lớn gradient : w.x + b >= +1 với y = +1 (gradient magnitute) và phƣơng của gradient (gradient orientation). Bằng cách kết hợp 2 thông : w.x + b >= -1 với y = -1 tin này vào một biểu đồ phân phối histogram, trong đó độ lớn gradient đƣợc đếm theo các nhóm bins của phƣơng gradient. Cuối cùng ta sẽ thu ISBN 978-604-80-5958-3 330
  4. Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) đƣợc véc tơ đặc trƣng HOG đại diện cho histogram [10]. OK (All correct) NG (Not good) Hình 6: Histogram Of Oriented Gradient  Bƣớc 3: Áp dụng thuật toán SVM để phân loại ảnh trƣờng hợp NG và OK.  Bƣớc 4: Gán Label. B. Phương pháp CNN Convolutional Neural Network (CNNs – Mạng nơ-ron Hình 7: Mô hình CNN tích chập) [11] là một trong những mô hình Deep Learning tiên tiến, giúp cho chúng ta xây dựng đƣợc Mô hình CNN mà chúng tôi áp dụng gồm có 4 loại những hệ thống thông minh với độ chính xác cao. Vì layers [12]: vậy trong bài toán nhận diện ảnh này chúng tôi áp dụng một mô hình CNN vào để nhận biết việc điện Conv+Relu: Áp dụng cho layer Ci (i=1,2). Phép tích thoại đặt [OK] hay [NG] trên băng tải hay không, cấu chập trƣớc tiên đƣợc thực hiện để tạo ra 2(i + 5) bản đồ trúc mô hình CNN đƣợc thể hiện trong hình 6. Trong đối tƣợng (feature maps). Sau đó hàm kích hoạt Relu mô hình này hình ảnh đầu vào đƣợc tiền xử lý thay đổi (rectified linear unit) đƣợc sử dụng cho tính phi tuyến. đƣa về cùng một kích thƣớc 64*64 pixel sau đó đƣợc Max pooling: Mạng sử dụng layer max pooling 2*2 đƣa vào 2 lớp tích chập với số bộ lọc lần lƣợt là 64 và với bƣớc nhảy (stride) là 1, dùng để trích xuất mẫu của 128 có kích thƣớc kernel 3*3 và bƣớc nhảy là 1, cùng bản đồ đối tƣợng. với đó hàm kích hoạt Relu đƣợc sử dụng cho tính phi Full Connection: Layer này chúng tôi áp dụng hàm tuyến của mạng, tiếp đó hàm Maxpooling 2*2 đƣợc áp Flatten và Dense để kết nối toàn bộ các node trong đầu dụng để lấy đặc điểm nổi bật nhất và giảm kích thƣớc ra của mạng. chiều dài, chiều rộng đi một nửa. Sau đó các node của Output layer: Layer này kết nối hoàn toàn với layer mạng sẽ đƣợc kết nối toàn bộ và làm phẳng thông qua trƣớc đó (Layer full connection) và xuất ra vector 2*1 hàm Flatten và Dense của lớp Full connection, cuối là xác xuất phân loại của đầu ra sử dụng hàm softmax. cùng ở lớp ouput chúng tôi sử dụng hàm softmax để dự đoán xác xuất các node tại đầu ra. IV. KẾT QUẢ VÀ ĐÁNH GIÁ Để đánh giá độ chính xác của các mô hình chúng tôi đã thực hiện việc mô phỏng và kiểm thử trên bộ dữ liệu gồm 350 chụp thực tế chia làm 2 tập training và testing trong đó dữ liệu training gồm 140 ảnh OK và ISBN 978-604-80-5958-3 331
  5. Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) 100 ảnh NG và tập testing gồm 110 ảnh với tỉ lệ suất thiết bị tốt trong các dây chuyền công nghiệp hiện OK/NG là 50/60. Số lƣợng cụ thể đƣợc thể hiện ở đại và nghiêm ngặt. bảng 1. Bảng 1: Dữ liệu đánh giá TÀI LIỆU THAM KHẢO Hạng mục Phân loại Training Testing Total [1] PhilippOsterrieder, LukasBudde, ThomasFriedli, “The smart factory as a key construct of industry 4.0: A systematic OK 140 50 190 literature review” International Journal of Production Số lƣợng Economics, Volume 221, March 2020, 107476 NG 100 60 160 ảnh [2] Petrillo, A.; De Felice, F.; Cioffi, R.; Zomparelli, “Digital Total 240 110 350 Transformation in Smart Manufacturing”, IntechOpen: London, UK, 2018; pp. 1–20 Bảng 2 tổng hợp dữ liệu kết quả độ chính xác của [3] Michele Calì “Smart Manufacturing Technology” Department of Electrical, Electronics and Computer Engineering (DIEEI), các model trong các phƣơng pháp AI đƣợc sử dụng. University of Catania, 95124 Catania, Italy, Appl. Chỉ với tập dự liệu training không quá lớn 350 ảnh Sci. 2021, 11(17), 8202 (140 ảnh OK và 100 ảnh NG) nhƣng độ chính xác đã [4] Chen, B., Wan, J., Shu, L., Li, P., Mukherjee, M., & Yin, B. đạt khá cao với Model SVM (kernel=”rbf”) đạt (2018). “Smart Factory of Industry 4.0: Key Technologies, 91,81% và model CNN 91,81%. Điều này hứa hẹn tỷ Application Case, and Challenges”. IEEE Access, 6, 6505– 6519. doi:10.1109/access.2017.2783682 lệ chính xác có thể cải thiện hơn rất nhiều nếu tập dữ [5] Frank Herrmann. “The Smart Factory and Its Risks”. OTH liệu đƣợc training đủ lớn và đang dạng hơn khi đƣợc Regensburg, Innovation and Competence Centre for lấy từ trong nhà máy. Hơn nữa với tập dữ liệu đã có ở Production Logistics and Factory Planning, P.O. Box 120327, trên thì thời gian huấn luyện khá nhanh trong khoảng 93025 Regensburg, Germany, Systems 2018, 6(4), 38; từ 23s-25s đối với có model SVM và cao nhất là 64s https://doi.org/10.3390/systems6040038 đối với model CNN thêm vào đó thời gian xử lý dự [6] Yu Sun, Yuan Liu, Guan Wang, and Haiyan Zhang “Deep Learning for Plant Identification in Natural Environment” đoán xác định hình ảnh chỉ trong khoảng 0.1-0.2s 1School of Information Science and Technology, Beijing (bảng 3) nên hoàn toàn đáp ứng đƣợc trong dây Forestry University, Beijing 100083, China 22 May 2017 chuyền khi sản xuất tự động liên tục của nhà máy. [7] MihainDaniel RADU, Ilona Madalina COSTEA, Valentin Alexandru STAN “Automatic Traffic Sign Recognition Artificial Inteligence - Deep Learning Algorithm” 25-27 June Bảng 2: Độ chính xác của các mô hình (%) 2020 Số lƣợng Dự đoán Độ chính [8] Wun-Hwa Chen, Sheng-Hsun Hsu∗, Hwang-Pin Shen, Phƣơng pháp kiểm thử đúng xác (%) “Application of SVM and ANN for intrusion detection” SVM(kernel="linear") 110 98 89.09% National Taiwan University, No. 1, Section 4, Roosevelt Road, Taipei 106, Taiwan Accepted 29 March 2004 SVM(kernel="poly") 110 99 90% [9] Durgesh K. Srivastava, Lekha Bhambh, “Data classification SVM(kernel="rbf") 110 101 91.81% using support vector machine” Journal of Theoretical and SVM(kernel="sigmoid") 110 60 54.54% Applied Information Technology 12(1):1-7, february 2010. CNN (20 epochs) 110 101 91.81% [10] N. Dalal and B. Triggs. ”Histograms of oriented gradients for human detection” 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05). 20-25 Bảng 3: Thời gian xử lý June 2005 Thời gian Thời gian dự [11] Saad Albawi, Tareq Abed Mohammed, Saad Al-Zawi, Phƣơng pháp (Tiền xử lý - đoán “Understanding of a convolutional neural network”, 2017 Training) (second/Image) International Conference on Engineering and Technology SVM(kernel="linear") 24.27 s 0.123 s (ICET), DOI: 10.1109/ICEngTechnol.2017.8308186 [12] Shyava Tripathi, Rishi Kumar, “Image Classification using SVM(kernel="poly") 25.29 s 0.132 s small Convolutional Neural Network”, 2019 9th International SVM(kernel="rbf") 23.74 s 0.113 s Conference on Cloud Computing, Data Science & Engineering SVM(kernel="sigmoid") 24.92 s 0.127 s (Confluence), DOI: 10.1109/CONFLUENCE.2019.8776982 CNN (20 epochs) 64.03 s 0.105 s V. KẾT LUẬN Trong bài viết này chúng tôi đã nghiên cứu một số phƣơng pháp (mô hình SVM, CNN) để áp dụng xác định phát hiện điện thoại đặt OK, NG trên băng truyền trong nhà máy. Qua kết quả thực nghiệm đã khẳng định tính đúng đắn của phƣơng pháp đƣợc đề xuất, đây là một phƣơng pháp cải tiến có khả năng áp dụng thực tế cao và đồng loạt với độ chính xác đáng tin cậy rất hữu ích cho việc đảm bảo chất lƣợng sản phẩm và hiệu ISBN 978-604-80-5958-3 332
nguon tai.lieu . vn