Xem mẫu

  1. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" Machine Learning VÀ ỨNG DỤNG TRONG XẾP HẠNG TÍN DỤNG KHÁCH HÀNG CÁ NHÂN TẠI CÁC NGÂN HÀNG THƯƠNG MẠI Việt Nam PGS. TS Nguyễn Hữu Tài Trường Đại học Kinh tế Quốc dân NCS. ThS. Đặng Hương Giang1 Trường Đại học Kinh tế Kỹ Thuật Công nghiệp Tóm tắt Hệ thống phần mềm chấm điểm xếp hạng tín dụng (XHTD) khách hàng cá nhân hiện nay của các ngân hàng thương mại (NHTM) mới chỉ dừng lại ở mức đưa dữ liệu, thông tin khách hàng vào hệ thống và trả lại kết quả là điểm XHTD của khách hỗ trợ cán bộ tín dụng ra quyết định. Tuy nhiên đây là hình thức đánh giá cứng nhắc, tuy mức độ chính xác cao nhưng vẫn có sai số nhất định. Sẽ thế nào nếu một khách hàng đến xin vay tại NH này và bị từ chối vì điểm XHTD thấp nhưng được một NH khác cho vay và là một khách hàng tốt, luôn trả nợ đúng hạn? Hay ngược lại, một khách hàng có điểm XHTD tốt được ngân hàng cho vay nhưng sau đó lại trở thành một khoản nợ xấu với ngân hàng. Đây là 2 trường hợp thể hiện sự bất cập của phần mềm chấm điểm tín dụng hiện tại của các NHTM. Câu hỏi đặt ra là liệu có thể nâng cao độ chính xác trong đánh giá khách hàng không? Làm thế nào để không bỏ lỡ các khách hàng tiềm năng hoặc loại bỏ những khách hàng không thực sự tốt như thể hiện bên ngoài? Hệ thống Machine Learning với nền tảng Big Data có thể giải quyết vấn đề này. Từ khóa: Machine Learning, ngân hàng thương mại, xếp hạng tín dụng, Big Data Machine Learning applications in personal credit ratings of Vietnam Commercial Banks Abstract With current credit score software system for individual clients of commercial banks, it is only set up to input data and customer’s information into the system and the returned result is customer’s credit score which help loan officer to make lending decision. However, this is a rigid, inflexible evaluation way. Although the current system has high accuracy, it still has errors in measurement. What happens if a customer applies a loan at a bank 1 Email: danghuonggiang1902@gmail.com 87
  2. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" and his/her loan application is rejected because of low credit score but that same person and loan application is approved by other bank and become a customer with good credit and always pay on time. Or in an opposite situation, a customer with good credit score is qualified for a loan but that loan is becoming a bad credit loan for the bank. These are 2 situations showing the failure of current credit score software system at commercial banks. Is there any way to increase the accuracy in evaluating customers? How do we avoid missing potential customers or prevent and get rid of customers that are not as good as they are showing. The Machine Learning system with Big Data base can help solving this problem. Keywords: Machine Learning, Commecial bank, credit ratings, Big Data, Artificial intelligence. 1. Lời mở đầu Những năm gần đây, sau khi phải đối mặt với những rủi ro lớn gây tổn thất cho ngân hàng, đặc biệt là rủi ro tín dụng xảy ra với tần suất khá cao, giá trị lớn, các ngân hàng thương mại Việt Nam đã chú trọng nhiều hơn đến hoạt động quản trị rủi ro tín dụng trong kinh doanh và dần tiếp cận tới các chuẩn mực quản trị rủi ro và đánh giá tín dụng (Credit Scoring) theo Hiệp ước quốc tế Basel II vào hoạt động quản trị rủi ro của mình. Đây được cho là hướng đi đúng của các ngân hàng khi một mặt, họ vẫn có thể hút khách hàng qua những sản phẩm, dịch vụ hấp dẫn, mặt khác, họ cần trang bị cho mình những công cụ, phương pháp đánh giá khả năng chi, trả của mỗi khách hàng, qua đó dễ dàng đưa ra quyết định cấp vốn. Cùng với sự phát triển của cuộc Cách mạng công nghiệp 4.0, những tiến bộ trong khoa học công nghệ đã cho phép các đơn vị tài chính, ngân hàng, giảm rủi ro cho vay qua việc phân tích nhiều dữ liệu khác nhau về khách hàng. Bằng các kỹ thuật thống kê, Machine Learning, các dữ liệu này được phân tích và cô đọng đưa ra một giá trị duy nhất được gọi là điểm tín dụng thể hiện tính rủi ro cho vay. Điểm tín dụng càng cao, mức độ tín dụng của khách hàng càng lớn. Đánh giá tín dụng có thể áp dụng Trí tuệ nhân tạo (Artificial Intelligence), dựa trên mô hình tiên đoán, đánh giá khả năng chi trả món vay của khách hàng: đúng hạn, trễ hạn hoặc không đủ khả năng thanh toán. Lợi ích lớn nhất của đánh giá tín dụng là giúp các công ty tài chính, ngân hàng đưa ra quyết định nhanh chóng, hiệu quả trong việc chấp nhận hoặc từ chối món vay của khách hàng, tăng hoặc giảm giá trị khoản vay, lãi suất, kỳ hạn. Nhờ tính chính xác và tốc độ đưa ra quyết định nhanh như vậy, đã khiến cho đánh giá tín dụng trở thành nền tảng của quản trị rủi ro trong các lĩnh vực như ngân hàng, viễn thông, bảo hiểm và bán lẻ. 88
  3. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" 2. Tổng quan về xếp hạng tín dụng khách hàng cá nhân của NHTM 2.1. XHTD và vai trò của XHTD khách hàng cá nhân XHTD là việc đưa ra nhận định về mức độ tín dụng đối với trách nhiệm tài chính; hoặc đánh giá mức độ rủi ro tín dụng phụ thuộc các yếu tố bao gồm năng lực đáp ứng các cam kết tài chính, khả năng dễ bị vỡ nợ khi các điều kiện kinh doanh thay đổi, ý thức và thiện chí trả nợ của người đi vay. Hệ thống XHTD của NHTM nhằm cung cấp những dự đoán khả năng xảy ra rủi ro tín dụng có thể được hiểu là sự khác biệt về mặt kinh tế giữa những gì mà người đi vay hứa thanh toán với những gì mà NHTM thực sự nhận được. Khái niệm rủi ro được xét đến ở đây là một sự không chắc chắn hay một tình trạng bất ổn có thể ước đoán được xác suất xảy ra. Khái niệm tín dụng được hiểu là quan hệ chuyển giao quyền sử dụng vốn giữa người cho vay và người đi vay trên nguyên tắc có hoàn trả. Hệ thống XHTD giúp NHTM quản trị rủi ro tín dụng bằng phương pháp tiên tiến, giúp kiểm soát mức độ tín nhiệm khách hàng, thiết lập mức lãi suất cho vay phù hợp với dự báo khả năng thất bại của từng nhóm khách hàng. NHTM có thể đánh giá hiệu quả danh mục cho vay thông qua sự giám sát sự thay đổi dư nợ và phân loại nợ trong từng nhóm khách hàng đã được xếp hạng, qua đó điều chỉnh danh mục theo hướng ưu tiên nguồn lực vào những nhóm khách hàng an toàn. Hệ thống XHTD là một công cụ quan trọng để tăng cường tính khách quan, nâng cao chất lượng và hiệu quả của hoạt động tín dụng. Mô hình tính điểm tín dụng là phương pháp lượng hóa mức độ rủi ro thông qua đánh giá thang điểm, các chỉ tiêu đánh giá trong những mô hình chấm điểm được áp dụng khác nhau đối với từng loại khách hàng. Khái niệm hiện đại về XHTD được tập trung vào các nguyên tắc chủ yếu bao gồm phân tích tín nhiệm trên cơ sở ý thức và thiện chí trả nợ của người đi vay và từng khoản vay; đánh giá rủi ro dài hạn dựa trên ảnh hưởng của chu kỳ kinh doanh và xu hướng khả năng trả nợ trong tương lai; đánh giá rủi ro toàn diện và thống nhất dựa vào hệ thống ký hiệu xếp hạng. Trong phân tích XHTD cần thiết sử dụng phân tích định tính để bổ sung cho những phân tích định lượng. Các dữ liệu định lượng là những quan sát được đo bằng số, các quan sát không thể đo lường bằng số được xếp vào dữ liệu định tính. Các chỉ tiêu phân tích có thể thay đổi phù hợp với sự thay đổi của trình độ công nghệ và yêu cầu quản trị rủi ro. Việc thu thập số liệu để đưa vào mô hình XHTD cần được thực hiện một cách khách quan, linh động. Sử dụng cùng lúc nhiều nguồn thông tin để có được cái nhìn toàn diện về tình hình tài chính của khách hàng vay. 89
  4. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" 2.2. Một số mô hình XHTD khách hàng cá nhân Nghiên cứu của Stefanie Kleimeier về mô hình điểm số tín dụng cá nhân áp dụng cho các ngân hàng bán lẻ tại Việt Nam Stafanie Kleimeier đã tiến hành nghiên cứu chi tiết nguồn số liệu được tổng hợp từ các NHTM tại Việt Nam theo hai mươi hai biến số bao gồm độ tuổi, thu nhập, trình độ học vấn, nghề nghiệp, thời gian công tác, tình trạng cư ngụ, giới tính, tình trạng hôn nhân, mục đích vay... để xác định mức ảnh hưởng của các biến số này đến rủi ro tín dụng và qua đó thiết lập một mô hình điểm số tín dụng cá nhân áp dụng cho các ngân hàng bán lẻ tại Việt Nam. Nghiên cứu của Stefanie Kleimeier đã xây dựng mô hình chấm điểm tín dụng cá nhân gồm hai phần là chấm điểm nhân thân và năng lực trả nợ, chấm điểm quan hệ với ngân hàng như trình bày trong Bảng 1. Căn cứ vào tổng điểm đạt được để xếp loại theo mười mức giảm dần từ Aaa đến D như trình bày trong Bảng 2. Tuy nhiên, công trình nghiên cứu này không đưa ra cách tính điểm cụ thể cho từng chỉ tiêu, để vận dụng được mô hình đòi hỏi các NHTM phải thiết lập thang điểm cho từng chỉ tiêu đánh giá phù hợp với thực trạng và hệ thống cơ sở dữ liệu cá nhân tại ngân hảng mình. Bảng 1: Ký hiệu XHTD cá nhân theo Stefanie Kleimeier Điểm Xếp hạng Ý nghĩa xếp hạng > 400 Aaa Cho vay tối đa theo đề nghị của người vay 351 - 400 Aa 301 - 350 A 251 - 300 Bbb Cho vay theo tài sản đảm bảo 201 - 250 Bb Cho vay theo tài sản đảm bảo và đánh giá đơn vay vốn 151 - 200 B Yêu cầu đánh giá thận trọng đơn vay vốn và có tài sản đảm bảo đầy đủ 101 - 150 Ccc Từ chối cho vay 51 - 100 Cc 0 - 50 C 0 D Nguồn: Dinh Thi Huyen Thanh & Stafanie Kleimeier, 2006. Credit Scoring for Vietnam’s Retail Banking Market 90
  5. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" Bảng 2: Chỉ tiêu chấm điểm XHTD cá nhân theo mô hình Stefanie Kleimeier Bước 1: Chấm điểm nhân thân và năng lực trả nợ Tuổi 18 - 25 tuổi 26 - 40 tuổi 40 - 60 tuổi > 60 tuổi Trình độ học vấn Sau đại học Đại học, Cao đẳng Trung học Dưới trung học Nghề nghiệp Chuyên môn Giúp việc Kinh doanh Hưu trí Thời gian công tác < 0,5 năm 0,5 - 1 năm 1 - 5 năm > 5 năm Thời gian làm công việc hiện tại < 0,5 năm 0,5 - 1 năm 1 - 5 năm > 5 năm Tình trạng cư trú Nhà riêng Nhà thuê Sống cùng gia đình Khác Số người phụ thuộc Độc thân 1 - 3 người 3 - 5 người > 5 người Thu nhập hàng năm < 12 triệu đồng 12 - 36 triệu đồng 36 - 120 triệu đồng > 120 triệu đồng Thu nhập gia đình hàng năm < 24 triệu đồng 24 - 72 triệu đồng 72 - 240 triệu đồng > 240 triệu đồng Bước 2: Chấm điểm quan hệ với ngân hàng Thực hiện cam kết với ngân Khách hàng mới Chưa bao giờ trễ Có trễ hạn ít hơn 30 Có trễ hạn trên hàng (ngắn hạn) hạn ngày 30 ngày Thực hiện cam kết với ngân Khách hàng mới Chưa bao giờ trễ Có trễ hạn trong 2 Có trễ hạn trước 2 hàng (dài hạn) hạn năm gần đây năm gần đây Tổng giá trị khoản vay chưa trả < 100 triệu đồng 100 - 500 triệu 500 triệu đồng - 1 tỷ > 1 tỷ đồng đồng đồng Các dịch vụ khác đang sử dụng Tiền gửi tiết kiệm Thẻ tín dụng Tiền gửi tiết kiệm và Không thẻ tín dụng Số dư bình quân tài khoản tiết < 20 triệu đồng 20 - 100 triệu đồng 100 - 500 triệu đồng > 500 triệu đồng kiệm trong năm trước đây Nguồn: Dinh Thi Huyen Thanh & Stafanie Kleimeier, 2006. Credit Scoring for Vietnam’s Retail Banking Market Mô hình điểm số tín dụng cá nhân của FICO Điểm số tín dụng (Credit score) cá nhân là một phương tiện kiểm soát tín dụng được gán cho mỗi cá nhân tại một số nước phát triển giúp tổ chức tín dụng ước 20 lượng mức rủi ro khi cho vay. Điểm tín dụng càng thấp thì mức rủi ro của nhà cho vay càng cao. Fair Isaac Corp đã xây dựng mô hình điểm số tín dụng FICO thấp nhất là 300 và cao nhất là 850 áp dụng cho cá nhân dựa vào tỷ trọng của 5 chỉ số phân tích được trình bày trong Bảng 3. 91
  6. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" Bảng 3: Tỷ trọng các tiêu chí đánh giá trong mô hình điểm số tín dụng FICO Tỷ trọng Tiêu chí đánh giá 35% Lịch sử trả nợ (Payment history): Thời gian trễ hạn càng dài và số tiền trễ hạn càng cao thì điểm số tín dụng càng thấp 30% Dư nợ tại các tổ chức tín dụng (Amount owed): Nợ quá nhiều so với mức cho phép đặc biệt là đối với thẻ tín dụng sẽ làm giảm điểm số tín dụng 15% Độ dài của lịch sử tín dụng (Length of credit history): Thông tin càng nhiều năm càng đáng tin và điểm số tín dụng sẽ càng cao 10% Số lần vay nợ mới (new credit): Vay nợ thường xuyên bị xem là dấu hiệu có khó khăn về tài chính nên điểm số tín dụng càng thấp 10% Các loại tín dụng được sử dụng (Types of credit used): Các loại nợ khác nhau sẽ được tính điểm số tín dụng khác nhau Nguồn http://en.wikipedia.org Mô hình điểm số tín dụng FICO được áp dụng rộng rãi ở Mỹ do các thông tin liên quan đến tình trạng tín dụng của mọi người có thể được ngân hàng rà soát dễ dàng qua các công ty dữ liệu tín dụng (Credit reporting companies). Công ty dữ liệu tín dụng thực hiện ghi nhận và cập nhật thông tin từ các tổ chức tín dụng, 21 phân tích và cho điểm đối với từng người. Theo mô hình điểm số tín dụng của FICO thì người có điểm số tín dụng ở mức 700 được xem là tốt, đối với cá nhân có điểm số tín dụng thấp hơn 620 sẽ có thể bị ngân hàng e ngại khi xét cho vay. 3. Machine Learning và ứng dụng trong xếp hạng tín dụng khách hàng cá nhân của NHTM Với hệ thống phần mềm chấm điểm XHTD khách hàng cá nhân hiện nay của các NHTM mới chỉ dừng lại ở mức đưa dữ liệu, thông tin khách hàng vào hệ thống và trả lại kết quả là điểm XHTD của khách hỗ trợ cán bộ tín dụng ra quyết định. Tuy nhiên đây là hình thức đánh giá cứng nhắc, tuy mức độ chính xác cao nhưng vẫn có sai số nhất định. Sẽ thế nào nếu một khách hàng đến xin vay tại NH này và bị từ chối vì điểm XHTD thấp nhưng được một NH khác cho vay và là một khách hàng tốt, luôn trả nợ đúng hạn? Hay ngược lại, một khách hàng có điểm XHTD tốt được ngân hàng cho vay nhưng sau đó lại trở thành một khoản nợ xấu với ngân hàng. Đây là 2 case thể hiện sự bất cập của phần mềm chấm điểm tín dụng hiện tại của các NHTM. Với phần mềm hiện tại có thể giải thích mức độ dự báo khả năng trả nợ trong tương lai của khách hàng không thể chính xác hoàn toàn và ngân hàng chấp nhận sai số đó. Câu hỏi đặt ra là liệu có thể nâng cao 92
  7. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" độ chính xác trong đánh giá khách hàng không? Làm thế nào để không bỏ lỡ các khách hàng tiềm năng hoặc loại bỏ những khách hàng không thực sự tốt như thể hiện bên ngoài? Hệ thống Machine Learning với nền tảng Big Data có thể giải quyết vấn đề này. 3.1. Tổng quan về Trí tuệ nhân tạo, Machine Learning và Big Data Trí tuệ nhân tạo hay trí thông minh nhân tạo (tiếng Anh: artificial intelligence hay  machine intelligence, (AI) là trí tuệ được biểu diễn bởi bất cứ một hệ thống nhân tạo nào. Thuật ngữ này thường dùng để nói đến các máy tính có mục đích không nhất định và ngành khoa học nghiên cứu về các lý thuyết và ứng dụng của Trí tuệ nhân tạo. Trí thông minh nhân tạo là một trong những ngành trọng yếu của tin học. Trí thông minh nhân tạo liên quan đến cách cư xử, sự học hỏi và khả năng thích ứng thông minh của máy móc.  AI thể hiện một mục tiêu của con người, Machine Learning là một phương tiện được kỳ vọng sẽ giúp con người đạt được mục tiêu đó. Và thực tế thì Machine Learning đã mang nhân loại đi rất xa trên quãng đường chinh phục AI. Machine Learning và AI có mối quan hệ chặt chẽ với nhau nhưng không hẳn là trùng khớp vì một bên là mục tiêu (AI), một bên là phương tiện (Machine Learning). Chinh phục AI mặc dù vẫn là mục đích tối thượng của Machine Learning, nhưng hiện tại Machine Learning tập trung vào những mục tiêu ngắn hạn hơn như: (1) Làm cho máy tính có những khả năng nhận thức cơ bản của con người như nghe, nhìn, hiểu được ngôn ngữ, giải toán, lập trình,... (2) Hỗ trợ con người trong việc xử lý một khối lượng thông tin khổng lồ mà chúng ta phải đối mặt hàng ngày, hay còn gọi là Big Data. Machine Learning theo định nghĩa cơ bản là ứng dụng các thuật toán để phân tích cú pháp dữ liệu, học hỏi từ nó, và sau đó thực hiện một quyết định hoặc dự đoán về các vấn đề có liên quan. Vì vậy, thay vì code phần mềm bằng cách thức thủ công với một bộ hướng dẫn cụ thể để hoàn thành một nhiệm vụ cụ thể, máy được “đào tạo” bằng cách sử dụng một lượng lớn dữ liệu (Big Data) và các thuật toán cho phép nó học cách thực hiện các tác vụ và ngày càng thông minh hơn. 3.2. Ứng dụng của Machine Learning trong xếp hạng tín dụng khách hàng cá nhân tại các NHTM Việt Nam Nhiều tổ chức tài chính sử dụng các mô hình chấm điểm để giảm rủi ro trong đánh giá tín dụng cũng như trong việc cấp và giám sát tín dụng. Các mô hình chấm điểm tín 93
  8. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" dụng dựa trên các lý thuyết thống kê cổ điển được sử dụng rộng rãi. Tuy nhiên, các mô hình này không dùng được khi có số lượng lớn dữ liệu đầu vào. Điều này ảnh hưởng đến tính chính xác của dự báo dựa trên mô hình. Theo nhiều nghiên cứu thực nghiệm, các kỹ thuật học máy cùng với các thuật toán khai thác dữ liệu (data mining) khác dựa trên cách tính toán và chuyển đổi kiểu mới hoạt động tốt hơn cho mục đích dự báo. Các thuật toán học máy được thiết kế để học từ một lượng lớn dữ liệu lịch sử và sau đó tính toán ra kết quả dự báo. Lấy điểm tín dụng cho các khoản vay từ các ngân hàng bán lẻ làm ví dụ. Quá trình kinh doanh điển hình cho việc cung cấp dịch vụ cho vay là: nhận các hồ sơ vay vốn, đánh giá rủi ro tín dụng, ra quyết định về việc cho vay và giám sát việc hoàn trả vốn gốc và lãi. Trong quá trình đó, các vấn đề có thể xảy ra, chẳng hạn như làm thế nào để đẩy nhanh tiến trình thẩm định tín dụng và làm thế nào để giám sát quá trình hoàn trả và thực hiện can thiệp kịp thời khi khả năng vỡ nợ xuất hiện. Để giải quyết hai vấn đề nêu trên, chúng ta có thể xây dựng hai mô hình trong hai tiến trình khởi tạo vốn vay và tiến trình giám sát. Trong quá trình khởi tạo, đối tượng cần kiểm tra bao gồm tất cả các ứng viên nộp đơn xin vay vốn. Mô hình có thể được sử dụng để phân tích và học thông qua dữ liệu lịch sử của các hồ sơ đăng ký vay vốn, qua đó đánh giá liệu một ứng viên mới có đủ tin cậy để được vay hay không nếu các chỉ tiêu đặc trưng của người nộp đơn được cung cấp, như thu nhập, tình trạng hôn nhân, tuổi, lịch sử tín dụng (chẳng hạn đã từng nợ xấu hay chưa),... Trong quá trình giám sát, hệ thống kiểm tra dữ liệu của người được duyệt vay vốn. Bằng cách sử dụng dữ liệu lịch sử hồ sơ hoàn trả và trạng thái đặc điểm của khách hàng đã hoàn thành toàn bộ quá trình vay vốn, chúng ta có thể đào tạo mô hình khác để đưa ra dự kiến về việc liệu khách hàng này có xác suất lớn hay không khả năng vỡ nợ; bằng cách quan sát hồ sơ hoàn trả của người nộp đơn cho một vài giai đoạn hoàn vốn đầu tiên và thay đổi các đặc tính, mô hình này sẽ giúp tạo ra các điều chỉnh mới dựa trên thông tin cập nhật. Quy trình tự động này hiệu quả hơn về thời gian xử lý cũng như tính chính xác so với cách làm truyền thống. Tuy nhiên, có rất nhiều thuật toán học máy đang có sẵn, câu hỏi đặt ra là “Thuật toán nào là tốt nhất?”. Không có câu trả lời rõ ràng cho câu hỏi này vì tính hiệu quả của các thuật toán phụ thuộc vào dữ liệu và còn phụ thuộc vào cấu trúc dữ liệu cụ thể. Cách chung để tìm một mô hình thích hợp cho một bộ dữ liệu cụ thể hoặc một loại tập dữ liệu là áp dụng thuật toán đã được sử dụng rộng rãi và đã được kiểm chứng. 94
  9. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" Trong hai tiến trình được nhắc tới ở trên, cả hai trông giống nhau nhưng có các mô hình khác nhau. Tiến trình giám sát hoàn trả trông tương tự như tiến trình cấp vốn vay, nhưng nó được học và đúc rút ra từ các dữ liệu lịch sử khác nhau, cụ thể là từ khách hàng cũ đã hoàn thành việc trả nợ, bao gồm toàn bộ lịch sử hồ sơ thanh toán và các đặc điểm của khách hàng. Một thuật toán học máy khác có thể được ứng dụng để phù hợp tương ứng với các thay đổi của cấu trúc dữ liệu. Ngày nay, các thuật toán Machine Learning hay được sử dụng nhất có thể được phân loại là phân loại đơn hoặc phân loại toàn bộ. Các đại diện của các thuật toán phân loại đơn là CART, Naïve Bayes, SVM, logistics. Việc sửa đổi các bộ phân loại đơn, nhiều mô hình cùng học để giải quyết cùng một vấn đề, được sử dụng rộng rãi, chẳng hạn như Random Forests, CART-Adaboost,... Về cơ bản, Machine Learning cũng giống như việc dạy kiến thức tài chính cho một học sinh mới dựa trên số liệu lịch sử để thực hiện xác định chất lượng của khoản vay, sau đó bộ máy này sẽ có kinh nghiệm để tự quyết định. Nói rộng hơn, kỹ thuật Machine Learning có thể được sử dụng trong tất cả các loại vấn đề phân loại. Trong lĩnh vực ngân hàng/bảo hiểm, dựa trên Machine Learning có thể phát triển các ứng dụng, bao gồm Xếp hạng tín dụng (Credit Scoring), Phân tích rủi ro (Risk Analytics), Phát hiện gian lận (Fraud Detection), Bán chéo (Cross-Sell). Qua nhiều năm, một số kỹ thuật xây dựng mô hình khác nhau để thực hiện xếp hạng tín dụng đã phát triển, bao gồm: tham số hoặc phi tham số (parametric or non-parametric), thống kê hoặc Machine Learning, các thuật toán giám sát hoặc không giám sát, mạng neuron. Các kỹ thuật gần đây gồm các cách tiếp cận rất tinh vi, sử dụng hàng trăm hoặc hàng ngàn mô hình khác nhau, các cách thức kiểm định mô hình khác nhau, đa dạng kết hợp rất nhiều thuật toán để mong đạt được kết quả với độ chính xác cao. Mặc dù đa dạng là vậy, nhưng có một kỹ thuật xây dựng mô hình nổi bật có tên là thẻ điểm tín dụng (Credit Scorecard) được nhiều ngân hàng trên thế giới áp dụng rộng rãi (Các ngân hàng như Commonwealth Bank of Australia, Standard Chartered Bank,... cũng đang áp dụng kỹ thuật này). Thường được gọi là thẻ điểm tiêu chuẩn (Standard Scorecard), nó dựa trên Mô hình hồi quy Logistic (Logistic Regression Model). Mô hình thẻ điểm tín dụng dạng này được xây dựng đơn giản, dễ hiểu, dễ triển khai và chạy nhanh. Kết hợp giữa thống kê và Machine Learning, độ chính xác của phương pháp này tương đương với các kỹ thuật tinh vi, điểm số đầu ra của nó có thể được áp dụng trực tiếp để đánh giá xác suất nợ xấu, từ đó cung cấp đầu vào cho việc định giá nợ xấu dựa trên rủi ro. Điều này rất quan trọng đối với các bên cho vay cần tuân thủ khuôn khổ pháp lý Basel II. 95
  10. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" Mô hình thẻ điểm tín dụng có thể được mô tả một cách đơn giản như sau: nó bao gồm tập hợp các thuộc tính đầu vào từ khách hàng, cụ thể là đặc điểm khách hàng (Ví dụ như tuổi, thu nhập, nghề nghiệp,...), thông tin tín dụng quá khứ của họ (Ví dụ như thông tin thu thập được từ Trung tâm thông tin tín dụng Quốc gia - CIC, cũng như thông tin tín dụng khác mà ngân hàng nắm được),... căn cứ vào tính toán của mô hình, mỗi thuộc tính sẽ được gán một hệ số nhất định, tổng của các con số này bằng điểm số đầu ra. Căn cứ vào điểm số đầu ra, người ta có thể xác định được xác suất khách hàng có khả năng phát sinh nợ xấu. Chính nhờ xác suất này mà việc tính được giá trị của rủi ro tín dụng dễ dàng được thực hiện, qua đó ngân hàng nhanh chóng biết được số vốn tối thiểu dành cho rủi ro tín dụng phù hợp với tiêu chuẩn Basel II. Như vậy, hệ thống chấm điểm tín dụng và xếp hạng khách hàng bằng thẻ điểm, được tạo ra bởi công nghệ Machine Learning, ứng dụng mô hình hồi qui Logistic, không chỉ giúp đánh giá khả năng thực hiện các nghĩa vụ tài chính của một khách hàng đối với một ngân hàng như việc trả lãi và trả gốc nợ vay khi đến hạn, mà nó còn là công cụ hỗ trợ ngân hàng trong kiểm soát việc tuân thủ Basel II. 4. Đề xuất quy trình ứng dụng Trí tuệ nhân tạo trong xếp hạng tín dụng khách hàng cá nhân của NHTM 4.1. Quy trình phát triển hệ thống Machine Learning Các bước phát triển hệ thống Machine Learning gồm: (1) Requirements; (2) Data; (3) Model; (4) Production. Requirements - Yêu cầu: là giai đoạn tìm hiểu về những gì người dùng đang cần, mong muốn từ hệ thống Machine Learning. Trong mọi trường hợp, bước này là quan trọng nhất. Càng thêm thời gian dành riêng cho giao tiếp và hiểu biết lẫn nhau giữa các bộ phận, mục tiêu càng rõ ràng và cụ thể càng có nhiều cơ hội dự án sẽ thành công hơn. Data - Số liệu: dữ liệu là “kinh nghiệm” cho model (mô hình). Nếu chúng ta có thể train các model với rất nhiều “kinh nghiệm” có chất lượng tốt, nó sẽ học những phương án tốt hơn để phục vụ mục đích. Đối với các trường hợp trong đó dữ liệu không đủ hoặc quá lộn xộn nó cần một bước chuẩn bị dữ liệu, hoặc là thu thập thêm dữ liệu, hoặc là mua từ 1 bên thứ 3, hoặc là sử dụng dữ liệu opensource. Trong trường hợp bất kỳ dữ liệu phải được hoàn thiện sạch sẽ và có cấu trúc tốt. Model - Mô hình: Mục đích của bước này để thống nhất về số liệu chính xác để đánh giá các mô hình 1 cách khách quan. Mất nhiều ngày làm việc để lựa chọn các thuật toán, train model, kiểm tra nó và lập lại. Đây là phần cốt lõi và quan trọng nhất của quá trình. 96
  11. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" Production - Vận hành: Một khi các thuật toán được thử nghiệm sẵn sàng để hoạt động, có hai công việc chính trong bước vận hành: Tích hợp với các thiết lập hiện có. Tự động cập nhật các mô hình. Mô hình tự động cập nhật theo thời gian khi mà lượng data mới  liên tục được thêm vào. 4.2. Đề xuất quy trình ứng dụng Trí tuệ nhân tạo trong xếp hạng tín dụng khách hàng cá nhân của NHTM Việc phát triển một mô hình Machine Learning cũng có nhiều bước và sẽ có một vài điểm/bước tương đồng so với việc phát triển 1 phần mềm công nghệ thông thường và Machine Learning là một nhánh cực kỳ hiện đại của việc phát triển phần mềm. Như trong phần mềm thông thường, các giải pháp đóng gói sẵn tốn ít chi phí nhưng không phù hợp với nhu cầu cụ thể, trong khi ngược lại xây dựng hệ thống Machine Learning đưa đến các giải pháp có khả năng thiên biến vạn hóa hơn. Dựa trên nghiên cứu về hệ thống XHTD khách hàng cá nhân hiện tại và mục tiêu của việc ứng dụng Trí tuệ nhân tạo với công nghệ Machine Learning và nền tảng Big Data, tác giả đề xuất quy trình ứng dụng Trí tuệ nhân tạo trong xếp hạng tín dụng khách hàng cá nhân đối với các NHTM gồm các bước sau: 4.2.1. Xác định mục tiêu của hệ thống Hệ thống được xây dựng với các mục tiêu chính sau: 1. Hỗ trợ thẩm định, phê duyệt cấp tín dụng và quản lý rủi ro tín dụng 2. Xây dựng chính sách khách hàng 3. Khắc phục những điểm yếu của hệ thống XHTD cũ 4. Đáp ứng yêu cầu của NHNN 4.2.2. Xây dựng nền tảng - kho dữ liệu khách hàng (Big Data) Các NHTM cần chuẩn hóa dữ liệu lịch sử tín dụng khách hàng cá nhân tại hệ thống ngân hàng của mình với các thông tin khách hàng về các tiêu chí chấm điểm. Dữ liệu càng lớn càng tốt, đề xuất thời gian số hóa lưu trữ hồ sơ khách hàng tối thiểu 10 năm. Các trường thông tin khách hàng được sắp xếp khoa học với các thông tin: 1. Về nhân thân; 97
  12. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" 2. Về lịch sử giao dịch với ngân hàng; 3. Về thông tin khoản vay; 4. Về tài sản đảm bảo; 5. Về lịch sử trả nợ của khách hàng. 4.2.3. Xây dựng mô hình XHTD khách hàng cá nhân với nền tảng Big Data và công nghệ Machine Learning Việc xây dựng mô hình XHTD khách hàng cá nhân với nền tảng Big Data và công nghệ Machine Learning thực hiện qua các bước công việc sau: 1. Lựa chọn mô hình XHTD phù hợp; 2. Lập trình hệ thống Machine Learning dựa trên mục tiêu đặt ra, mô hình XHTD được lựa chọn và hệ thống dữ liệu Big Data sẵn có. 4.2.4. Vận hành thử nghiệm, đánh giá và đưa vào sử dụng chính thức Sử dụng mô hình mới với công nghệ Machine Learning để đánh giá và dự báo kết quả XHTD dựa trên dữ liệu nhóm khách hàng cũ. So sánh kết quả dự báo của công nghệ Machine Learning với kết quả thực tế đã xảy ra với nhóm khách hàng này và so sánh với với kết quả dự báo của công nghệ XHTD khách hàng cá nhân hiện tại. Thông qua phân tích tập khách hàng cũ với kho dữ liệu khách hàng có sẵn và so sánh độ chính xác với công nghệ cũ để đánh giá mô hình XHTD mới công nghệ Machine Learning, đánh giá điểm mạnh và yếu của mô hình để có hướng điều chỉnh mô hình. Ứng dụng trên tập khách hàng mới và sau đó đánh giá mức độ chính xác dựa trên kết quả thực tế của khách hàng 5. Kết luận Dự báo chính xác về năng lực trả nợ của khách hàng trong tương lai là quan trọng hàng đầu trong nghiệp vụ tín dụng của ngân hàng thương mại, điều này giúp các nhà cấp tín dụng được kỳ vọng đưa ra quyết định nhanh chóng về việc có nên cho một khách hàng vay hay không. Hiện nay những quyết định này được đưa ra dựa trên các thông tin rất hạn chế. Với sự bùng nổ của dữ liệu trong mười năm qua, cơ hội sử dụng dữ liệu này một cách thông minh đã phát triển theo cấp số nhân; nhưng những cơ hội này thường vẫn chưa được thực hiện bởi vì việc giải thích số lượng lớn dữ liệu phức tạp vượt quá 98
  13. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" khả năng của con người. Nó đã được chứng minh rằng sử dụng các kỹ thuật Machine Learning cho phép người ta tận dụng tất cả các dữ liệu sẵn có, và do đó, đạt được một sự cải thiện đáng kể về khả năng dự đoán trước các mô hình truyền thống. Các dự đoán tốt hơn (và đúng thời gian hơn) lần lượt dẫn đến tác động tích cực đến quyết định cho vay của ngân hàng đối với khách hàng của mình. Ngoài ra, phương pháp mô hình hóa này có một khía cạnh tự điều chỉnh cho phép nó tự động điều chỉnh theo các xu hướng trong dữ liệu đầu vào đơn giản bằng cách đào tạo định kỳ, do đó làm giảm nhu cầu truy cập lại trọng số trong các mô hình truyền thống và nâng cao mức độ chính xác của các dự báo. Điều này không có nghĩa là vai trò của một nhà phân tích là con người sẽ trở nên lỗi thời. Có những trường hợp mà các mô hình máy tính có thể không tính toán và dự báo chính xác được, ví dụ, khi xảy ra các sự kiện bất thường (chiến tranh, thiên tai, biến động chính trị,...). Những sự kiện này tạo ra sự gián đoạn khi các mẫu trong quá khứ không còn áp dụng nữa. Do đó, việc tính điểm tín dụng tự động dựa trên thuật toán Machine Learning và phân tích của con người có thể bổ sung cho nhau trong việc xác định rủi ro tín dụng. TÀI LIỆU THAM KHẢO 1. Altman, E.I., 1968. Financial ratios, discriminant analysis and the prediction of cor- porate bankruptcy. The journal of finance, 23(4), pp.589-609. 2. Baesens, B., Van Gestel, T., Viaene, S., Stepanova, M., Suykens, J. and Vanthienen, J., 2003. Benchmarking state-of-the-art classification algorithms for credit scoring, Journal of the operational research society, 54(6), pp.627-635. 3. Chintan Trivedi, Irina Rabinovich and Shyarsh Desai (2017),Applying Machine Learning to Leverage Big Data for Commercial Credit Scoring, The Credit & Finan- cial Management Review, 4. Dinh Thi Huyen Thanh & Stafanie Kleimeier (2006), Credit Scoring for Vietnam’s Retail Banking Market 5. Dominique Guegan, Bertrand Hassani (2017), Maison des Sciences Économiques, 106-112. 6. Fawcett, T., 2006. An introduction to ROC analysis. Pattern recognition letters, 27(8), pp.861-874. 7. Fensterstock, B.A., Salters, J. and Willging, R., 2013. On the Use of Ensemble Models for Credit Evaluation. Credit Financ. Manag. Rev, 1(1), pp.1-14. 99
  14. Kỷ yếu HộI THảO KHOA HọC QUốC GIA "CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG" 8. Friedline, T., Masa, R.D. and Chowa, G.A., 2015. Transforming wealth: Using the in- verse hyperbolic sine (IHS) and splines to predict youth’s math achievement. Social science research, 49, pp.264-287. 9. Huang, C.L., Chen, M.C. and Wang, C.J., 2007. Credit scoring with a data min- ing approach based on support vector machines. Expert systems with applications, 33(4), pp.847-856. 10. Lo, K. and Lys, T., 2000. The Ohlson model: contribution to valuation theory, limita- tions, and empirical applications. Journal of Accounting, Auditing & Finance, 15(3), pp.337-367. 11. Philipp Kallerhoff, PhD, Jumiya (2017), Big Data and Credit Unions: Machine Learning in Member Transactions, Filene Research Institute. 12. Piotroski, J.D., 2000. Value investing: The use of historical financial statement infor- mation to separate winners from losers. Journal of Accounting Research, pp.1-41. 13. Rasmussen, C.E. and Williams, C.K., 2006. Gaussian processes for machine learning (Vol. 1). Cambridge: MIT press. 14. West, D., 2000. Neural network credit scoring models. Computers & Operations Research, 27(11), pp.1131- 1152 Ngày gửi bài: 19/5/2018 Ngày gửi lại bài: 21/5/2018 Ngày duyệt đăng: 02/06/2018 100
nguon tai.lieu . vn