Xem mẫu

  1. 133 TỔNG QUAN VỀ DỮ LIỆU LỚN (BIG DATA) VÀ HIỆU QUẢ ỨNG DỤNG TRONG KINH TẾ VÀ KINH DOANH THƯƠNG MẠI ĐIỆN TỬ ThS. Lê Triệu Tuấn Đại học Công nghệ thông tin và truyền thông TS. Phạm Minh Hoàn Viện Công nghệ thông tin và Kinh tế số, Trường Đại học Kinh tế Quốc dân TÓM TẮT Trong bối cảnh cuộc cách mạng công nghiệp 4.0, dữ liệu lớn (big data) đóng vai trò cốt lõi, là chìa khóa dẫn tới thành công của các doanh nghiệp và được ứng dụng rộng rãi trong nhiều lĩnh vực khoa học, công nghệ, kinh tế và xã hội. Trên thế giới cũng như ở Việt Nam, đã có nhiều công ty, tổ chức ứng dụng thành công big data với hiệu quả rất cao. Vậy dữ liệu lớn là gì, công nghệ gì xử lý dữ liệu lớn hiện nay và hiệu quả ứng dụng dữ liệu lớn trên thế giới, ở Việt Nam như thế nào. Bài báo trình bày nội dung nghiên cứu tổng quan về dữ liệu lớn, ứng dụng và hiệu quả ứng dụng của nó, đặc biệt vai trò định hướng của dữ liệu lớn trong nền kinh tế nói chung và đối với bài toán thương mại điện tử cũng như phát triển khách hàng nói riêng. Từ khóa: Dữ liệu lớn, Xử lý dữ liệu lớn, Dữ liệu khách hàng, Kinh tế số. 1. GIỚI THIỆU Trong thời đại nền kinh tế số hiện nay, dữ liệu đang được sinh ra theo cấp số nhân, có khoảng 40 zettabytes tức 43 nghìn tỉ gigabytes dữ liệu sẽ được tạo ra vào năm 2020. Con số này tăng 300 lần so với số liệu thống kê được vào năm 2005 (McKinsey Global, 2011). Dữ liệu được sinh ra từ các nguồn như: sự phổ biến của điện thoại thông minh, mạng xã hội, mạng kết nối vạn vật (Internet Of Things), … nói cách khác chúng là dữ liệu được sản sinh qua quá trình chia sẻ thông tin liên tục của các thiết bị, người sử dụng hay còn gọi là dữ liệu lớn (big data). Thuật ngữ big data đã được sử dụng từ những năm 1990 và chỉ thực sự bùng nổ trong khoảng 10 năm trở lại đây nhưng trên thế giới đã có rất nhiều ứng dụng trong các lĩnh vực mang lại hiệu quả to lớn (Graham, 2012). Như nhà bán lẻ Target của Hoa Kỳ có thể dự đoán gần như chính xác thời điểm một khách hàng của họ mong muốn sinh em bé, để giới thiệu, cung cấp các sản phẩm phù hợp (Denis Guyadeen, 2012). Công ty Sociometric Solutions (Hoa Kỳ) đặt cảm biến vào tấm huy hiệu tên nhân viên để có thể phát hiện các động lực xã hội tại nơi làm việc. Các cảm biến sẽ báo cáo về cách nhân
  2. 134 viên di chuyển xung quanh nơi làm việc, nói chuyện, và thậm chí cả cách giao tiếp trong công việc của họ. ResearchKit - ứng dụng chăm sóc sức khỏe của Apple, đã biến điện thoại di động thành một thiết bị nghiên cứu y sinh học, phục vụ cho các nghiên cứu về sức khỏe thông qua việc theo dõi số bước đi thực hiện trong một ngày, hoặc yêu cầu bạn trả lời các câu hỏi về cảm giác sau khi hóa trị, hay theo dõi căn bệnh Parkinson đang tiến triển như thế nào (Hồ Thị Hạnh, 2019). Tại Việt Nam, nhiều doanh nghiệp cũng đã nghiên cứu và ứng dụng big data vào kinh doanh, quản lý để nâng cao năng suất hoạt động của công ty mình. Lazada đã sử dụng dữ liệu thu thập được để xác định sản phẩm phù hợp với từng phân khúc khách hàng. Ví dụ, khách hàng Thái Lan thích mua tã giấy trong hộp đặc biệt, trong khi người Malaysia thích hàng được đóng trong từng gói nhỏ. Lazada dự định sử dụng khoa học dữ liệu để giúp các nhà cung ứng của mình tùy chỉnh các dịch vụ cung cấp cho các nhóm khách hàng cụ thể dựa trên tuổi, giới tính và các sở thích khác. Hay như trang bán lẻ Sendo.Vn trực thuộc Tập đoàn FPT, Sendo.Vn đã vận dụng phân tích dữ liệu lớn trên 5 triệu sản phẩm được bán bởi 80.000 shop đòi hỏi sự chuyên nghiệp trong quá trình xử lý, nhằm đảm bảo loại trừ chính xác hàng giả, hàng nhái; và kiểm tra độ tin cậy về giá bán cuối cùng của các shop trong lễ hội mua sắm trực tuyến ngày 2/12/2018 (Trịnh Thu Trang, 2019). Big Data chứa rất nhiều thông tin quý giá mà nếu trích rút thành công, sẽ hỗ trợ đắc lực cho việc kinh doanh, nghiên cứu khoa học, dự đoán các dịch bệnh sắp phát sinh và thậm chí có thể đưa ra những khuyến nghị chính xác về điều kiện giao thông, thời tiết… theo thời gian thực (Sameera, 2014). 2. KHÁI NIỆM, ĐẶC TRƯNG CỦA DỮ LIỆU LỚN Big data được định nghĩa là dữ liệu vượt quá khả năng xử lý của hệ thống xử lý dữ liệu thông thường do khối lượng, vận tốc và tính biến đổi của nó (Dumbill, 2012). Theo Gartner, big data có 5 đặc trưng (5V) như sau: Khối lượng dữ liệu (Volume): Đây là đặc trưng cơ bản nhất của big data, khối lượng của big data đang tăng lên từng ngày, năm 2013 cứ mỗi 11 giây trôi qua 1 petabyte dữ liệu được tạo ra trên toàn thế giới, tương đương với một đoạn video HD dài 13 năm (Stephen, 2012). Dữ liệu truyền thống có thể lưu trữ trên các thiết bị đĩa mềm, đĩa cứng. Nhưng với big data thì ta phải dùng công nghệ mới như công nghệ điện toán đám mây thì mới đáp ứng khả năng lưu trữ.
  3. 135 Tốc độ (Velocity): Tốc độ có thể được hiểu theo 2 khía cạnh: thứ nhất, khối lượng dữ liệu ra tăng rất nhanh (mỗi giây có tới 72.9 triệu các yêu cầu truy cập tìm kiếm trên web bán hàng của Amazon); thứ hai, xử lý dữ liệu nhanh ở mức thời gian thực (real-time), có nghĩa dữ liệu được xử lý ngay tức thời ngay sau khi chúng phát sinh (tính bằng mili giây). Các ứng dụng phổ biến trên lĩnh vực Internet, tài chính, ngân hàng, hàng không, quân sự, y tế… như hiện nay phần lớn dữ liệu được xử lý real-time. Đa dạng (Variety): Các dữ liệu được sinh ra là phi cấu trúc (tài liệu, blog, hình ảnh, video, bài hát, dữ liệu từ thiết bị cảm biến vật lý, thiết bị chăm sóc sức khỏe…), big data cho phép liên kết và phân tích nhiều dạng dữ liệu khác nhau. Độ chính xác (Veracity): Bài toán phân tích và loại bỏ dữ liệu thiếu chính xác và nhiễu đang là tính chất quan trọng của big data. Với xu hướng phương tiện truyền thông xã hội (Social Media) và mạng xã hội (Social Network) ngày nay và sự gia tăng mạnh mẽ tính tương tác và chia sẻ của người dùng mobile làm cho bức tranh xác định về độ tin cậy và chính xác của dữ liệu ngày càng khó khăn hơn. Giá trị (Value): Giá trị là một đặc trưng quan trọng của big data, nó cho chúng ta thông tin để ra quyết định xem có nên triển khai big data hay không. Nếu chúng ta có big data mà chỉ nhận được % lợi ích rất nhỏ từ nó thì không nên đầu tư phát triển. 3. CÔNG NGHỆ XỬ LÝ DỮ LIỆU LỚN Big data đem lại lợi ích rất lớn cho xã hội nhưng cũng đặt ra thách thức không nhỏ về mặt công nghệ để xử lý, đòi hỏi các mô hình xử lý, lưu trữ và phân tích phải hiện đại. Để đáp ứng được yêu cầu cho các tính chất của big data thì các mô hình này được xây dựng trên môi trường phân tán. Công nghệ cho dữ liệu lớn được chia thành 3 giai đoạn chính như hình dưới: Công nghệ Công nghệ xử Công nghệ lưu trữ lý hiển thị - HDFS - MapReduce - Tableau - NoSQL - Pentahoo - SAS Hình 1. Mô hình công nghệ xử lý dữ liệu lớn. (Nguồn: Tác giả đề xuất)
  4. 136 Công nghệ lưu trữ: Công nghệ lưu trữ giải quyết bài toán dữ liệu khổng lồ và tốc độ xử lý cao bằng cách phân tán dữ liệu trên nhiều máy trạm. Khi truy xuất dữ liệu thì cho phép truy xuất đồng thời cùng lúc. Hệ thống tập tin phân tán HDFS (Hadoop Distributed File System) là hệ thống quản lý tập tin được thiết kế để tối ưu cho bài toán lưu trữ các tập tin có kích thước lớn hàng Gigabyte, thậm chí Terabyte. Để giải quyết bài toán này, dữ liệu của các tập tin lớn sẽ được chia nhỏ thành các khối lớn (ví dụ 64MB) và phân tán trên các nút lưu trữ. So với các hệ thống tập tin khác, HDFS không tối ưu cho bài toán lưu trữ hàng tỉ tập tin nhỏ với kích thước mỗi tập tin chỉ vài KB. Ưu điểm của thiết kế tập tin lớn là giảm tải cho hệ thống quản lý không gian tập tin, giảm thời gian thao tác trên các thư mục hay tìm kiếm tập tin. Cơ sở dữ liệu phi quan hệ, NoSQL, đáp ứng lưu trữ dữ liệu với lược đồ mô hình dữ liệu linh hoạt, đa dạng định dạng dữ liệu, tính mở cao, loại bỏ các tính chất không thực sự cần thiết của cơ sở dữ liệu quan hệ truyền thống. Mô hình cở dữ liệu phi quan hệ NoSQL được sử dụng rộng rãi tại các công ty Internet lớn, như Google, Yahoo, Facebook, Amazon (Trần Việt Trung, 2015). Công nghệ xử lý: Phương pháp xử lý dữ liệu lớn là kết tập, phối hợp năng lực xử lý của nhiều máy tính vào giải quyết một bài toán chung. Công nghệ xử lý dữ liệu lớn phổ biến là mô hình tính toán MapReduce, được Google đưa ra vào năm 2004 (Jimmy, 2010). Với mô hình tính toán này, các máy tính này sẽ hoạt động song song nhưng độc lập với nhau, mục đích là làm rút ngẵn thời gian xử lý toàn bộ dữ liệu. Tính toán MapReduce được phân tán trên các nút lưu trữ. So với các mô hình tính toán khác mà dữ liệu được sao chép đến các nút tính toán và thực hiện trên các nút đó, mô hình tính toán MapReduce khác biệt ở chỗ mã chương trình được sao chép tới các nút lưu trữ để thực thi. Đây là một trong những điểm mấu chốt tiên tiến của MapReduce vì quan điểm di chuyển mã chương trình thì tiết kiệm và hiệu quả hơn di chuyển dữ liệu (Jeffrey và Ghemawat, 2008). Công nghệ hiển thị: Hiển thị trực quan lượng dữ liệu khổng lồ và các tri thức khai thác được từ dữ liệu là đòi hỏi cần thiết khi làm việc với dữ liệu lớn. Việc hiển thị dữ liệu dưới dạng trực quan giúp người khai thác có cái nhìn toàn cảnh về dữ liệu và tri thức mang lại từ dữ liệu. Các công cụ cho phép hiển thị và tương tác trực quan với dữ liệu lớn hiện nay phổ biến là các công cụ như Tableau, Pentahoo, SAS (Trần Việt Trung, 2015). 4. NHỮNG ỨNG DỤNG PHỔ BIẾN CỦA BIG DATA Phân tích mục tiêu của khách hàng: Đây là một trong những lĩnh vực lớn nhất của việc ứng dụng công nghệ big data, nó giúp các cơ quan, tổ chức hiểu rõ hơn về nhu cầu khách hàng cũng như hành vi và sở thích của họ. Các công ty mở rộng bộ dữ liệu truyền thống của họ, kết
  5. 137 hợp với dữ liệu truyền thông, xã hội và phân tích văn bản. Ví dụ, nhà bán lẻ Target của Hoa Kỳ có thể dự đoán gần như chính xác thời điểm một khách hàng của họ mong muốn sinh em bé, để giới thiệu, cung cấp các sản phẩm phù hợp. Sử dụng Big Data, các công ty viễn thông có thể dự đoán tốt hơn việc thay đổi mong muốn của khách hàng; công ty bảo hiểm xe hơi hiểu rõ khách hàng của họ lái xe như thế nào (Yongyang Nen, 2014). Chăm sóc sức khỏe cộng đồng: Công nghệ big data hỗ trợ đắc lực cho bác sỹ trong việc phát hiện và đưa ra phác đồ điều trị riêng cho từng bệnh nhân, phù hợp với đặc tính di truyền của họ. Ví dụ bác sĩ sẽ biết những gì sẽ xảy ra khi tất cả dữ liệu cá nhân từ đồng hồ và thiết bị đeo thông minh được sử dụng để theo dõi sức khỏe từ xa cho hàng triệu người, giúp sớm phát hiện ra các bệnh họ mắc phải; Vòng tay thông minh Jawbone giúp thu thập dữ liệu, từ đó nhận biết và đo đạc một cách chính xác mức độ tiêu thụ calo trong các hoạt động mà người đeo thực hiện, cũng như theo dõi giấc ngủ của họ vào ban đêm để phân tích những dấu hiệu bất thường; ResearchKit - ứng dụng chăm sóc sức khỏe của Apple, đã biến điện thoại di động thành một thiết bị nghiên cứu y sinh học, phục vụ cho các nghiên cứu về sức khỏe thông qua việc theo dõi số bước đi thực hiện trong một ngày, hoặc yêu cầu bạn trả lời các câu hỏi về cảm giác sau khi hóa trị, hay theo dõi căn bệnh Parkinson đang tiến triển như thế nào (Couldry, 2014). Nâng cao hiệu suất thể thao: Trong lĩnh vực thể thao, big data được ứng dụng rất nhiều để nâng cao hiệu quả quản lý giải đấu hay hiệu suất thi đâu của các vận động viên. Ví dụ như công cụ IBM SlamTracker dành cho các giải đấu quần vợt; sử dụng phân tích video theo dõi hiệu suất của người chơi trong bóng đá hoặc bóng chày; công nghệ cảm biến trong thiết bị thể thao như bóng rổ hoặc gậy golf cho phép nhận phản hồi, giúp cải thiện những thao tác chưa đúng; Nhiều đội thể thao sử dụng công nghệ big data để theo dõi vận động viên trong giờ nghỉ để điều chỉnh chế độ dinh dưỡng, vận động và cả giấc ngủ, cũng như phân tích các cuộc trò chuyện trên phương tiện truyền thông xã hội để theo dõi mức độ hạnh phúc, tình cảm của các vận động viên. Như World Cup năm 2014 các cầu thủ của đội tuyển Đức đã sử dụng bộ trang phục được trang bị hệ thống MiCoach của Adidas ở những buổi luyện tập trước và trong quá trình giải đấu diễn ra. Đây là dịch vụ giám sát sinh lý, thu thập và truyền tải thông tin trực tiếp từ cơ thể các cầu thủ (bao gồm nhịp tim, quãng đường đã di chuyển, tốc độ, gia tốc và năng lượng…), rồi gửi về một chiếc iPad của ban huấn luyện, phục vụ cho việc giám sát, phân tích, đánh giá điểm rơi phong độ (Dumbill, 2012).
  6. 138 Cải thiện an ninh và thực thi pháp luật: Ngày nay, big data được ứng dụng nhiều để phát hiện và ngăn chặn các cuộc tấn công trên mạng; lực lượng cảnh sát sử dụng các công cụ big data để bắt tội phạm và dự đoán hoạt động của các tổ chức tội phạm; các công ty tín dụng sử dụng big data để phát hiện các giao dịch gian lận. Ví dụ Cơ quan An ninh quốc gia Hoa Kỳ (NSA) sử dụng các phân tích dữ liệu lớn dự đoán sớm về các cuộc khủng bố (Graham, 2012). Xây dựng thành phố thông minh: Big data được sử dụng để cải thiện nhiều khía cạnh của các thành phố và quốc gia. Trong tương lai, big data sẽ giữ vai trò chủ đạo đối với các thành phố, hướng tới xử lý dữ liệu ở những phạm vi, cấp độ siêu nhỏ và truyền tải thông tin tới cả chính phủ lẫn người dân trong khung thời gian giới hạn. Nó cho phép các thành phố tối ưu hóa những hoạt động dựa trên lưu lượng truy cập thông tin giao thông theo thời gian thực, cũng như phân tích dữ liệu truyền thông để đánh giá các vấn đề về xã hội. Ví dụ, nhiều thành phố đang thử nghiệm các mô hình big data với mục đích chuyển đổi sang thành phố thông minh, nơi mà tất cả các quy trình, cơ sở hạ tầng giao thông và tiện ích đều được kết nối với nhau (McGuire, 2013). Thành phố Long Beach, California (Hoa Kỳ) đang sử dụng đồng hồ nước thông minh để phát hiện mất trộm nước theo thời gian thực, giúp một số chủ nhà cắt giảm tới 80% lượng nước sử dụng. Los Angeles sử dụng dữ liệu từ cảm biến và 4.500 camera lắp đặt trên các đường phố để kiểm soát đèn giao thông, giúp giảm tắc nghẽn giao thông lên đến 16% (Puneet và Sanchita, 2013). Hoạt động tài chính, ngân hàng: Đặc thù của hoạt động trong lĩnh vực tài chính là tạo ra một lượng dữ liệu khổng lồ đến từ cả bên trong và bên ngoài. Bằng việc ứng dụng công nghệ big data, những công ty hoạt động trong lĩnh vực thị trường tài chính có thể cải thiện các hoạt động giám sát giao dịch và phát hiện được những hành vi giao dịch bất thường, hành vi phạm pháp trước khi chúng được thực hiện. Cải thiện độ tin cậy để ra quyết định, cung cấp câu trả lời nhanh, chính xác cho các câu hỏi kinh doanh; truy cập thông tin nhanh chóng, dễ dàng; hiểu biết sâu sắc về hành vi của khách hàng; tạo ra tri thức mới… Từ những dữ liệu có cấu trúc như lịch sử giao dịch, hồ sơ khách hàng tới những dữ liệu phi cấu trúc như hoạt động của khách hàng trên website, ứng dụng mobile banking hay trên mạng xã hội…, Big Data sẽ đem lại những lợi thế cạnh tranh và hiệu quả to lớn cho lĩnh vực này (Hồ Thị Hạnh, 2019).
  7. 139 5. VAI TRÒ CỦA BIG DATA TRONG NỀN KINH TẾ VÀ BÀI TOÁN PHỤC VỤ KHÁCH HÀNG Giá trị thị trường của big data. Ứng dụng big data trong nhiều lĩnh vực cụ thể là rất rõ ràng và sức ảnh hưởng của big data thể hiện rõ nhất là trong lĩnh vực kinh tế. Việc xử lý thông tin, nhất là thông tin có liên quan tới khách hàng, cho phép các doanh nghiệp cải thiện rõ rệt các chiến lược kinh doanh và quảng bá sản phẩm, hình ảnh, chăm sóc khách hàng. Nó cho phép dự đoán các xu hướng tương lai, thói quen của người tiêu dùng cải thiện quan hệ với khách hàng, tăng chất lượng tuyển dụng một cách hiệu quả. Và hiện nay, big data đang có tốc độ phát triển rất nhanh. Theo thống kê năm 2010, ngành công nghiệp big data trên thế giới có giá trị hơn 100 tỷ USD và đang tăng nhanh mỗi năm (D.Fisher và Drucker, 2012). Đến năm 2022, con số lợi nhuận mà thị trường big data trên toàn cầu có thể mang lại khoảng 260 tỷ USD (https://bigdatauni.com/, 2018). Big data có thể thay đổi cách vận hành nền kinh tế. Với việc ứng dụng big data vào rất nhiều lĩnh vực của nền kinh tế hiện nay, như: lĩnh vực ngân hàng, big data thể hiện vai trò không thể thay thế của mình trong mọi hoạt động của ngân hàng, từ thu tiền mặt đến quản lý tài chính. Các ứng dụng của big data đã giúp giảm bớt rắc rối của khách hàng và tạo doanh thu cho các ngân hàng; Trong lĩnh vực y tế, big data đang dần khẳng định vai trò của mình trong việc cải thiện sức khỏe ngày nay. Big data không những được ứng dụng để xác định phương hướng điều trị, cải thiện quá trình chăm sóc sức khỏe bệnh nhân mà nó còn có nhiều tác động lớn trong việc giảm lãng phí tiền bạc và thời gian (Guan và Liao, 2014); Lĩnh vực thương mại điện tử, việc ứng dụng big data có thể tạo ra lợi ích cạnh tranh cho doanh nghiệp bằng cách cung cấp thông tin chuyên sâu và các bản báo cáo phân tích xu hướng tiêu dùng (Jelinek và Bergey, 2013); Trong quản lý thiên tai, các nhà khoa học không thể dự đoán khả năng xảy ra thảm họa và đề xuất đủ biện pháp phòng ngừa cho chính phủ nếu không có sự giúp đỡ của big data, giúp cho các nhà khí tượng học dự báo điều kiện thời tiết chính xác hơn (Davenport và Patil, 2012); Lĩnh vực giáo dục, big data có thể tạo ra các phương pháp tiếp cận dựa trên dữ liệu sáng tạo để dạy học sinh. Big data có thể lưu trữ, quản lý, phân tích các bộ dữ liệu lớn bao gồm hồ sơ của sinh viên. Duy trì bảo mật bằng cách sử dụng hệ thống quản lý big data có khả năng trích xuất phân cấp (Davenport và Barth, 2012); Ngành bán lẻ, big data có thể giúp phân tích thị trường cạnh tranh và sự quan tâm của khách hàng. Giúp xác định hành trình trải nghiệm, xu hướng mua sắm và sự hài lòng của khách hàng bằng cách thu thập dữ liệu đa dạng. Từ những dữ liệu thu thập được có thể cải thiện hiệu suất và hiệu quả bán hàng; Trong lĩnh vực marketing,
  8. 140 big data đã tiếp sức cho Digital Marketing phát triển thực sự mạnh mẽ, và nó đã trở thành một phần không thể thiếu của bất kỳ doanh nghiệp nào. Không chỉ các công ty lớn có thể điều hành các hoạt động quảng cáo tiếp thị mà cả các doanh nhân nhỏ cũng có thể chạy các chiến dịch quảng cáo thành công trên các nền tảng truyền thông xã hội và quảng bá sản phẩm của họ; Lĩnh vực truyền thông, giải trí, các công ty truyền thông và người hoạt động trong lĩnh vực giải trí cần thúc đẩy chuyển đổi kỹ thuật số để phân phối sản phẩm và nội dung của họ nhanh nhất có thể tại thị trường hiện tại. Đối với những người ảnh hưởng trên các phương tiện truyền thông đại chúng, Big Data có thể giúp tìm ra quan điểm hoặc lượt thích của một nghệ sĩ để đo lường mức độ phổ biến trong lĩnh vực truyền thông kỹ thuật số (Ueda, 2012). Ở thời đại số, kỹ thuật khai thác dữ liệu và xử lý hình ảnh đang giúp big data trở nên hữu ích hơn bao giờ hết. Nó tạo những chuyển biến ấn tượng, giúp tăng hiệu quả và năng suất của doanh nghiệp. Việt Nam là nước có tốc độ phát triển công nghệ thông tin và truyền thông rất nhanh, là một thị trường rất tiềm năng cho các công ty, tổ chức triển khai và khai thác các lợi ích từ big data. Đã có nhiều công ty, tập đoàn, tổ chức thành lập các dự án về big data và đã mang lại thành công ngoài mong đợi, như: tập đoàn FPT, công ty VCCorp, công ty VNG, tập đoàn Viettel…Big data ảnh hưởng tới các tổ chức, doanh nghiệp ở mức chiến lược và điều hành, giúp tạo ra lợi thế cạnh tranh so với các đối thủ. Big data ảnh hưởng tới sự phát triển của xã hội. Big data đã được nhiều nước trên thế giới, đặc biệt tại các nước phát triển ứng dụng thành công trong vấn đề nâng cao chất lượng quản lý và các vấn đề xã hội. Tại Mỹ ứng dụng big data để cải thiện tỷ lệ tử vong ở trẻ sơ sinh. Theo đó, bang Indiana là một trong những bang có tỷ lệ tử vong trẻ sơ sinh cao nhất trong cả nước Mỹ. Đặc biệt, trẻ em da đen có tỷ lệ tử vong trẻ sơ sinh (14,4) - cao hơn gấp đôi tỷ lệ trẻ em da trắng (6.4). Do tỷ lệ tử vong ở trẻ sơ sinh thường được sử dụng như một chỉ số về mức độ sức khỏe ở một quốc gia, một thống kê đáng ngạc nhiên, nếu ví bang Indiana là một quốc gia, thì tỷ lệ tử vong ở trẻ sơ sinh của Indiana sẽ cao hơn Kuwait (7,0) và đối với trẻ em da đen sẽ cao hơn Colombia (13,6), vùng lãnh thổ giữa Israel-Palestine (14,1) và Jordan (14,2). Chính quyền bang Indiana đã thiết lập một nền tảng văn hóa mạnh mẽ về quyết định dựa trên dựa trên dữ liệu trong các cơ quan của bang và các nhà nghiên cứu đã tìm ra được gốc rễ của tỷ lệ tử vong ở trẻ sơ sinh và đã phát triên lộ trình giải quyết vấn đề. Hoặc giải quyết vấn đề dịch bệnh Opioid – một loại bệnh được tạo ra do lạm dụng
  9. 141 thuốc giảm đau có tính chất gây nghiện, năm 2016 thống đốc Pence đã ký ban hành thành lập một lực lượng đặc nhiệm về thực thi, điều trị và phòng ngừa dịch bệnh nói trên. Lực lượng này kết hợp và phân tích các bộ dữ liệu, với hy vọng rằng các sự kiện tương lai như vậy có thể được dự đoán và ngăn chặn. Ngăn chặn tội phạm tái phạm tội. Mỗi năm, hơn 700.000 tù nhân được thả ra khỏi các nhà tù ở Hoa Kỳ. Nhà tù ờ Indiana định nghĩa tái phạm tội là một sự trở lại tù giam trong vòng 3 năm kể từ ngày người phạm tội được thả ra khỏi một cơ quan cải tạo của Bang. Trong năm 2016, tỷ lệ tái phạm của Bang là 37%, với gần một nửa số tù nhân trở về đã bị kết tội mới. Để cải thiện vấn đề này, chính quyền Hoa Kỳ đã phân tích thông tin tập trung vào cá nhân, xem xét các đặc điểm và lịch sử phạm tội của cá nhân từ đó đưa ra các giải pháp để giảm thiểu tình trạng tái phạm tội tại bang (Ryan, 2018). Theo (Tuấn Anh, 2017) hiện nay, cả nhà nước và doanh nghiệp đều mong muốn sử dụng hiệu quả các tiến bộ khoa học công nghệ mới nhất trong xử lý big data để cung cấp dịch vụ ngày càng tốt hơn, đáp ứng nhu cầu của người sử dụng, hướng tới mục tiêu phát triển xã hội ngày càng tốt hơn. Các nhà hoạch định chính sách và các nhà nghiên cứu đã nhận diện được tiềm năng của việc sử dụng big data để xử lý, chắt lọc ra được các thông tin có giá trị thực tiễn nhằm nâng cao chất lượng cuộc sống của người dân, nâng cao chất lượng quản lý, điều hành theo cách mà trước đây chưa từng được thực hiện. Big data ảnh hưởng lớn đến định hướng mục tiêu của thị trường. Big data có thể thay đổi cách thức xác định thị hiếu khách hàng của các công ty, đẩy mạnh và thay đổi cách thức tiếp thị khách hàng có hiệu quả hơn so với cách thức truyền thống. Chiến lược thâm nhập thị trường có thể tận dụng dữ liệu lớn để tạo ra các thông tin quảng bá giúp giữ chân khách hàng hiện có và nâng cao doanh số. Tương tự như vậy đối với khách hàng mới, giúp cải thiện được mức độ tin tưởng. Dữ liệu lớn không những làm thay đổi cách chúng ta tiếp cận thị trường với một sản phẩm hoặc dịch vụ, mà còn thay đổi cách chúng ta thết kế và sáng tạo ra các sản phẩm, dịch vụ. Dựa vào dữ liệu lớn, người ta có thể dự đoán xu hướng của khách hàng và sáng tạo ra các sản phẩm theo sở thích, yêu cầu riêng của họ. Big data tác động tới sự hiểu biết và mong muốn của khách hàng. Đây là một trong những lĩnh vực lớn nhất và được công bố công khai nhất cách dữ liệu lớn được sử dụng ngày nay. Dữ liệu lớn được sử dụng để hiểu rõ hơn về khách hàng và hành vi cũng như sở thích của họ. Các công ty đều mong muốn mở rộng tập dữ liệu truyền thống với các dữ liệu truyền thông xã hội, trình duyệt web để có được một bức tranh hoàn chỉnh hơn về khách hàng của họ. Ví dụ về nhà bán lẻ Target (Mỹ), những người có thể dự đoán rất chính xác khi nào một khách hàng của họ sẵn sàng mua. Sử dụng dữ liệu lớn, các công ty viễn thông
  10. 142 có thể dự đoán tốt hơn về việc khách hàng rời mạng. Hay WalMart có thể dự đoán sản phẩm gì sẽ được bán ra, và các công ty bảo hiểm xe hơi hiểu khách hàng của họ lái xe như thế nào. Interactions Marketing, một công ty tiếp thị theo hình thức tận dụng ngay chính khách hàng của mình, đã tiến hành kiểm soát dữ liệu lớn bằng cách sử dụng dữ liệu giao dịch điểm bán hàng và dữ liệu thông tin thời tiết khu vực từ nhiều nguồn khác nhau để có được những hiểu biết nhanh nhất về hành vi mua sắm của khách hàng. Phương pháp này, sử dụng một dịch vụ web để phân tích sự tương tác của các bộ dữ liệu cực lớn và công cụ phân tích hình ảnh Tableau để nhanh chóng kiểm tra số lượng lớn thông tin cho phép Interactions cắt giảm thời gian phân tích từ một vài tuần xuống còn một vài giờ hay thậm chí vài phút. Chương trình phân tích này giúp các nhà bán lẻ và các nhà sản xuất lên kế hoạch chương trình khuyến mãi tại cửa hàng trước khi những sự kiện này xảy ra (Kenneth và Viktor, 2013). Như vậy, không thể phủ nhận vai trò của big data đối với nền kinh tế nói chung và hiệu quả trong kinh doanh thương mại điện tử. Trong thời đại thông tin hiện nay thì dữ liệu lớn đang ngày càng trở thành công cụ quan trọng và hữu hiệu thúc đẩy phát triển các lĩnh vực của nền kinh tế và thực hiện các chiến dịch quảng cáo, phát triển cũng như giữ chân khách hàng giao dịch thương mại điện tử. 6. KẾT LUẬN Cuộc cách mạng công nghiệp 4.0 cùng với các vấn đề trong phát triển kinh tế - xã hội, bao gồm cả việc sử dụng Internet ngày càng tăng; sự suy giảm chi phí thu thập, truyền tải, lưu trữ và phân tích dữ liệu… dẫn đến việc tạo ra những khối lượng dữ liệu khổng lồ - big data. Đây chính là nguồn lực để thúc đẩy hình thành các ngành công nghiệp, các quy trình sản xuất kinh doanh và tạo ra sản phẩm mới. Quan trọng hơn, big data đang mở ra những cơ hội lớn trong yêu cầu chuyển dịch sang mô hình phát triển kinh tế dựa trên dữ liệu. Big data không chỉ là là công cụ phát triển trong từng khía cạnh của kinh doanh, phát triển khách hàng mà còn có vai trò to lớn để định hướng phát triển nền kinh tế của một quốc gia, là tài sản cốt lõi để tạo ra lợi thế cạnh tranh, chi phối hoạt động đổi mới sáng tạo, tăng trưởng, đóng vai trò rất lớn trong phát triển kinh tế - xã hội.
  11. 143 TÀI LIỆU THAM KHẢO Couldry, N., & Turow, J. (2014). Advertising, big data and the clearance of the public realm: marketers' new approaches to the content subsidy. International Journal of Communication, 8, 1710-1726. Davenport, T. H., and Patil, D. J., (2012), "Data scientist: the sexiest job of the 21st century," Harvard business review, 90(10), 70-77. Davenport, T. H., Barth, P., and Bean, R., 2012, “How „Big Data‟ is Different,” MIT Sloan Management Review, 54(1), 22-24. Denis Guyadeen, Rob Peglar (2012), “Introduction to Analytics and Big data- Hadoop”, SNIA Education Committee. Dean, Jeffrey, and Sanjay Ghemawat (2008), "MapReduce: simplified data processing on large clusters" Communications of the ACM 51.1: 107-113. D.Fisher, R.Deline, M.Czerwinski and S. Drucker (2012), “Interaction with big data analytics”, Volume 19, No.3. Dumbill, E (2015), What is big data? An introduction to the big data landscape. Xem trên http://radar.oreilly.com/2012/01/. Graham, M (2012), Big data and the end of theory? The Guardian. Han Hu, Yongyang Nen, Tat Seng Chua, Xuelong Li (2014), “Towards Scalable System for Big Data Analytics: A Technology Tutorial”, IEEE Access, Volume 2, Page No 653. Hồ Thị Hạnh (2019), Công nghệ big data và xu hướng ứng dụng, xem trên https:// http://congnghiepcongnghecao.com.vn/. Kenneth Cukier and Viktor Mayer-Schonberger (2013), Big Data: A Revolution That Will Transform How We Live, Work, and Think, Hachette UK. Jelinek, M., and Bergey, P., (2013), “Innovation as the strategic driver of sustainability: big data knowledge for profit and survival,” IEEE Engineering Management Review, 41(2), 14–22. Jimmy Lin and Chris Dyer (2010), Data-Intensive Text Processing with MapReduce, University of Maryland. McKinsey (2011), Big data: The next frontier for innovation, competition, and productivity, Global. McGuire, T (2013), Making data analytics work: Three key challenges. Xem trên http://www.mckinsey.com/insights/business_technology/making_data_analytics_work on the 17th April 2015. Puneet Singh Duggal, Sanchita Paul (2013), “Big Data Analysis: Challenges and Solutions”, International Conference On Cloud.
  12. 144 Ueda, N., (2012), “Communication science for the big data era,” NTT Technical Review. Available from: https://www.ntt review.jp/archive/ntttechnical.php?contents=ntr201211fa1.html. Ryan (2018), Solving Wicked Problems With Predictive Analytics, xem trên http://www.digitalistmag.com Stephen Oliver (2012), From 48 V direct to Intel VR12.0: Saving ‘Big Data’ $500,000 per data center, per year, VI Chip Product Line. Sameera Siddiqui, Deepa Gupta (2014), “Big Data Process and Analytics: A Survey”, International Journal Of Emerging Research in Management & Technology, ISSN: 2278- 9359, Volume 3, Issue 7. Tổng quan về big data trên toàn cầu trong năm 2018, xem trên https://bigdatauni.com/. Trịnh Thu Trang (2019), Nghiên cứu về lợi ích của dữ liệu lớn – big data với doanh nghiệp thương mại điện tử trong nước và trên thế giới, xem trên http://www.tapchicongthuong.vn/. Trần Việt Trung (2015), Dữ liệu lớn và làm chủ công nghệ dữ liệu lớn tại Việt Nam, ĐHBK – HN. Tuấn Anh (2017), Xử dụng hiệu quả Big Data để phát triển xã hội thông tin, xem trên https://vietnamnet.vn/ Y.Guan and H. Liao (2014), Is Big Data the Next Big Thing in Performance Measurement Systems? Proceedings of the 2014 Industrial and Systems Engineering Research Conference, Brazil.
nguon tai.lieu . vn