Các nguồn dữ liệu lớn (big data) và các tiến bộ liên quan đến công nghệ thông tin như trí tuệ nhân tạo (AI) và machine learning (ML) đang ngày càng thu hút sự chú ý của các ngân hàng trung ương (NHTW).
Kết quả khảo sát năm 2020 của IFC đã cho thấy các NHTW trên thế giới ngày càng quan tâm và sử dụng đến dữ liệu lớn nhiều hơn, các nguồn dữ liệu lớn đa dạng cũng được khai thác và sử dụng hiệu quả để hỗ trợ cho các chính sách của NHTW.
Các nguồn dữ liệu lớn đang phát triển nhanh chóng, và cùng lúc các ứng dụng với các thông tin này đang nở rộ. Điều này phản ánh tác động của quá trình số hóa, với việc phát triển của internet kết nối vạn vật (IoTs) cũng như khả năng số hóa các thông tin truyền thông ngày càng cao hơn. Nó cũng là kết quả của việc các cơ sở dữ liệu lớn đang được tạo nên một cách “hữu cơ” bởi các sản phẩm của quá trình hoạt động phức tạp trong xã hội hiện đại. Ngoài ra, một lượng dữ liệu khổng lồ cũng đã xuất hiện trong các lĩnh vực hành chính, thương mại và tài chính, sự phát triển được thúc đẩy bởi các chiến lược thu thập dữ liệu quan trọng từ sau khủng hoảng tài chính toàn cầu 2007-2009 nhằm giải quyết các thách thức về thông tin đặt ra do sự phát triển của tài chính.
Các NHTW cũng ngày càng quan tâm đến việc sử dụng dữ liệu lớn trong những năm gần đây. Các hoạt động liên quan đến dữ liệu lớn của NHTW bao gồm nhiều lĩnh vực, như chính sách tiền tệ, ổn định tài chính, nghiên cứu và thống kê. Tuy nhiên, trái ngược với tốc độ đổi mới nhanh chóng trong khu vực tư nhân, các ứng dụng dữ liệu lớn hỗ trợ công việc hoạt động của các NHTW còn hạn chế. Điều này phản ánh một số trở ngại, như thiếu nguồn lực thỏa đáng cũng như những thách thức nội tại liên quan tới sử dụng các nguồn dữ liệu lớn để hỗ trợ chính sách công.
Dữ liệu lớn đối với các NHTW
Theo báo cáo của IFC, các NHTW đã có một cái nhìn toàn diện về dữ liệu lớn, bao gồm các loại dữ liệu khác nhau. Trước hết, dữ liệu lớn thường được định nghĩa là các dữ liệu có khối lượng lớn, tốc độ sản xuất dữ liệu cao, đa dạng (về cấu trúc và định dạng). Trên thực tế, dữ liệu lớn có thể bao gồm thông tin được tạo ra bởi nhiều cách thức như các truyền thông xã hội, các hoạt động trên nền tảng web, các máy cảm biến, hoặc các hoạt động tài chính, quản trị hoặc kinh doanh. Khoảng 1/3 các NHTW tin rằng, ý tưởng về dữ liệu lớn chỉ bao gồm các dữ liệu phi truyền thống. Nhưng đối với 2/3 số được hỏi cho rằng dữ liệu lớn cũng bao gồm các tập dữ liệu lớn "truyền thống" (tức là có cấu trúc tốt). Các dữ liệu được thu thập cho các mục đích quản trị hoặc quản lý/giám sát thường được xem như "dữ liệu lớn tài chính" và thường có cấu trúc tốt.
Theo khảo sát, một định nghĩa toàn diện về dữ liệu lớn sẽ bao gồm tất cả các tập dữ liệu đòi hỏi sử dụng các công nghệ phi tiêu chuẩn để phân tích. Do các phương pháp thống kê và phân tích truyền thống bị hạn chế khi áp dụng cho các dữ liệu lớn, đặc biệt là đối với các dữ liệu phi cấu trúc, như thông tin dưới dạng văn bản hoặc hình ảnh. Điều này cho phép các NHTW phân biệt một số các danh mục của nguồn dữ liệu lớn. Đầu tiên, các tập dữ liệu phi cấu trúc (tin nhắn trên mạng xã hội, ảnh từ internet,…) từ nguồn “Internet kết nối vạn vật” - có thể không lớn, nhưng phức tạp và không thể dễ dàng quản lý bằng các kỹ thuật thống kê truyền thống.
Loại dữ liệu lớn thứ hai liên quan các tập thông tin với số lượng quan sát rất lớn theo chuỗi thời gian, bao gồm các thông tin tài chính lớn, có cấu trúc. Ngoài ra chúng cũng có thể là tập dữ liệu khác hoàn toàn mới, đặc biệt là những tập dữ liệu đã được thu thập sau cuộc khủng hoảng tài chính toàn cầu 2007-2009.
Các danh mục cụ thể khác của các thông tin cấu trúc liên quan tới các dữ liệu vốn không được xem là một phần của thống kê truyền thống được các NHTW phân tích trong quá khứ, như các giao dịch thanh toán. Danh mục thứ hai liên quan đến các tệp thông tin liên ngành cung cấp phổ biến và được thu thập với nhiều thuộc tại một thời điểm..
Sự quan tâm của các NHTW với dữ liệu lớn
Mức độ quan tâm của các NHTW đối với dữ liệu lớn đã tăng lên đáng kể trong những năm gần đây, đặc biệt so với các kết quả khảo sát năm 2015. Chủ đề về dữ liệu lớn hiện đang chiếm một vị trí rất quan trọng trong các cuộc thảo luận chính thức tại gần 45% các NHTW được khảo sát (tăng từ 12% trong năm 2015). Chỉ có 15% người được hỏi cho rằng chủ đề này vẫn không hoặc ít được thảo luận trong cơ quan của họ (giảm từ 35% năm 2015). Mức độ quan tâm thậm chí còn cao hơn trong đội ngũ lãnh đạo cấp cao của các NHTW với gần 65% số này đánh giá đây là một chủ đề “rất quan trọng”, so với tỷ lệ dưới 10% vào năm 2015.
Mức độ quan tâm đến dữ liệu lớn đặc biệt mạnh ở các nền kinh tế phát triển (AE) đồng thời cũng có sự gia tăng đáng kể tại các nền kinh tế thị trường mới nổi (EME). Tuy nhiên, sự quan tâm này có khác biệt phụ thuộc vào mức độ phát triển của nền kinh tế khi 2/3 NHTW tại các AE đánh giá các thảo luận về dữ liệu lớn là “rất quan trọng” thì có đến ½ số NHTW tại các EME đánh giá là “bình thường”. Tại các AE, chủ đề được chú ý nhất là: lưu trữ dữ liệu; các vấn đề về nguồn nhân lực và cơ sở hạ tầng; trong khi tại các EME chủ yếu tập trung vào mức độ sẵn có của dữ liệu và cơ sở hạ tầng. Sự khác biệt này phản ánh các giai đoạn phát triển khác nhau, khi các AE đang sẵn sàng chủ động tìm hiểu làm cách nào để khai thác dữ liệu lớn, một số NHTW tại các EME vẫn đang phải tìm cách đạt được sự tiếp cận cơ bản đến dữ liệu lớn.
Sử dụng dữ liệu lớn tại các NHTW
Khảo sát 2020 của IFC cho thấy việc sử dụng dữ liệu lớn của các NHTW đã tăng lên rõ rệt so với năm 2015. Hơn 80% NHTW được khảo sát hiện sử dụng dữ liệu lớn các nguồn hỗ trợ công việc của họ, tăng từ 30% vào 5 năm trước. Tuy nhiên, việc sử dụng các nguồn dữ liệu lớn thường xuyên hơn tại các nền kinh tế phát triển so với các nền kinh tế mới nổi.
Phạm vi nguồn dữ liệu lớn được khai thác bởi các NHTW rất đa dạng. Một nguồn chủ yếu từ khu vực tư nhân là nguồn “internet kết nối vạn vật”, như các ứng dụng do nhiều NHTW phát triển để quét các cổng thông tin trực tuyến để thu thập thông tin dưới dạng số (ví dụ giá hàng hóa được bán trên web) hoặc dạng văn bản (ví dụ các thông điệp được đăng tải trên các phương tiện truyền thông xã hội). Một nguồn thông tin quan trọng khác là các văn bản từ tài liệu in được xử lý bằng kỹ thuật số. Các NHTW cũng đang tăng cường sử dụng các dữ liệu lớn về tài chính được thu thập theo cách “truyền thống” hơn, chẳng hạn như thông tin về các bảng cân đối kế toán có sẵn trong các đăng ký tín dụng, cơ sở dữ liệu cho vay và bảo mật, các giao dịch phái sinh được báo cáo với kho lưu trữ giao dịch (TRs), và các giao dịch thanh toán.
Kết quả khảo sát chỉ ra, dữ liệu lớn đang được sử dụng hiệu quả để hỗ trợ cho các chính sách của NHTW. Liên quan đến chính sách tiền tệ và các nhiệm vụ ổn định tài chính của NHTW, các cơ sở dữ liệu và kỹ thuật mới đây đang được huy động nhiều hơn để hỗ trợ cho các kinh tế phân tích và thực hiện các dự báo, xây dựng các tín hiệu thị trường thời gian thực và phát triển các chỉ báo cảm tính từ nguồn dữ liệu bán cấu trúc. Điều này đã được chứng minh đặc biệt hữu ích trong thời điểm bất ổn hoặc biến động kinh tế tăng cao, như được thấy trong suốt đại dịch Covid-19. Kết quả khảo sát của IFC cũng cho thấy đa số các NHTW đang sử dụng dữ liệu lớn cho việc giám sát và quy định ở cấp vi mô, với việc tăng cường tập trung vào bảo vệ người tiêu dùng; như để đánh giá các hành vi sai trái, phát hiện các giao dịch gian lận hoặc chống rửa tiền.
Thách thức đối với NHTW khi sử dụng dữ liệu lớn
Khảo sát của IFC nhấn mạnh sự cần thiết về cơ sở hạ tầng công nghệ thông tin và nguồn lực con người thỏa đáng. Nhiều NHTW đã triển khai các sáng kiến quan trọng để phát triển các nền tảng dữ liệu lớn nhằm tạo điều kiện thuận lợi cho việc lưu trữ và xử lý các tập dữ liệu rất lớn và phức tạp. Tuy nhiên tiến độ có sự khác biệt, điều này phản ánh các khoản đầu tư này có chi phí cao và phải đánh đổi các yếu tố khác khi theo đuổi các chương trình này. Ngoài ra, các NHTW cần phải tuyển dụng và đào tạo đội ngũ nhân viên vốn rất khó khăn do nguồn cung nhân lực có đủ kỹ năng còn hạn chế.
Bên cạnh khía cạnh công nghệ thông tin, các NHTW cũng phải đổi mặt với nhiều thách thức khác. Chúng bao gồm cơ sở pháp lý cho việc sử dụng các thông tin cá nhân và các yêu cầu về bảo vệ quyền riêng tư và vấn đề đạo đức liên quan đến việc này, cũng như yêu cầu "sự công bằng" và độ chính xác của các nguyên tắc được phát triển trên dữ liệu được phân loại trước và/hoặc không mang tính đại diện cho các tập hợp. Các vấn đề về chất lượng dữ liệu cũng rất rõ ràng, bởi phần lớn dữ liệu lớn mới được thu thập như một sản phẩm phát sinh của các hoạt động kinh tế hoặc xã hội và cần được tổ chức trước khi có thể tiến hành các phân tích thống kê phù hợp. Điều này trái ngược với các nguồn thống kê chính thức truyền thống được thiết kế cho một mục đích cụ thể, như khảo sát hay điều tra dân số.
Một vấn đề quan trọng nữa là đảm bảo các dự đoán dựa trên dữ liệu lớn không chỉ chính xác mà cũng "có thể hiểu được" và mang tính đại diện, để triển khai các chính sách dựa trên cơ sở bằng chứng, các cần xác định các nguyên nhân hoặc các yếu tố lý giải cụ thể. Ngoài ra, sự minh bạch liên quan đến thông tin được cung cấp bởi các nhà cung cấp dữ liệu lớn là cần thiết để đảm bảo chất lượng của thông tin có thể được kiểm tra và các quyết định được thực hiện trên cơ sở được thông tin rõ ràng, đầy đủ. Cuối cùng, có những hạn chế quan trọng về pháp lý làm giảm mức độ tự do của các NHTW khi sử dụng dữ liệu riêng tư và bí mật.
Hoạt động hợp tác có thể tạo điều kiện cho các NHTW sử dụng dữ liệu lớn, đặc biệt thông qua việc thu thập và giới thiệu các dự án thành công và tạo điều kiện chia sẻ kinh nghiệm để tránh lặp lại sai lầm đã xảy ra. Cụ thể, tổ chức các thảo luận kỹ thuật giữa các tổ chức được xem là một cách làm hiệu quả để xây dựng và phát triển các kỹ năng cần thiết cho đội ngũ nhân viên và phát triển các công cụ CNTT liên quan và các nguyên tắc phù hợp nhất với nhu cầu của các NHTW.
Các tổ chức tài chính quốc tế có thể giúp thúc đẩy sự hợp tác này thông qua giúp phát triển kiến thức dữ liệu lớn nội bộ, giảm bớt sự phụ thuộc của các NHTW vào các nhà cung cấp dịch vụ dữ liệu lớn. Các tổ chức tài chính quốc tế cũng có thể tạo điều kiện đổi mới bằng cách thúc đẩy các giải pháp và sáng kiến công nghệđể nâng cao cơ sở hạ tầng thống kê toàn cầu. Ngoài ra, họ có thể cung cấp tài nguyên của mình trên toàn cầu hoặc phát triển năng lực điện toán đám mây chung để giảm rủi ro hoạt động phát sinh từ việc phụ thuộc vào các nhà cung cấp cụ thể trong một thị trường có sự tập trung cao độ.
Theo SBV