Ngày 29/03/2023, tại Hà Nội, Hiệp hội Ngân hàng Việt Nam (VNBA) đã phối hợp với công ty Amazon Web Services (AWS) tổ chức khai giảng khóa đào tạo “Phân tích dữ liệu trong hoạt động Ngân hàng”. Tham gia khóa đào tạo có khoảng 1.100 học viên đến từ các tổ chức hội viên Hiệp hội Ngân hàng Việt Nam.
>Ứng dụng công nghệ hỗ trợ phòng, chống rửa tiền và quản trị rủi ro
>Hơn 2.000 học viên tham gia tập huấn về Luật Phòng, chống rửa tiền (sửa đổi)
Khóa đào tạo được tổ chức theo hình thức trực tiếp và trực tuyến trên nền tảng Webex, nhằm phổ cập, giới thiệu cho nhân viên ngân hàng có cơ hội học hỏi và làm quen với các dịch vụ Phân tích dữ liệu lớn.
Ông Nguyễn Thanh Sơn, Giám đốc Trung tâm Đào tạo Hiệp hội Ngân hàng Việt Nam
Phát biểu khai mạc, ông Nguyễn Thanh Sơn cho biết, trong bối cảnh thực hiện chuyển đổi số một cách mạnh mẽ, các ngân hàng đều đang ứng dụng các giải pháp kỹ thuật, công nghệ mới như điện toán đám mây, phân tích dữ liệu, dữ liệu lớn, tự động hóa quy trình bằng robot, trí tuệ nhân tạo, Học máy, chuỗi khối, nhận biết và định danh khách hàng bằng eKYC,...
Theo đó, các hoạt động nghiệp vụ và cung ứng sản phẩm, dịch vụ để nâng cao hiệu quả hoạt động và tăng trải nghiệm cho khách hàng. Trong đó, trí tuệ nhân tạo, Học máy là những giải pháp công nghệ hiện đại đang được các ngân hàng chú trọng nghiên cứu, ứng dụng phổ biến để đánh giá phân tích hành vi, nhu cầu khách hàng giúp tối ưu hóa, cá nhân hóa việc cung ứng sản phẩm, dịch vụ. Các giải pháp công nghệ này mặc dù còn rất mới mẻ nhưng đây lại là nhân tố trọng tâm cùa các ngân hàng trong việc ứng dụng AI đối với chiến lược phát triển ngân hàng số cũng như ứng dụng các mô hình do máy học phân tích vào các nghiệp vụ ngân hàng nhằm đánh giá và quản trị rủi ro, phân khúc khách hàng từ đó phát triển các sản phẩm, dịch vụ an toàn.
Theo số liệu khảo sát cũa Ngân hàng Nhà nước, đến cuối năm 2022, khoảng 97% các ngân hàng đã xây dựng kho dữ liệu tập trung (Data warehouse), khoảng 75% các ngân hàng đã xây dựng các hồ dữ liệu (Data lake) để thu thập dữ liệu thô đến từ các điểm tiếp xúc số và gần như 100% các ngân hàng đã ứng dụng phân tích dữ liệu để tối ưu hóa quy trinh vận hành, tăng hiệu quà hoạt động, quán trị rủi ro,...
Tuy nhiên, hiệnquá trình xây dựng hệ thống quản lý dữ liệu của các ngân hàng vẫn còn gặp phải nhiều khó khăn và thách thức như: Có rất nhiều loại dữ liệu trong hệ thống; logic nghiệp vụ phức tạp; nguồn nhân lực chưa đáp ứng được yêu cầu; khuôn khổ pháp lý hỗ trợ công tác khai thác dữ liệu lớn; đảm bảo an toàn, bảo mật dữ liệu cho khách hàng chưa đầy đủ.
Cùng với đó, cần hình thành các quy định, hướng dẫn cụ thể về hoạt động của các bên tham gia thị trường có liên quan tới các dịch vụ tài chính quản lý ví dụ như mối quan hệ giữa các tổ chức tài chính với các công ty về dữ liệu và phân tích dữ liệu là bên thứ ba độc lập. Dữ liệu của các tổ chức công cần phải được công bố để các bên có thể dễ tiếp cận và sử dụng cho mục đích kinh doanh.
Ông Trần Minh Hải - chuyên gia kỹ thuật Công ty Amazon Web Services
Ông Trần Minh Hải - chuyên gia kỹ thuật Công ty Amazon Web Services, đã giảng dạy chi tiết về nội dung khóa đào tạo theo 4 phần, cụ thể: (1)Giới thiệu về Big Đata; (2) Phân tích dữ liệu (Data Analytics); (3) Đi sâu vào các dịch vụ; (4) Hướng dẫntạo các trường người dùng (User Case); Trong đó, đặc biệt đi sâu vào giảng dạy cách tạo cập nhật các dịch vụ truy vấn thông tin trong cơ sở dữ liệu để làm báo cáo.
Chuyên gia Trần Minh Hải đã dành phần lớn thời gian giảng dạy về Data Lake (hay Hồ dữ liệu) và Data Lakehouse. Về Data Lake (hay Hồ dữ liệu) là một kho lưu trữ tập trung được thiết kế để lưu trữ, xử lý và bảo mật một lượng lớn dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc. Nó có thể lưu trữ dữ liệu ở định dạng gốc và xử lý mọi loại dữ liệu khác nhau, bỏ qua các giới hạn về kích thước. Nó cung cấp số lượng dữ liệu cao để tăng hiệu suất phân tích và tích hợp gốc.
Data Lake cung cấp một nền tảng có thể mở rộng và an toàn cho phép các ngân hàng, doanh nghiệp: nhập bất kỳ dữ liệu nào từ bất kỳ hệ thống nào ở bất kỳ tốc độ nào - ngay cả khi dữ liệu đến từ các hệ thống vật lý, đám mây hoặc điện toán biên; lưu trữ bất kỳ loại hoặc khối lượng dữ liệu nào với độ tin cậy cao; xử lý dữ liệu theo thời gian thực hoặc chế độ hàng loạt; và phân tích dữ liệu bằng SQL, Python, R hoặc bất kỳ ngôn ngữ nào khác, dữ liệu của bên thứ ba hoặc ứng dụng phân tích.
Đặc biệt, Data Lake còn có thể lưu trữ dữ liệu ở định dạng gốc mà không yêu cầu quá khắt khe, không giới hạn số dung lượng, bản ghi hay số file. Điều này cho phép người dùng sử dụng nhiều định dạng dữ liệu khác nhau, đồng thời làm tăng khả năng phân tích trên các nền tảng.
Với ưu điểm như vậy, Data Lake đã và đang được ứng dụng cho lĩnh vực khoa học dữ liệu yêu cầu lượng dữ liệu khổng lồ và các kỹ thuật phân tích hiện đại như mô hình dự đoán và khai thác dữ liệu, machine learning.
Data Lake có ưu điểm là khả năng khai thác nhiều loại dữ liệu từ nhiều nguồn khác nhau chỉ trong thời gian ngắn, đồng thời cấp quyền cho người dùng cộng tác và phân tích dữ liệu theo nhiều cách khác nhau, giúp cho việc ra quyết định được nhanh chóng và chuẩn xác hơn. Một số lợi ích nổi bật của Data Lake bao gồm:(i)Cải thiện tương tác với khách hàng; (ii)Cải thiện các lựa chọn đổi mới R&D; (iii)Tăng hiệu quả hoạt động
Đối với Data Lakehouse là một kiến trúc quản lý dữ liệu mở, mới, kết hợp tính linh hoạt, hiệu quả về chi phí và quy mô của các Data Lakes với việc quản lý dữ liệu và giao dịch ACID của Data Warehouse, cho phép kích hoạt business intelligence (BI) và machine learning (ML) trên tất cả dữ liệu. Nhờ các lớp metadata cho Data Lakes. Thiết kế công cụ truy vấn mới cung cấp thực thi SQL với hiệu suất cao trên Data Lakes. Tối ưu quyền truy cập cho data science và machine learning.
Đọc và ghi dữ liệu đồng thời. Hỗ trợ lược đồ với các cơ chế quản lý dữ liệu. Truy cập trực tiếp vào dữ liệu nguồn. Tách biệt tài nguyên lưu trữ và tính toán. Các định dạng lưu trữ được tiêu chuẩn hóa. Hỗ trợ các kiểu dữ liệu có cấu trúc và bán cấu trúc, bao gồm cả dữ liệu IoT.
Khả năng khai thác trí thông minh từ dữ liệu phi cấu trúc (văn bản, hình ảnh, video, âm thanh) làm cho việc xử lý các loại dữ liệu này trở nên quan trọng đối với doanh nghiệp.
Tuy nhiên, theo truyền thống, data warehouse không được tối ưu hóa cho các kiểu dữ liệu phi cấu trúc này, do đó cần phải quản lý đồng thời nhiều hệ thống.
Lakehouse có một số lợi thế so với một hệ thống nhiều giải pháp, như: cần ít thời gian và công sức quản lý Quản trị dữ liệu và lược đồ được đơn giản hóa. Giảm di chuyển và dư thừa dữ liệu. Truy cập trực tiếp vào dữ liệu cho các công cụ phân tích. Lưu trữ dữ liệu hiệu quả về chi phí.
Hình ảnh minh hoạ về Data Warehouse, Data Lake và Data Lakehouse
Khóa học là cơ hội để các ngân hàng trao dổi và chia sẻ với chuyên gia của AWS về những kinh nghiệm quản lý, ứng dụng phân tích dữ liệu trong hoạt động kinh doanh ngân hàng, hiểu được tầm quan trọng về đảm bảo an toàn cho kiến trúc phân tích dữ liệu, kiểm soát dữ liệu phục vụ mục đích tuân thú và cái thiện hiệu quá hoạt động.
Tại buổi đào tạo, giảng viên cùng các chuyên gia của AWS đã trả lời nhiều câu hỏi của các học viên. Kết thúc khóa đào tạo đã được các học viên đón nhận nhiệt tình và đánh giá cao từ nội dung chương trình đến phương pháp giảng dạy. Kiến thức mà các giảng viên đã truyền đạt được minh họa trực tiếp qua từng ví dụ hấp dẫn và còn gắn liền với thực tế từ AWS.
Toàn cảnh khóa đào tạo
VNBA NEWS