Những thành phố thông minh đang không ngừng phát triển theo xu hướng thời đại. Để vận hành, quản lý thành phố hiệu quả hơn, nền tảng dữ liệu là công cụ được đánh giá cao và đưa vào ứng dụng thực tiễn bởi các nhà quản lý thành phố.
Nền tảng dữ liệu được đánh giá là “chìa khóa” giải quyết nhiều bài toán của chính phủ điện tử. Đặc biệt là trong thời đại cách mạng 4.0, việc tập trung, tận dụng hiệu quả nguồn dữ liệu hiện có giúp chính phủ nâng cao chất lượng dịch vụ công, đồng thời hỗ trợ cơ quan chức năng quản lý và vận hành thành phố thông minh (Smart city) hiệu quả.
1. Nền tảng dữ liệu là gì?
Nền tảng dữ liệu (Data Platform) là một thành phần của Trung tâm điều hành thông minh IOC (Intelligent Operation Center) tập hợp tích hợp các công nghệ đáp ứng chung nhu cầu dữ liệu từ đầu đến cuối của một tổ chức. Đây là giải pháp toàn diện cho phép thu thập, lưu trữ, chuẩn bị, phân phối cũng như quản trị, đồng thời bảo mật an toàn dữ liệu cho người dùng.
Tại đây, dữ liệu cũng được trực quan hóa bởi nhiều hệ thống, công cụ, quy trình công nghệ tiên tiến, từ đó cung cấp cho người dùng bức tranh toàn cảnh để hiểu được cách phối hợp dữ kiện, hỗ trợ đưa ra quyết định chính xác.
Một trong những đặc điểm nổi bật nhất của nền tảng dữ liệu là tập trung hóa. Nó quản lý nhiều loại dữ liệu khác nhau và cấu trúc chúng, làm cho dữ liệu có giá trị hơn. Chỉ trên cùng một nền tảng duy nhất, chính phủ, các bộ ban ngành, cơ quan, lực lượng chức năng, tổ chức trong thành phố đều có thể sử dụng để theo dõi, nắm bắt thông tin.
2. Ưu điểm của nền tảng dữ liệu
Trong 20 năm qua, những đơn vị cung cấp dịch vụ công nghệ thông tin đã cố gắng nghiên cứu, phát triển giải pháp cho “cơn bão” dữ liệu mà nhiều thành phố phải đối mặt, từ cả bên trong lẫn bên ngoài.
Công nghệ Đám mây (Cloud) đáp ứng tiêu chuẩn trong thời đại mới. Kho dữ liệu dựa trên Đám mây hiện được xử lý song song, hàng loạt một cách nhanh chóng. Mặc dù công nghệ đám mây đã có nhiều tiến bộ, mang lại một số hiệu quả nổi bật, nhưng hầu hết thành phố hiện vẫn chưa thể tích hợp công cụ này.
Xem thêm bài viết: Điện toán đám mây là gì? Ứng dụng công nghệ điện toán đám mây
Kết quả là silo dữ liệu (nhóm dữ liệu thô mà chỉ một bộ phận, phòng ban được quyền truy cập nhưng không bị cô lập với phần còn lại của doanh nghiệp) thường không thể mở rộng, dữ liệu bị trùng lặp, lỗi thời, không thể truy cập và lớp bảo mật chưa chặt chẽ.
Nền tảng dữ liệu hiện đại ra đời, cố gắng giải quyết vấn đề này. Đó là sự kết hợp của các công nghệ có khả năng tương tác, mở rộng, có thể thay thế cùng hoạt động để cung cấp nhu cầu dữ liệu tổng thể cho thành phố thông minh.
Nền tảng dữ liệu có những lợi ích như sau:
Lưu trữ, sắp xếp, tổ chức và lập chỉ mục số lượng lớn dữ liệu từ nhiều nguồn, bao gồm cả bên trong lẫn bên ngoài.
Tập trung, phân loại, thống nhất dữ liệu trên một nền tảng duy nhất, giúp nhà quản lý thành phố có cái nhìn tổng quan hơn về vấn đề họ quan tâm.
Dễ dàng truy cập dữ liệu, chia sẻ thông tin chi tiết, có liên quan giữa các bộ phận, tổ chức, đơn vị để giảm thiểu sai sót. Nhờ vậy, quy trình làm việc liền mạch hơn, năng suất hơn.
Đảm bảo rằng dữ liệu có thể sao lưu và phục hồi tự động hiệu quả, đồng thời được bảo mật kỹ càng.
Thực thi, duy trì sự tuân thủ, văn hóa trong toàn tổ chức.
Nền tảng dữ liệu mang lại nhiều lợi ích cho sự phát triển của thành phố thông minh - Ảnh: Internet
3. Những yếu tố nền tảng dữ liệu số hiện đại cần có
Xây dựng nền tảng dữ liệu trong giai đoạn 4.0 yêu cầu áp dụng Kiến trúc dữ liệu hiện đại (MDA - Modern Data platform Architecture), chỉ định cách dữ liệu sẽ được thu thập, làm sạch, lưu trữ, chuyển đổi, xử lý và cung cấp cho người dùng. Kiến trúc dữ liệu hiện đại có các đặc điểm sau:
Cung cấp năng lượng cho người dùng
Người dùng cuối là trung tâm của kiến trúc nền tảng dữ liệu hiện đại. Thay vì bị giới hạn trong một tập hợp tài sản dữ liệu có sẵn từ trước, người dùng dễ dàng đưa dữ liệu của riêng họ lên nền tảng, tạo ra đường dẫn mới để nhập, làm sạch, phân tích và báo cáo dữ liệu.
Sức mạnh của đám mây lai
Nền tảng dữ liệu hiện đại tận dụng tối ưu điểm mạnh của những phần cứng, phần mềm tại chỗ (On premise) và đám mây lai (Hybrid Cloud). On premise đảm bảo thực hiện sự thay đổi tối thiểu đối với các ứng dụng đã cũ. Đám mây có khả năng mở rộng, linh hoạt với sức mạnh xử lý tốt, tính khả dụng cao, có ứng dụng xây dựng sẵn và bảo mật.
Nền tảng dữ liệu tận dụng sức mạnh của Hybrid Cloud và On premise - Ảnh: Internet
Lớp dữ liệu ảo dùng chung
Cốt lõi của nền tảng dữ liệu hiện đại là lớp lưu trữ dữ liệu ảo xử lý nhiều định dạng dữ liệu khác nhau cùng khối lượng công việc lớn. Lớp lưu trữ này sẽ có vẻ trừu tượng hơn so với các thành phần khác trong nền tảng.
Ở cấp độ thấp, người dùng và ứng dụng sẽ truy cập lớp dữ liệu ảo thông qua sử dụng một bộ giao thức, tiêu chuẩn chung. Từ góc độ sử dụng, dữ liệu này sẽ được liên kết, đồng thời ảo hóa một cách minh bạch, cho phép người dùng chia sẻ, cộng tác trên đó.
Tích hợp dữ liệu mở rộng
Một kiến trúc dữ liệu linh hoạt sử dụng hệ thống quy trình có khả năng mở rộng quy mô để xử lý nhiều loại tình huống khác nhau: Sử dụng API nhập hàng loạt dữ liệu từ nguồn cũ; Xuất bản/đăng ký (pub/sub) thông báo sự kiện không đồng bộ; Xử lý luồng cho dữ liệu tốc độ cao, thời gian thực,...
Logic xử lý mở rộng
Kiến trúc xử lý của nền tảng dữ liệu hiện đại cho phép phát triển và sử dụng lại các ứng dụng hướng dịch vụ (SOA - Service-Oriented Applications). Chúng đảm nhận chức năng dành riêng cho miền, thường dựa trên công nghệ nguồn mở.
Trong hầu hết trường hợp nâng cao, nền tảng dữ liệu hiện đại cũng cho phép phát triển nhiều ứng dụng thế hệ tương lai dựa trên logic Trí tuệ nhân tạo (AI - Artificial Intelligence) và Máy học (ML - Machine learning) trong không gian làm việc khác nhau.
Nhờ đó, người dùng dễ dàng xây dựng ứng dụng của họ liền mạch từ một bộ thành phần có khả năng tương tác tiêu chuẩn.
Quản trị đầu cuối
Dữ liệu được tự động phân loại, gắn thẻ trên nền tảng dữ liệu. Nền tảng cung cấp danh mục dữ liệu toàn diện, cho phép người dùng tự khám phá để tìm ra dữ liệu phù hợp, phục vụ cho nhu cầu sử dụng.
Ngoài ra, mô hình quản trị đầu cuối cho phép người dùng kiểm tra chất lượng cũng như độ nhạy của dữ liệu. Báo cáo dòng dữ liệu có thể hiển thị hành trình phần tử dữ liệu thông qua hệ thống bất kỳ lúc nào.
Phân tích tự phục vụ
Lớp phân tích cho phép phát triển, phân phối, chia sẻ bảng điều khiển, báo cáo và sổ ghi chép tự phục vụ dựa trên công nghệ linh hoạt. Các tổ chức sẽ tận dụng những ứng dụng phân tích hiện có của họ bằng cách sử dụng nhiều thư viện tích hợp khác nhau.
Tự động hóa cho tính linh hoạt
Kiến trúc dữ liệu hiện đại chủ yếu dựa vào tự động hóa, phục vụ hai mục tiêu chính: Cơ sở hạ tầng và tích hợp dữ liệu.
Về cơ sở hạ tầng, cần đảm bảo tất cả yếu tố vật lý của nền tảng dữ liệu như máy chủ, bản sao lưu, bộ lưu trữ, bộ cân bằng tải có thể dễ dàng tái tạo lại từ đầu nếu cần.
Về tích hợp dữ liệu, phải đảm bảo đường dẫn dữ liệu, không gian làm việc, sổ ghi chép, chức năng được tạo ra từ mẫu tiêu chuẩn bất cứ khi nào tích hợp nguồn dữ liệu mới.
Lớp bảo mật đơn
Cuối cùng, lớp bảo mật đơn của kiến trúc dữ liệu hiện đại tóm tắt cơ chế truy cập của các ứng dụng riêng lẻ. Kết hợp với Nhà cung cấp danh tính (IdP - Identity provider) của thành phố, nó xác thực, ủy quyền dựa trên vai trò để truy cập. Kiến trúc dữ liệu vững chắc cũng đảm bảo dữ liệu được bảo vệ bằng cách tuân thủ nghiêm ngặt tiêu chuẩn quy định.
Nền tảng dữ liệu là mấu chốt để hiểu, quản lý, truy cập dữ liệu, từ quy mô rộng lớn như toàn thành phố đến quy mô doanh nghiệp nhỏ hơn. Cuối cùng, điều quan trọng là người dùng muốn làm gì và thu lại được gì dữ liệu của mình. Dữ liệu được quản lý tốt sẽ hỗ trợ đưa ra những quyết định sáng suốt, từ đó góp phần thúc đẩy sự phát triển bền vững.