
Lưu trữ tài liệu lưu trữ số - Ảnh: Internet
Định hướng chuyển đổi số của quốc gia xác định dữ liệu được coi là tài sản chiến lược và cần được áp dụng triển khai quản trị hợp lý. Điều này đặt ra bài toán quan trọng về việc lưu trữ, bảo quản và đảm bảo khả năng truy cập lâu dài của dữ liệu.
1. Lưu trữ số là gì?
Lưu trữ số là quá trình đảm bảo cơ sở dữ liệu và thông tin số quan trọng có thể được duy trì, truy cập, tìm kiếm và sử dụng trong tương lai. Khi công nghệ đang ngày càng phát triển và các hình thức, định dạng của thông tin có thể trở nên lỗi thời, không còn truy cập được, lưu trữ điện tử được thực hiện để đảm bảo tính toàn vẹn và độ chính xác của dữ liệu.
Theo Luật lưu trữ số 33/2024/QH15, bên cạnh việc gìn giữ và khai thác tài liệu, hoạt động lưu trữ số còn được triển khai nhằm đảm bảo quyền tiếp cận thông tin điện tử của công dân, từ đó phục vụ sự nghiệp xây dựng và bảo vệ Tổ quốc.
Lưu trữ số đi kèm với một số nguyên tắc cơ bản như phải đảm bảo tính toàn vẹn, bền vững, xác thực của thông tin và các bước bắt buộc như thẩm định, nhận diện dữ liệu nhằm phục vụ cho việc truy cập trong tương lai.
Quá trình lưu trữ điện tử gồm những bước chính như sau: Lập kế hoạch, Phân bổ tài nguyên, Kết hợp với các chính sách và chiến lược đảm bảo nội dung số, Đưa vào hệ thống lưu trữ và bảo quản. Mục tiêu của quá trình này là số hoá tài liệu, đảm bảo dữ liệu số luôn được bảo mật, xác thực và sẵn có, giúp ngăn chặn ảnh hưởng từ lỗi thiết bị hay thay đổi công nghệ theo thời gian.
Trong bối cảnh chuyển đổi số của quốc gia, lưu trữ số được xác định là “hành trình” bắt buộc của các cơ quan, tổ chức, cá nhân nhằm gìn giữ và bảo quản khối lượng dữ liệu pháp lý khổng lồ. Tại Việt Nam, việc phát triển nền tảng lưu trữ dữ liệu quốc gia hiện được đang định hướng theo mô hình OAIS, với tên gọi tiêu chuẩn là ISO 1472. Song, đây vẫn là bài toán thách thức đối với hệ thống quản lý số tại các cơ quan, tổ chức khi phải đảm bảo đồng thời 3 mục tiêu: lưu trữ an toàn, bảo quản lâu dài, khai thác hiệu quả.
2. Mô hình OAIS - lời giải cho bài toán lưu trữ số
OAIS (Open Archival Information System) là mô hình cho hệ thống lưu trữ số chuyên nghiệp, có nhiệm vụ tiếp nhận, bảo quản và cung cấp truy cập thông tin cho cơ quan và tổ chức trong dài hạn. Xuất phát điểm là giải pháp lưu trữ điện tử của NASA, mô hình OAIS đã được phát triển thành khung tham chiếu và được chuẩn hoá bởi Tổ chức Tiêu chuẩn hoá Quốc tế với tên gọi ISO 14721.
Về bản chất, mô hình thông tin OAIS được xây dựng dựa trên khái niệm gói thông tin bao gồm đối tượng thông tin (Information Object) là tài liệu, hồ sơ, văn bản, công trình lưu trữ và siêu dữ liệu hỗ trợ việc bảo tồn, truy cập các đối tượng. Trong đó, có 3 biến thể gói thông tin của OAIS như sau:
SIP (Submission Information Package): Gói tin chứa hồ sơ và dữ liệu, tài liệu được nộp từ nguồn lưu trữ hiện hành vào
AIP (Archival Information Package): Gói tin chứa hồ sơ, tài liệu lưu trữ được chuẩn hoá và bảo quản trong hệ thống
DIP (Distribution Information Package): Gói tin chứa tài liệu sử dụng cung cấp cho người dùng
Qua quá trình tiêu chuẩn hoá, khác với thông thường, thuật ngữ "mở" trong OAIS được hiểu là hệ thống được phát triển trong diễn đàn mở, lượng thông tin trong hệ thống có thể được chia sẻ và trao đổi, tuy nhiên việc truy cập vào kho lưu trữ vẫn sẽ được kiểm soát và quản lý. Vì vậy, OAIS được phát triển nhằm mục đích tạo ra một khung tham chiếu chung, tạo điều kiện cho việc xây dựng sự đồng thuận rộng rãi về yêu cầu lưu trữ số lâu dài và làm nền tảng cho các tiêu chuẩn số hoá dữ liệu và bảo quản số khác.
3. Vai trò của OAIS trong lưu trữ số
Vai trò cốt lõi của mô hình OAIS là đảm bảo thông tin được lưu trữ có thể được bảo tồn, quản lý và truy xuất một cách đáng tin cậy trong dài hạn, bất chấp sự thay đổi của công nghệ và nhu cầu người dùng. Để thực hiện điều này, OAIS định nghĩa sáu chức năng chính liên kết chặt chẽ với nhau, tạo thành một quy trình khép kín từ khi tiếp nhận đến khi cung cấp thông tin cho người dùng.

Mô hình OAIS và quy trình 6 chức năng - Ảnh: Internet
3.1. Tiếp nhận (Ingest)
Hệ thống lưu trữ OAIS tiếp nhận và thu thập gói tài liệu SIP từ bên cung cấp và tạo gói tài liệu lưu trữ AIP. Trong đó, hệ thống sẽ kiểm định thông tin đảm bảo độ xác thực và toàn vẹn; chuyển các dữ liệu thành định dạng gói tài liệu AIP để lưu trữ và quản lý trong hệ thống; trích xuất thông tin về gói tài liệu AIP và chuẩn bị hồ sơ để lưu trữ.
3.2. Kho lưu trữ (Archival Storage)
Khi được đưa vào kho lưu trữ, nội dung thông tin sẽ được lưu trữ dưới hình thức số hoá phù hợp, ví dụ như trực tuyến, ngoại tuyến, gần đường truyền. Để dữ liệu có thể hiển thị trong thời gian dài, kho lưu trữ sẽ thực hiện quy trình cập nhật, làm mới định kỳ các phương tiện hoặc chuyển đổi định dạng dữ liệu. Bên cạnh đó, kho lưu trữ cũng triển khai một số cơ chế bảo vệ dữ liệu như quy trình kiểm tra lỗi hay chính sách phục hồi dữ liệu. Dữ liệu điện tử sẽ được truy xuất sau đó để phục vụ cho nhu cầu truy cập của người dùng.
3.3. Quản lý dữ liệu (Data Management)
Chức năng quản lý dữ liệu duy trì và xác định các thông tin mô tả đối tượng được lưu trữ trong kho để hỗ trợ công cụ tìm kiếm của OAIS. Hệ thống sẽ thực hiện truy vấn trên những cơ sở dữ liệu này, hỗ trợ cập nhật biên mục thông tin và tạo báo cáo, cũng như quản lý hoạt động hệ thống nội bộ của OAIS.
3.4. Truy cập (Access)
Dữ liệu từ kho lưu trữ số của OAIS sẽ được yêu cầu và truy cập bởi người dùng. Các dịch vụ được cung cấp tại đây bao gồm xử lý vấn đề kho lưu trữ của OAIS, chuyển tiếp yêu cầu đến kho lưu trữ và quản lý dữ liệu, lọc và điều chỉnh định dạng dữ liệu, trình bày gói thông tin tới người dùng. Ngoài ra, chức năng truy cập của hệ thống cũng thực hiện cơ chế đảm bảo bảo mật và kiểm soát truy cập liên quan tới những nội dung được lưu trữ.
3.5. Quản trị (Administration)
Chức năng quản trị chịu trách nhiệm quản lý và điều hành toàn hệ thống, trong đó bao gồm thiết lập và duy trì chính sách cho các ban quản lý, đàm phán và quản lý thỏa thuận với nhà sản xuất, hỗ trợ dịch vụ khách hàng và quản lý cộng đồng người dùng.
3.6. Lập kế hoạch bảo quản (Preservation Planning)
Bộ phận lập kế hoạch bảo quản có chức năng đưa ra chiến lược bảo tồn của OAIS. Từ việc giám sát những đổi mới trong công nghệ lưu trữ và truy cập, hệ thống sẽ đánh giá rủi ro và đưa ra những khuyến nghị để cập nhật chính sách, đồng thời thiết kế các chiến lược như lên kế hoạch di trú, chuyển đổi định dạng để đảm bảo khả năng truy cập lâu dài.
4. Ứng dụng của OAIS trong lưu trữ số

Kho lưu trữ và quản lý tài liệu số chuyên nghiệp - Ảnh: Internet
OAIS là mô hình kiến trúc tiêu chuẩn để xây dựng kho lưu trữ số chuyên nghiệp, theo thời hạn dài tại cơ quan lưu trữ, thư viện và tổ chức nghiên cứu. Hệ thống áp dụng lưu trữ và quản lý cho cả tài liệu số và tài liệu vật lý (giấy, phim ảnh, âm thanh, băng ghi hình…), từ đó hỗ trợ các tổ chức và cơ quan mở rộng phạm vi quản lý toàn diện, giúp giải quyết bài toán số hoá, bảo quản và khai thác dữ liệu, từ đó tối ưu hoá chi phí và vận hành.
Ứng dụng của mô hình OAIS trên các cơ quan lưu trữ quốc gia hàng đầu có thể kể đến như: Chiến lược lưu trữ số 2010-2020 của Úc áp dụng OAIS - ISO 14721:2012 tập trung vào cắt giảm chi phí lưu trữ vật lý và xây kho, Hệ thống Trusted Digital Repository theo chuẩn OAIS - ISO 16363 của Canada, Hệ thống lưu trữ điện tử VITAM theo mô hình chức năng OAIS - ISO 14721 của Pháp… Tại Việt Nam, giải pháp số hoá tài liệu và lưu trữ điện tử lâu dài theo chuẩn quốc tế cũng đang được nghiên cứu triển khai áp dụng, hướng tới việc tuân thủ mô hình OAIS và tiêu chuẩn ISO 14721 để quản lý hiệu quả tài liệu điện tử tại các cơ quan, tổ chức.
5. Thách thức số hoá tài liệu trong lưu trữ số
Mô hình OAIS là nền tảng lý thuyết tiêu chuẩn cho cho quy trình lưu trữ và bảo vệ dữ liệu tại với các cơ quan lưu trữ và tổ chức nghiên cứu để phục vụ mục tiêu lưu trữ số lâu dài. Tuy nhiên, quá trình số hóa dữ liệu này đang đặt ra những thách thức từ khoảng trống giữa thực tiễn và và hành lang pháp lý - kỹ thuật.
Về mặt pháp lý, Việt Nam vẫn chưa có một khung pháp lý đầy đủ và chuyên biệt cho những lĩnh vực then chốt như lưu trữ điện tử, lưu trữ số, lưu trữ lâu dài và chứng thực tài liệu điện tử. Trong khi các quốc gia như Úc, Mỹ, Liên minh châu Âu, Ấn Độ hay Hàn Quốc đã xây dựng hệ thống quy định đồng bộ và với khung pháp lý về Chính phủ số, quy định này tại Việt Nam còn chưa hoàn chỉnh. Điều này dẫn đến khó khăn trong việc xác định trách nhiệm, quy trình pháp lý rõ ràng cho việc tiếp nhận, lưu trữ, bảo quản và công nhận giá trị của tài liệu số.
Về mặt kỹ thuật, lĩnh vực lưu trữ số chưa có một khung tiêu chuẩn kỹ thuật và tiêu chuẩn nghề nghiệp đầy đủ. Cụ thể, những vấn đề cấp thiết cần được chuẩn hóa bao gồm:
(1) Quy định về tiêu chuẩn định dạng đầu vào cho tài liệu, bản ghi điện tử
(2) Quy định khung kiến trúc áp dụng (như mô hình OAIS - ISO 14721, ISO 16363) cho hệ thống lưu trữ số
(3) Quy định về an ninh, bảo mật dữ liệu và xác thực tài liệu điện tử xuyên suốt vòng đời
(4) Ban hành tiêu chuẩn quốc gia tương đương với tiêu chuẩn quốc tế về số hoá dữ liệu và lưu trữ điện tử
(5) Xây dựng và ban hành tiêu chuẩn nghề nghiệp cho cán bộ lưu trữ số
Kết luận
Mô hình OAIS theo chuẩn ISO 14721 đã được công nhận là khung kiến trúc hiệu quả cho bài toán lưu trữ, bảo quản và khai thác dữ liệu số lâu dài trên toàn cầu. Để ứng dụng thành công mô hình tại Việt Nam, việc hoàn thiện đồng bộ khung pháp lý và hệ thống tiêu chuẩn kỹ thuật chuyên ngành là yêu cầu then chốt. Qua đó, các cơ quan, tổ chức có thể quản lý dữ liệu số đúng cách và khai thác chúng thành tài sản chiến lược bền vững, phục vụ cho công cuộc chuyển đổi số của quốc gia.
