Đặt banner 324 x 100

Hệ thống lưu trữ dữ liệu bằng file - TEK4VN


Chắc hẳn, bạn đã học qua một vài ngôn ngữ lập trình cơ bản trước khi học đến khóa học này. Trong các khóa học trước đó, bạn còn nhớ cách thức mà chúng ta vẫn thường sử dụng để lưu trữ dữ liệu là sử dụng các file nhị phân hoặc file văn bản. Một cách để giữ thông tin trên máy tính là lưu trữ nó trong các tệp cố định. Một hệ thống của công ty có thể có một số chương trình ứng dụng được viết theo yêu cầu của người dùng trong tổ chức; mỗi chương trình trong số đó được thiết kế để thao tác trên các tập tin dữ liệu nhất định. Hệ thống vừa mô tả được gọi là hệ thống quản lý và lưu trữ dữ liệu dựa trên tệp.

Hệ thống quản lý, lưu trữ dữ liệu dựa trên tệp

Hệ thống quản lý, lưu trữ dữ liệu dựa trên tệp là hệ thống lưu trữ và xử lý dữ liệu dựa trên hệ thống tệp trên hệ thống. Các thông tin được lưu trữ và trích xuất, đọc ghi trực tiếp từ tệp.

Ví dụ dưới đây thể hiện cách thức quản lý dữ liệu sử dụng tệp trong một hệ thống quản lý đào tạo của một trường đại học.
 

Như chúng ta có thể thấy, dữ liệu về sinh viên được lưu trữ và sử dụng ở nhiều module thành phần khác nhau bao gồm: Module quản lý Accounts, Module Department, Module Hostel... Trong đó, một số trường dữ liệu được sử dụng chung cho tất cả các thành phần (như Tên, Địa chỉ và số điện thoại của sinh viên). Mặt khác, một số dữ liệu chỉ dành riêng cho một phần cụ thể, chẳng hạn như số phân bổ ký túc xá chỉ là một phần của Hostel.

 

Question

Bạn hãy suy nghĩ xem, cách thức tổ chức và lưu trữ dữ liệu này sẽ gặp phải những vấn đề gì?

 

Nhược điểm của hệ thống lưu trữ và quản lý dữ liệu dựa trên tệp

Bây giờ, chúng ta sẽ làm sáng tỏ các vấn đề xảy ra khi chúng ta sử dụng hệ thống quản lý và lưu trữ dữ liệu dựa trên tệp ở trên.

1. Dư thừa dữ liệu

Thông thường, trong một tổ chức, các tệp và ứng dụng được tạo bởi các lập trình viên khác nhau từ các bộ phận khác nhau trong thời gian dài. Điều này có thể dẫn đến tình trạng dư thừa dữ liệu, một tình huống xảy ra khi cùng một dữ liệu xuất hiện ở nhiều nơi (tệp) khác nhau.

Quay trở lại ví dụ về hệ thống quản lý sinh viên ở phần trước, nếu một sinh viên muốn thay đổi số điện thoại của mình, cậu ấy sẽ phải cập nhật nó ở nhiều nơi (tệp) khác nhau. Tương tự như vậy, hồ sơ cũ phải được xóa khỏi tất cả các phần đại diện cho học sinh đó. Nếu một phần nào đó "quên mất" không xóa thì sẽ gây ra tình trạng dư thừa dữ liệu, dữ liệu có thể tồn tại và dồn đống trong khi không có giá trị sử dụng. Ngoài ra, cùng một dữ liệu về số điện thoại hoặc tên sinh viên có thể lặp đi lặp lại lưu trữ ở rất nhiều file khác nhau, gây thừa thãi.

2. Dữ liệu không nhất quán

Dữ liệu được cho là không nhất quán nếu nhiều bản sao của cùng một dữ liệu không khớp với nhau, điều này gây lãng phí không gian lưu trữ và sai sót trong xử lý các tác vụ. Hãy xem xét trường hợp số điện thoại của sinh viên khác nhau trong module Accounts và Department, nó sẽ không nhất quán. Sự không nhất quán có thể là do lỗi đánh máy hoặc không cập nhật tất cả các bản sao của cùng một dữ liệu một cách đồng thời.

3. Truy cập dữ liệu khó khăn

Một vấn đề khác là người dùng cần biết vị trí chính xác của tệp để truy cập dữ liệu, đây có thể là một quá trình rất rườm rà và tẻ nhạt. Giả sử người dùng muốn biết số lượng phân bổ ký túc xá của một sinh viên cụ thể từ hồ sơ của 10.000 sinh viên chưa được sắp xếp, điều đó sẽ khá mất thời gian.

4. Vấn đề bảo mật

Sử dụng hệ thống dựa trên tệp có thể dẫn đến truy cập dữ liệu trái phép. Nếu một học sinh có quyền truy cập vào tệp chứa điểm của mình, học sinh đó có thể thay đổi nó mà không cần được phép.

5. Khó truy cập đồng thời

Đồng thời là khả năng của cơ sở dữ liệu cho phép nhiều người dùng truy cập vào cùng một thông tin tại cùng một thời điểm. Thông thường, trong một hệ thống dựa trên tệp, khi một ứng dụng mở tệp, tệp đó sẽ bị khóa. Điều này có nghĩa là không ai khác có thể truy cập tệp tại thời điểm đó.

Ví dụ: nếu một trong các khoa trong trường đại học truy cập dữ liệu về một sinh viên cụ thể, các khoa khác sẽ phải đợi cho đến khi khoa đầu tiên hoàn thành trước khi họ có thể truy cập dữ liệu đó. Do đó, tính đồng thời không được duy trì trong một hệ thống dựa trên tệp.

Những khó khăn phát sinh từ việc sử dụng hệ thống dựa trên tệp đã thúc đẩy sự phát triển của một phương pháp mới để quản lý một lượng lớn thông tin tổ chức được gọi là cơ sở dữ liệu.

Trong bài tiếp theo, chúng ta sẽ đi sâu vào các khái niệm và nguyên tắc cơ bản của hệ thống cơ sở dữ liệu.

Thông tin liên hệ


: tek4vn
:
:
:
: