1. RAID là gì?
Thuật ngữ RAID là viết tắt của Redundant Array of Inexpensive Disks (hoặc Redundant Arrays of Independent Disks), xuất hiện lần đầu tiên vào cuối những năm 1980. RAID là một kỹ thuật ảo hóa cho phép gom nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa logic nhằm mục đích gia tăng tốc độ truy xuất dữ liệu hoặc giảm nguy cơ mất, hỏng dữ liệu do lỗi đĩa phần cứng gây ra hoặc đôi khi kết hợp cả hai mục đích trên.
Bạn đang xem: Raid ổ cứng là gì
Cách thức hoạt động của RAID là sao chép dữ liệu lên hai hoặc nhiều ổ cứng vật lý được liên kết với nhau bằng 1 RAID Controller. RAID Controller có thể dựa trên một trong 2 nền tảng phần cứng hoặc phần mềm.
Hầu hết các loại RAID khác nhau đều sử dụng kỹ thuật hạn chế lỗi gọi là dữ liệu “chẵn lẻ” cho phép khả năng chịu lỗi (fault tolerance) khi dữ liệu được nhân đôi Nhờ vậy mà có thể giảm tác động của việc mất dữ liệu khi gặp phải lỗi phần cứng.
RAID có thể được sử dụng cho các ổ đĩa SATA, SAS và SSD.
Có nhiều cách cài đặt RAID khác nhau. Mỗi một loại RAID lại phục vụ một mục tiêu khác nhau dựa trên những nhu cầu cụ thể để giải quyết các yêu cầu nhất định như:
– Độ tin cậy của dữ liệu/ Data Reliability – đảm bảo dữ liệu không có lỗi.
– Tính sẵn sàng của dữ liệu/ Data Availability – đảm bảo dữ liệu khả dụng ngay cả trong trường hợp lỗi phần cứng.
– Hiệu suất dữ liệu/ Data Performance – đảm bảo truy cập dữ liệu nhanh chóng cho cả hoạt động đọc và ghi.
– Dung lượng dữ liệu/ Data Capacity – đảm bảo khả năng lưu trữ lượng dữ liệu lớn.
2. Các kiểu RAID phổ biến
RAID được phát triển theo theo nhiều chuẩn khác nhau, mỗi chuẩn lại có sự khác biệt về hiệu năng, dung lượng lưu trữ và độ tin cậy. Có thể gom thành hai hướng phát triển RAID như sau:
– RAID theo chuẩn chung
– RAID cải tiến và phát triển theo chuẩn riêng
Các chuẩn RAID
RAID 0:
Raid 0 cần tối thiểu hai đĩa cứng, RAID 0 cho phép máy tính ghi dữ liệu theo phương thức đặc biệt được gọi là Striping. Ví dụ bạn có 8 đoạn dữ liệu được đánh số từ 1 đến 8, các đoạn đánh số lẻ (1,3,5,7) sẽ được ghi lên đĩa cứng đầu tiên và các đoạn đánh số chẵn (2,4,6,8) sẽ được ghi lên đĩa thứ hai, giúp giảm một nửa thời gian làm việc theo lý thuyết
Tổng quát là với n đĩa cứng thì mỗi đĩa chỉ cần phải đọc/ghi 1/n lượng dữ liệu được yêu cầu. Lý thuyết thì tốc độ sẽ tăng n lần..
Tuy vậyRAID 0 lại có nguy cơ mất dữ liệu cao, nguyên nhân chính nằm ở cách ghi thông tin xélẻ vì như vậy dữ liệu không nằm hoàn toàn ở một đĩa cứng nào và mỗi khi cần truy xuất thông tin (ví dụ một file nào đó), máy tính sẽ phải tổng hợp từ các đĩa cứng.
Chỉ cần một đĩa cứng gặp trục trặc thì thông tin (file) đó coi như không thể đọc được và hư hoàn toàn dữ liệu.
Dung lượng cuối cùng của hệ thống RAID 0 bằng tổng dung lượng của các ổ đơn (hai ổ 80GB chạy RAID 0 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 160GB).
Có thể thấy RAID 0 thực sự thích hợp cho những người dùng cần truy cập nhanh khối lượng dữ liệu lớn, ví dụ các game thủ hoặc những người chuyên làm đồ hoạ, video số.
RAID 1
Đây là dạng RAID cơ bản nhất có khả năng đảm bảo an toàn dữ liệu.
Cũng giống như RAID 0, RAID 1 đòi hỏi ít nhất hai đĩa cứng để làm việc. Dữ liệu được ghi vào 2 ổ giống hệt nhau (Mirroring). Trong trường hợp một ổ bị trục trặc, ổ còn lại sẽ tiếp tục hoạt động bình thường. Bạn có thể thay thế ổ đĩa bị hỏng mà không phải lo lắng đến vấn đề thông tin hư hỏng.
Xem thêm: Email Marketing Là Gì – Góc Nhìn Mới Trong Marketing 4
Đối với RAID 1, hiệu năng không phải là yếu tố hàng đầu nên chẳng có gì ngạc nhiên nếu nó không phải là lựa chọn số một cho những người say mê tốc độ. Tuy nhiên đối với những nhà quản trị mạng hoặc những ai phải quản lý nhiều thông tin quan trọng thì hệ thống RAID 1 là lựa chọnkhông thể thiếu.
Dung lượng cuối cùng của hệ thống RAID 1 bằng dung lượng của ổ đơn (hai ổ 80GB chạy RAID 1 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 80GB).
RAID 2
Cơ chế kiểm tra lỗi của loại raid này ở mức Bit sử dụng cơ chế Hamming code, nhưng gần như mặc định các ổ cứng hiện tại đều đã tích hợp kiểm tra mức Bit bằng Hamming code do vậy loại Raid này hiện nay không còn được sử dụng nữa.
RAID 3
Đây là loại raid đầu tiên sử dụng cơ chế dự phòng dữ liệu bằng Parity.
Parity là kết quả được tạo ra bằng việc tính toán XOR giữa các bit trong block dữ liệu đã lưu trữ. Ví dụ một file dữ liệu được chia làm 1 block lưu trữ trong 6 phần, phần lưu trữ từ Block A1 – A3 lưu trên 3 ổ cứng thì Raid 3 sẽ tính toán XOR của các bit trong từ Block 1 à 3 này thành một block parity lưu trữ trên ổ cứng thứ 4.
Khi xảy ra hư hỏng thì hệ thống sẽ tính toán lại dữ liệu từ phép toán:
A-Parity(1-3) = Block A1 Ꚛ Block A2 Ꚛ Block A3
Tuy nhiên thực tế thì hiện này loại Raid này cũng không còn được sử dụng do hiệu năng quá thấp đặc biệt là với Database do việc xử lý theo từng Bit rất mất thời gian khi lưu trữ và truy xuất.
RAID 4
RAID 4 tương tự như RAID 3 nhưng ở một mức độ các khối dữ liệu lớn hơn chứ không phải đến từng byte. Chúng cũng yêu cầu tối thiểu 3 đĩa cứng (ít nhất hai đĩa dành cho chứa dữ liệu và ít nhất 1 đĩa dùng cho lưu trữ dữ liệu Parity)
Tuy nhiên, hiện loại raid này cũng không được sử dụng nhiều nữa.
RAID 5
Đây có lẽ là dạng RAID mạnh mẽ và thông dụng nhất. Dữ liệu và bản sao lưu được chia lên tất cả các ổ cứng. Nguyên tắc này khá phức tạp
Chúng ta quay trở lại ví dụ về 8 đoạn dữ liệu (1-8) và giờ đây là 3 ổ đĩa cứng. Đoạn dữ liệu số 1 và số 2 sẽ được ghi vào ổ đĩa 1 và 2 riêng rẽ, đoạn sao lưu của chúng được ghi vào ổ cứng 3. Đoạn số 3 và 4 được ghi vào ổ 1 và 3 với đoạn sao lưu tương ứng ghi vào ổ đĩa 2. Đoạn số 5, 6 ghi vào ổ đĩa 2 và 3, còn đoạn sao lưu được ghi vào ổ đĩa 1 và sau đó trình tự này lặp lại, đoạn số 7,8 được ghi vào ổ 1, 2 và đoạn sao lưu ghi vào ổ 3 như ban đầu. Như vậy RAID 5 vừa đảm bảo tốc độ có cải thiện, vừa giữ được tính an toàn cao. Dung lượng đĩa cứng cuối cùng bằng tổng dung lượng đĩa sử dụng trừ đi một ổ. Tức là nếu bạn dùng 3 ổ 80GB thì dung lượng cuối cùng sẽ là 160GB.
RAID 6
RAID 6 phần nào giống như RAID 5 nhưng lại được sử dụng lặp lại nhiều hơn số lần sự phân tách dữ liệu để ghi vào các đĩa cứng khác nhau. Ví dụ như ở RAID 5 thì mỗi một dữ liệu được tách thành hai vị trí lưu trữ trên hai đĩa cứng khác nhau, nhưng ở RAID 6 thì mỗi dữ liệu lại được lưu trữ ở ít nhất ba vị trí (trở lên), điều này giúp cho sự an toàn của dữ liệu tăng lên so với RAID 5.
Trong RAID 6, ta thấy rằng khả năng chịu đựng rủi ro hư hỏng cứng được tăng lên rất nhiều. Nếu với 4 ổ cứng thì chúng cho phép hư hỏng đồng thời đến 2 ổ cứng mà hệ thống vẫn làm việc bình thường, điều này tạo ra một xác xuất an toàn rất lớn. Chính do đó mà RAID 6 thường chỉ được sử dụng trong các máy chủ chứa dữ liệu cực kỳ quan trọng
3. Các RAID không tiêu chuẩn
RAID 10 & RAID 01
Đây là loại Raid kết hợp giữa Raid 1 và Raid 0 nhưng là hai cơ chế hoàn toàn khác.
Raid 10: Chia dữ liệu thành hai phần bằng cơ chế Raid 0, mỗi phần lại được mirror bằng cơ chế Raid 1
Raid 01: Dữ liệu được Mirror giống nhau ở lần ghi thứ nhất theo cơ chế raid 1 nhưng lại được chia thành hai phần ở lần ghi thứ hai theo cơ chế raid 0
Xét về hiệu năng thì rõ ràng Raid 10 có ưu thế hơn hẳn cả về tốc độ truy xuất đọc và ghi so với Raid 01. Với các hệ thống đòi hòi hiệu năng cao mà vẫn đảm bảo an toàn dữ liệu thì Raid 10 là lựa chọn tối ưu.
Raid 50
Là sự kết hợp hoàn hảo giữa Raid 5 và Raid 0, dữ liệu được ghi lần đầu theo cơ chế Raid 0 nhưng lại được chia theo cơ chế Raid 5 ở lần ghi thứ hai.
Nhờ vậy loại RAIDnày vẫn đảm bảo tốc độ truy vấn rất tốt tương tự như RAID 10 nhưng lại tận dụng dung lượng ổ cứng tốt hơn Raid 10 rất nhiều.
Xem thêm: Thiếu Gia Là Gì – Thiếu Gia Hay Thiếu Da
Hot spare disks
Đây là một ổ cứng mà chức năng chính chỉ để sử dụng dự phòng. Khi một ổ cứng trong nhóm Raid bị hư, hệ thống sẽ tự động lấy ổ cứng HotSpare để thay thế vào ổ cứng hư nhằm đảm bảo dữ liệu được bảo vệ tối ưu nhất. Hot spare disk có thể dùng cho 1 cụm raid hoặc có thể dụng share chung cho nhiều cụm raid khác nhau.
Chuyên mục: Hỏi Đáp