Hbase là giải pháp lưu trữ dữ liệu lớn (Big Data), linh hoạt và hoàn toàn miễn phí được rất nhiều tập đoàn công nghệ ưa chuộng. Vậy Hbase là gì? Các tính năng đặc biệt nhất của Hbase?

Để giúp các bạn trẻ mới bắt đầu tìm hiểu về Big Data có thể hiểu hơn về công nghệ Hbase, hãy cùng tham khảo qua bài viết sau của ITNavi. Cùng bắt đầu nhé!

Giới thiệu về Hbase là gì

*
*
*
*

Cấu trúc HBase

Kiến trúc HBase bao gồm 4 thành phần cơ bản:

HMaster: chính là thành phần trung tâm trong kiến trúc của Hbase, nó giám sát tất cả các RegionServer. Những thay đổi liên quan đến metadata đều được thực hiện thông quan HMaster.HRegionserver: chịu trách nhiệm quản lý trực tiếp các regionHregions: là thành phần kiến trúc cơ sở của Hbase cluster, nó bao gồm 2 thành phần chính là Memstore và HfileZookeeper: là trung tâm giám sát và lưu trữ thông tin các cấu hình.

Bạn đang xem: Hbase là gì

Bài viết có liên quan

Mapreduce, những ưu điểm và cách thức hoạt động của nền tảng này

Microsoft Azure – Giải pháp điện toán đám mây tối ưu nhất cho doanh nghiệp chuyển đổi số

Cách thức lưu trữ và tìm kiếm của Hbase

Cách thức lưu trữ

Hbase lưu trữ các row nằm trong các table, mỗi table có thể định nghĩa nhiều column families (cf). Mỗi row phải được quản lý bởi một khóa chính duy nhất.

Xem thêm: Hộ Khẩu Thường Trú Tiếng Anh Là Gì, Hộ Khẩu Thường Trú Dịch

Có thể xem lịch sử lưu dữ liệu trên mỗi row, được quản lý bởi các timestamp

Chúng ta có thể giới hạn history lưu tối đa là bao nhiêu lần (giúp tiết kiệm dung lượng dữ liệu sau một thời gian sử dụng, mỗi lần update dữ liệu thì history cũ hơn sẽ bị xóa)

Cách thức tìm kiếm

Phương pháp phổ biến nhất để tìm kiếm dữ liệu trong Hbase là dùng thrift, bình thường thrift không được khởi động khi chạy Hbase nên sẽ cần khởi động bằng lệnh “./bin/hbase thrift start”

Thrift cung cấp 4 comparator để lọc dữ liệu đó là: “binary, binary prefix, regexstring, substring”

Một cách khác để dễ dàng sử dụng truy vấn dữ liệu trong Hbase hơn là dùng câu lệnh sql để truy vấn, để làm được điều này, bạn cần phải cài đặt thêm Hive. Sau khi cài đặt xong, thì mọi thao tác xử lý dữ liệu đều có thể dùng thông qua câu lệnh sql, trong đó hỗ trợ cả join.

Xem thêm: Tải Game Bắn Cá – Download Game Bắn Cá

Hướng dẫn cài đặt Hbase ở chế độ Distributed

Bạn có thể download bộ cài Hbase tại đây: http://www-us.apache.org/dist/hbase/.Hoặc bạn có thể vào google, gõ Hbase free để tìm kiếm nhiều nguồn khác nhau.

Tiến hành giải nén Hbase vào thư mục /opt/: $ tar -xzf hbase-0.98.18-hadoop2-bin.tar.gz

Thêm biến môi trường vào tập tin ~/.bash_profile với nội dung sau:

export HBASE_HOME=”/opt/hbase”

export PATH=”$HBASE_HOME/bin:$PATH”

Kiểm tra xem đã cài đặt thành công chưa bằng lệnh: hbase version

Sửa nội dung tập tin /opt/hbase/conf/hbase-env.sh với nội dung sau:

export JAVA_HOME=/usr/java/default

export HBASE_MANAGES_ZK=true

export HBASE_PID_DIR=/opt/hbase/var

Tiếp tục sửa nội dung tập tin /opt/hbase/conf/hbase-site.xml và thêm vào nội dung sau;

hbase.master

sglamp.edumall.co.th:60000

hbase.master.info.port

60010

hbase.rootdir

hdfs://sglamp.edumall.co.th:9000/hbase

hbase.cluster.distributed

true

hbase.zookeeper.property.dataDir

hdfs://sglamp.edumall.co.th:9000/zookeeper

hbase.zookeeper.quorum

sglamp2.edumall.co.th

hbase.zookeeper.property.clientPort

2181

hbase.zookeeper.property.maxClientCnxns

1000

Để khởi động Hbase ta chạy lệnh sau: /opt/hbase/bin/shServer.sh start

Để tắt Hbase ta chạy lệnh sau: /opt/hbase/bin/shServer.sh stop

Hbase là giải pháp lưu trữ dữ liệu lớn (Big Data), linh hoạt và hoàn toàn miễn phí. Điều quan trọng là dự án của bạn có thực sử đủ lớn để dùng Hbase hay không mà thôi. Và một khi đã dùng Hbase, bạn phải xác định trước cấu trúc dữ liệu, xác định các column family và primary key cho các row ở các table một cách thích hợp. Chúc các bạn thành công với quyết định của mình nhé !

Chuyên mục: Hỏi Đáp