Bài viết này mình không nói sâu về lý thuyết mà tập trung giải thích về các bước tính toán ma trận hiệp phương sai, cũng như giải thích ý nghĩa của ma trận này để bạn cảm thấy dễ nhớ hơn là việc học thuộc công thức. Cách hiểu này cũng sẽ hỗ trợ bạn trong việc ứng dụng, khi nào áp dụng việc tính toán covariance matrix trong quá trình làm nghiên cứu.

Bạn đang xem: Hiệp phương sai là gì

Ma trận hiệp phương sai là gì?

Ma trận hiệp phương sai của tập hợp m biến ngẫu nhiên là một ma trận vuông hạng (m × m), trong đó các phần tử nằm trên đường chéo (từ trái sang phải, từ trên xuống dưới) lần lượt là phương sai tương ứng của các biến này (ta chú ý rằng Var(X) = Cov(X,X)), trong khi các phần tử còn lại (không nằm trên đường chéo) là các hiệp phương sai của đôi một hai biến ngẫu nhiên khác nhau trong tập hợp.

Ví dụ cách tính ma trận hiệp phương sai

Định nghĩa ma trận hiệp phương sai có vẻ khó hiểu, nhưng khi ta xem xét một bài toán cụ thể thì sẽ dễ hiểu hơn. Ta xem xét ví dụ sau và cách tính toán ma trận hiệp phương sai.

Ta có 3 mẫu dữ liệu sau:

A = (-2, -2) B = (-1, 4) C = (2, 3)

Như vậy ta có N mẫu dữ liệu (N=3), và mỗi mẫu dữ liệu là một điểm trên không gian 2 chiều (m=2). Nếu trực quan hóa thì 3 điểm dữ liệu A, B, C sẽ nằm như sau trên trục tọa độ:

*

Để tính toán ma trận hiệp phương sai kích thước mxm (2×2), ta làm như sau:

I. Sắp mẫu dữ liệu thành ma trận m x N

Với 3 mẫu dữ liệu trên, ta tìm cách sắp chúng lại thành ma trận có kích thước m x N (2 dòng, 3 cột). Để làm điều đó dễ dàng, ta sắp chúng thành ma trận có kích thước N x m trước, sau đó chuyển vị để được ma trận m x N.

Xem thêm: Comedy Là Gì – Thể Loại Comedy Trong Manga/anime

Nhắc lại:

A = (-2, -2) B = (-1, 4) C = (2, 3)

Ma trận N x m:

egin{bmatrix}-2&-2-1&42&3end{bmatrix}>

Chuyển vị ma trận N x m thành ma trận m x N, đặt tên là K: