Trong bài viết này, chúng ta sẽ điểm qua hai khái niệm quan trọng trong thống kê mô tả – Skewness và Kurtosis. Ở phần cuối của bài viết, bạn sẽ có câu trả lời cho các câu hỏi như độ lệch & kurtosis là gì, độ lệch phải / trái, cách đo độ lệch & kurtosis, công dụng của nó, v.v.
Bạn đang xem: Skewness and kurtosis là gì
Sự xiên xẹo
“Độ xiên” là thước đo sự không đối xứng của phân phối xác suất của một biến ngẫu nhiên có giá trị thực.
Độ xiên tiêu cực
Dữ liệu tập trung nhiều hơn ở bên phải của hình như bạn có thể thấy bên dưới. Vì vậy, có một cái đuôi dài ở phía bên trái. Nó còn được gọi là lệch trái hoặc đuôi trái.
Tích cực Skewness
Dữ liệu tập trung nhiều hơn ở bên trái của hình như bạn có thể thấy bên dưới. Vì vậy, có một cái đuôi dài ở phía bên phải. Nó còn được gọi là lệch phải hoặc đuôi phải.
Cách giải thích độ lệch
Một quy tắc ngón tay cái nói:
Nếu độ lệch nằm trong khoảng -0,5 đến 0,5, dữ liệu khá đối xứng (phân phối chuẩn).Nếu độ lệch nằm trong khoảng -1 đến -0,5 (độ lệch âm) hoặc từ 0,5 đến 1 (độ lệch dương), dữ liệu bị lệch vừa phải.Nếu độ lệch nhỏ hơn -1 (độ lệch âm) hoặc lớn hơn 1 (độ lệch dương), dữ liệu có độ lệch cao.
Tại sao phải nghiên cứu độ lệch
Hãy xem xét ví dụ dưới đây. Đây total_billlà sai lệch tích cực và các điểm dữ liệu tập trung ở phía bên trái. Nếu chúng ta xây dựng mô hình trên cơ sở này, mô hình sẽ đưa ra dự đoán tốt hơn ở những nơi total_billthấp hơn so với cao hơn total_bill.
Xem thêm: Tải Game Plants Vs Zombies Mod Apk 2, Download Plants Vs Zombies V2
Hình ảnh của Tác giả
Skewness cho chúng ta biết về hướng của người ngoại lai. Từ sự phân bố trên, chúng ta có thể nói rõ ràng rằng các giá trị ngoại lai hiện diện ở phía bên phải của phân phối.
Cách đối phó với dữ liệu sai lệch
Nhiều thử nghiệm thống kê và mô hình học máy phụ thuộc vào các giả định về tính chuẩn mực. Vì vậy, độ lệch đáng kể có nghĩa là dữ liệu không bình thường và điều đó có thể ảnh hưởng đến các bài kiểm tra thống kê hoặc khả năng dự đoán của máy học. Trong những trường hợp như vậy, chúng ta cần biến đổi dữ liệu để làm cho nó bình thường. Một số kỹ thuật phổ biến được sử dụng để xử lý dữ liệu bị lệch:
Chuyển đổi nhật kýPhép biến đổi căn bậc haiChuyển đổi quyền lựcPhép biến đổi hàm mũChuyển đổi Box-Cox, v.v.
Kurtosis
“Kurtosis” là một phép đo về độ “theo đuôi” của phân phối xác suất của một biến ngẫu nhiên có giá trị thực. Nó thường được sử dụng để xác định các giá trị ngoại lai (giá trị cực trị) trong tập dữ liệu đã cho. Vì nó được sử dụng để xác định các giá trị ngoại lai, các giá trị cực trị ở cả hai đầu đuôi được sử dụng để phân tích.
Các loại Kurtosis và cách giải thích
Mesokurtic (Kurtosis = 3) – Phân phối này cho thấy kurtosis là 3 gần bằng không. Việc phân phối các giá trị cực trị (giá trị ngoại lai) tương tự như phân phối chuẩn.
Xem thêm: Doge Là Gì – Doge (Meme)
Leptokurtic (Kurtosis> 3) – Phân bố này cho thấy kurtosis lớn hơn mesokurtic. Đỉnh cao hơn và sắc nét hơn Mesokurtic. Nó cho thấy những cái đuôi nặng ở hai bên cho thấy những điểm bất thường lớn. Trong thế giới đầu tư, phân phối leptokurtic có nghĩa là nó là một khoản đầu tư có rủi ro cao.Platykurtic: (Kurtosis
Người giới thiệu
Cảm ơn bạn đã đọc bài viết này. Bạn có thể liên hệ với tôi tạihttps://www.linkedin.com/in/chetanambi/
Japanese Spanish German French Thai Portuguese Russian Vietnamese Italian Korean Turkish Indonesian Polish Hindi
Giới thiệu Một trong những lĩnh vực mới nhất và thú vị nhất của vật lý thiên văn là tìm kiếm và nghiên cứu các hành tinh ngoài hệ mặt trời. Tuy nhiên, ý tưởng về các hành tinh khác ngoài hệ mặt trời của chúng ta không phải là một ý tưởng mới.
Không phải tất cả chúng ta đều thích khả năng dự đoán trên thị trường. Đồng ý, một số sẽ thấy biến động có lợi hơn.
Hiểu khái niệm đại số tuyến tính về cơ sở hữu ích cho phân tích eigendecomposition và SVD Trong bài viết này, bạn sẽ tìm hiểu về khái niệm cơ sở, đây là một cách thú vị để hiểu các phương pháp phân tích nhân tử ma trận như phân tích eigendecomposition hoặc phân rã giá trị đơn lẻ (SVD). Định nghĩa Cơ sở là một hệ tọa độ dùng để mô tả không gian vectơ (tập các vectơ).
Kết quả phân tích tập dữ liệu với 200k trao đổi học tập diễn ra trong chương trình Erasmus 2011–12 Kể từ năm 1987, chương trình Erasmus mang đến cho hàng trăm nghìn sinh viên châu Âu mỗi năm cơ hội dành một học kỳ hoặc một năm ở nước ngoài, ở một châu Âu khác. quốc gia, cung cấp cho họ một quá trình trao đổi dễ dàng, cũng như hỗ trợ kinh tế. Đó là một trải nghiệm thực sự có giá trị, giúp họ mở rộng tâm trí và trái tim với những con người, ngôn ngữ và nền văn hóa đa dạng của Châu Âu.
Thống kê là “một nhánh của toán học liên quan đến việc thu thập, phân tích, giải thích và trình bày khối lượng dữ liệu số”. Đưa lập trình và học máy vào hỗn hợp và bạn có một mô tả khá tốt về các kỹ năng cốt lõi cho khoa học dữ liệu.
9 Phép đo Khoảng cách trong Khoa học Dữ liệu
Ưu điểm và cạm bẫy của các thước đo khoảng cách phổ biến
Nhiều thuật toán, cho dù được giám sát hay không được giám sát, đều sử dụng các thước đo khoảng cách. Những thước đo này, chẳng hạn như khoảng cách euclid hoặc độ tương tự cosin, thường có thể được tìm thấy trong các thuật toán như k-NN, UMAP, HDBSCAN, v.v.
Chuyên mục: Hỏi Đáp