Phân phối Pearson: định nghĩa, ứng dụng

2026 Tác giả: Angel Austin | [email protected]. Sửa đổi lần cuối: 2025-01-23 12:37:37

Luật phân phối của Pearson là gì? Câu trả lời cho câu hỏi rộng này không thể đơn giản và ngắn gọn. Hệ thống Pearson ban đầu được thiết kế để mô hình hóa các quan sát bị méo mó có thể nhìn thấy. Vào thời điểm đó, người ta đã biết rõ cách điều chỉnh mô hình lý thuyết để khớp với hai tích lũy hoặc khoảnh khắc đầu tiên của dữ liệu quan sát: bất kỳ phân phối xác suất nào cũng có thể được mở rộng trực tiếp để tạo thành một nhóm thang vị trí.

Giả thuyết của Pearson về phân phối chuẩn của tiêu chí

Ngoại trừ các trường hợp bệnh lý, thang vị trí có thể được thực hiện để đối sánh giá trị trung bình quan sát được (tích lũy thứ nhất) và phương sai (tích lũy thứ hai) theo cách tùy ý. Tuy nhiên, người ta không biết cách xây dựng các phân bố xác suất trong đó độ lệch (tích lũy thứ ba được chuẩn hóa) và kurtosis (tích lũy thứ tư được chuẩn hóa) có thể được kiểm soát một cách tự do như nhau. Nhu cầu này trở nên rõ ràng khi cố gắng khớp các mô hình lý thuyết đã biết với dữ liệu quan sát,người đã cho thấy sự bất đối xứng.

Trong video bên dưới, bạn có thể xem phân tích về phân bố chi của Pearson.

Lịch sử

Trong tác phẩm gốc của mình, Pearson đã xác định bốn loại phân phối (được đánh số từ I đến IV) ngoài phân phối chuẩn (ban đầu được gọi là loại V). Việc phân loại phụ thuộc vào việc các phân phối được hỗ trợ trong một khoảng giới hạn, trên một bán trục hay trên toàn bộ đường thực và liệu chúng có khả năng bị lệch hay nhất thiết phải đối xứng hay không.

Hai thiếu sót đã được sửa chữa trong bài báo thứ hai: ông đã định nghĩa lại phân phối loại V (ban đầu nó chỉ là phân phối chuẩn, nhưng bây giờ với gamma nghịch đảo) và giới thiệu phân phối loại VI. Cùng với nhau, hai bài báo đầu tiên đề cập đến năm loại chính của hệ thống Pearson (I, III, IV, V và VI). Trong bài báo thứ ba, Pearson (1916) đã giới thiệu các kiểu phụ bổ sung.

Cải thiện khái niệm

Rind đã phát minh ra một cách đơn giản để hình dung không gian tham số của hệ thống Pearson (hoặc phân phối các tiêu chí), mà sau này ông đã áp dụng. Ngày nay, nhiều nhà toán học và thống kê sử dụng phương pháp này. Các loại phân phối Pearson được đặc trưng bởi hai đại lượng, thường được gọi là β1 và β2. Đầu tiên là hình vuông của sự bất đối xứng. Thứ hai là kurtosis truyền thống, hoặc thời điểm chuẩn hóa thứ tư: β2=γ2 + 3.

Các phương pháp toán học hiện đại định nghĩa kurtosis γ2 là tích lũy thay vì mômen, vì vậy đối vớiphân phối chúng ta có γ2=0 và β2=3. Ở đây nó đáng tuân theo tiền lệ lịch sử và sử dụng β2. Biểu đồ bên phải cho thấy loại phân phối Pearson cụ thể là (biểu thị bằng dấu chấm (β1, β2).

Nhiều phân bố lệch và / hoặc không trung mô mà chúng ta biết ngày nay vẫn chưa được biết đến vào đầu những năm 1890. Cái mà bây giờ được gọi là phân phối beta đã được Thomas Bayes sử dụng làm tham số sau của phân phối Bernoulli trong bài báo năm 1763 của ông về xác suất nghịch đảo.

Bản phân phối beta đã trở nên nổi tiếng do sự hiện diện của nó trong hệ thống Pearson và được biết đến cho đến những năm 1940 với tên gọi là bản phân phối Pearson loại I. Phân phối Loại II là một trường hợp đặc biệt của Loại I, nhưng nó thường không còn đơn lẻ nữa.

Phân phối Gamma bắt nguồn từ công việc của chính ông và được gọi là Phân phối Chuẩn Pearson Loại III trước khi có tên gọi hiện đại vào những năm 1930 và 1940. Một bài báo năm 1895 của một nhà khoa học đã trình bày phân phối Loại IV, chứa phân phối t của Student, như một trường hợp đặc biệt, trước khi William Seely Gosset sử dụng sau đó vài năm. Bài báo năm 1901 của ông đã trình bày một phân bố với gamma nghịch đảo (loại V) và số nguyên tố beta (loại VI).

Ý kiến khác

Theo Ord, Pearson đã phát triển dạng cơ bản của phương trình (1) dựa trên công thức tính đạo hàm của logarit của hàm mật độ phân phối chuẩn (cho phép chia tuyến tính cho bậc haicấu trúc). Nhiều chuyên gia vẫn đang tham gia thử nghiệm giả thuyết về sự phân bố của các tiêu chí Pearson. Và nó đã chứng minh hiệu quả của nó.

Karl Pearson là ai

Karl Pearson là một nhà toán học và thống kê sinh học người Anh. Ông được ghi nhận là người đã tạo ra kỷ luật thống kê toán học. Năm 1911, ông thành lập khoa thống kê đầu tiên trên thế giới tại Đại học College London và có những đóng góp đáng kể trong lĩnh vực sinh trắc học và khí tượng học. Pearson cũng là người ủng hộ thuyết Darwin xã hội và thuyết ưu sinh. Ông là người bảo trợ và là người viết tiểu sử của Ngài Francis G alton.

Sinh trắc học

Karl Pearson đã có công trong việc tạo ra trường phái sinh trắc học, một lý thuyết cạnh tranh để mô tả sự tiến hóa và kế thừa của các quần thể vào đầu thế kỷ 20. Chuỗi mười tám bài báo của ông "Những đóng góp của toán học cho lý thuyết tiến hóa" đã xác lập ông trở thành người sáng lập ra trường phái kế thừa sinh trắc học. Trên thực tế, Pearson đã dành phần lớn thời gian của mình trong suốt 1893-1904 để phát triển các phương pháp thống kê cho sinh trắc học. Các phương pháp này, được sử dụng rộng rãi ngày nay để phân tích thống kê, bao gồm kiểm định chi-bình phương, độ lệch chuẩn, hệ số tương quan và hồi quy.

Câu hỏi về tính di truyền

Định luật di truyền của Pearson nói rằng mầm mầm bao gồm các yếu tố được thừa hưởng từ cha mẹ, cũng như từ các tổ tiên xa hơn, tỷ lệ của chúng thay đổi tùy theo các đặc điểm khác nhau. Karl Pearson là một tín đồ của G alton, và mặc dù họcác tác phẩm khác nhau ở một số khía cạnh, Pearson đã sử dụng một lượng đáng kể các khái niệm thống kê của giáo viên của mình trong việc xây dựng một trường sinh trắc học để kế thừa, chẳng hạn như luật hồi quy.

Tính năng của trường

Trường phái sinh trắc học, không giống như Mendelians, không tập trung vào việc cung cấp cơ chế kế thừa, mà là cung cấp một mô tả toán học không có bản chất nhân quả. Trong khi G alton đề xuất một thuyết tiến hóa không liên tục trong đó các loài sẽ thay đổi theo những bước nhảy vọt thay vì những thay đổi nhỏ tích lũy theo thời gian, Pearson đã chỉ ra những sai sót trong lập luận này và thực sự sử dụng ý tưởng của mình để phát triển một thuyết tiến hóa liên tục. Người Mendel thích thuyết tiến hóa không liên tục.

Trong khi G alton chủ yếu tập trung vào việc áp dụng các phương pháp thống kê để nghiên cứu tính di truyền, Pearson và đồng nghiệp của ông Weldon đã mở rộng lý luận của họ trong lĩnh vực này, sự biến đổi, mối tương quan của chọn lọc tự nhiên và giới tính.

Nhìn lại sự tiến hóa

Đối với Pearson, thuyết tiến hóa không nhằm xác định cơ chế sinh học giải thích các kiểu di truyền, trong khi phương pháp Mendelian tuyên bố gen là cơ chế di truyền.

Pearson đã chỉ trích Bateson và các nhà sinh vật học khác vì đã không áp dụng các phương pháp sinh trắc học trong nghiên cứu về sự tiến hóa của họ. Ông lên án các nhà khoa học đã không tập trung vàogiá trị thống kê của các lý thuyết của họ, nêu rõ:

"Trước khi chúng ta có thể chấp nhận [bất kỳ nguyên nhân nào của sự thay đổi tiến bộ] là một yếu tố, chúng ta không chỉ phải thể hiện tính hợp lý của nó mà còn phải chứng minh khả năng định lượng của nó nếu có thể."

Các nhà sinh vật học đã không thể chống lại "những suy đoán gần như siêu hình về nguyên nhân di truyền" đã thay thế quá trình thu thập dữ liệu thực nghiệm, điều này thực sự có thể cho phép các nhà khoa học thu hẹp các lý thuyết tiềm năng.

Quy luật của tự nhiên

Đối với Pearson, các quy luật tự nhiên rất hữu ích để đưa ra các dự đoán chính xác và tóm tắt các xu hướng trong dữ liệu quan sát được. Lý do là trải nghiệm “một chuỗi nhất định đã xảy ra và lặp lại trong quá khứ.”

Vì vậy, xác định một cơ chế di truyền cụ thể không phải là một nỗ lực xứng đáng đối với các nhà sinh học, những người thay vào đó nên tập trung vào các mô tả toán học của dữ liệu thực nghiệm. Điều này một phần dẫn đến một cuộc tranh cãi gay gắt giữa các nhà sinh trắc học và Mendelians, bao gồm cả Bateson.

Sau khi người thứ hai từ chối một trong những bản thảo của Pearson mô tả một lý thuyết mới về sự biến đổi con cái hoặc đồng mẫu, Pearson và Weldon đã thành lập công ty Biometrika vào năm 1902. Mặc dù cách tiếp cận sinh trắc học để thừa kế cuối cùng đã mất đi quan điểm Mendel, nhưng các phương pháp mà họ phát triển vào thời điểm đó rất quan trọng đối với việc nghiên cứu sinh học và sự tiến hóa ngày nay.