Tiêu chí và phương pháp kiểm tra các giả thuyết thống kê, ví dụ

Mục lục:

Tiêu chí và phương pháp kiểm tra các giả thuyết thống kê, ví dụ
Tiêu chí và phương pháp kiểm tra các giả thuyết thống kê, ví dụ
Anonim

Kiểm tra giả thuyết là một thủ tục cần thiết trong thống kê. Kiểm tra giả thuyết đánh giá hai câu lệnh loại trừ lẫn nhau để xác định câu lệnh nào được dữ liệu mẫu hỗ trợ tốt nhất. Khi một phát hiện được cho là có ý nghĩa thống kê, đó là do thử nghiệm giả thuyết.

Phương pháp xác minh

Phương pháp kiểm định giả thuyết thống kê là phương pháp phân tích thống kê. Thông thường, hai bộ thống kê được so sánh hoặc một bộ dữ liệu được lấy mẫu được so sánh với một bộ dữ liệu tổng hợp từ một mô hình lý tưởng hóa. Dữ liệu phải được diễn giải theo cách có thêm ý nghĩa mới. Bạn có thể giải thích chúng bằng cách giả định một cấu trúc nhất định của kết quả cuối cùng và sử dụng các phương pháp thống kê để xác nhận hoặc bác bỏ giả định. Giả định được gọi là giả thuyết và các bài kiểm tra thống kê được sử dụng cho mục đích này được gọi là giả thuyết thống kê.

Giả thuyết H0 và H1

Có hai chínhcác khái niệm về kiểm định thống kê các giả thuyết - cái gọi là "giả thuyết chính, hoặc giả thuyết rỗng" và "giả thuyết thay thế". Chúng còn được gọi là giả thuyết Neyman-Pearson. Giả thiết kiểm định thống kê được gọi là giả thuyết vô hiệu, giả thuyết chính, viết tắt là H0. Nó thường được gọi là giả định mặc định hoặc giả định rằng không có gì thay đổi. Một vi phạm giả định kiểm tra thường được gọi là giả thuyết đầu tiên, giả thuyết thay thế, hoặc H1. H1 là viết tắt của một số giả thuyết khác, bởi vì tất cả những gì chúng ta biết về nó là dữ liệu H0 có thể bị loại bỏ.

kiểm tra giả thuyết vô hiệu
kiểm tra giả thuyết vô hiệu

Trước khi bác bỏ hoặc không bác bỏ giả thuyết không, kết quả thử nghiệm phải được diễn giải. So sánh được coi là có ý nghĩa thống kê nếu mối quan hệ giữa các tập dữ liệu không chắc là việc thực hiện giả thuyết rỗng theo xác suất ngưỡng - mức ý nghĩa. Ngoài ra còn có các tiêu chí phù hợp để kiểm tra giả thuyết thống kê. Đây là tên của tiêu chí kiểm tra giả thuyết, được liên kết với luật giả định về phân phối chưa biết. Đây là thước đo bằng số về sự khác biệt giữa phân bố thực nghiệm và lý thuyết.

Quy trình và tiêu chí kiểm tra các giả thuyết thống kê

Các phương pháp lựa chọn giả thuyết phổ biến nhất dựa trên tiêu chí thông tin Akaike hoặc hệ số Bayes. Kiểm tra giả thuyết thống kê là một kỹ thuật quan trọng trong cả suy luận và suy luận Bayes, mặc dù hai loại có sự khác biệt đáng chú ý. Kiểm tra giả thuyết thống kêxác định một thủ tục kiểm soát xác suất quyết định sai về một giả thuyết không chính xác hoặc mặc định không chính xác. Quy trình này dựa trên khả năng hoạt động của nó. Xác suất đưa ra quyết định sai này là khả năng không chắc chắn rằng giả thuyết vô hiệu là đúng và không tồn tại giả thuyết thay thế cụ thể nào. Bài kiểm tra không thể cho biết nó đúng hay sai.

Phương pháp kiểm tra các giả thuyết thống kê
Phương pháp kiểm tra các giả thuyết thống kê

Các phương pháp thay thế của lý thuyết quyết định

Tồn tại các phương pháp thay thế của lý thuyết quyết định, trong đó giả thuyết rỗng và giả thuyết đầu tiên được xem xét trên cơ sở bình đẳng hơn. Các phương pháp tiếp cận ra quyết định khác, chẳng hạn như lý thuyết Bayes, cố gắng cân bằng hậu quả của các quyết định tồi trên tất cả các khả năng thay vì tập trung vào một giả thuyết vô hiệu. Một số cách tiếp cận khác để quyết định giả thuyết nào là đúng dựa trên dữ liệu, trong đó chúng có các đặc tính mong muốn. Nhưng kiểm tra giả thuyết là cách tiếp cận chủ đạo để phân tích dữ liệu trong nhiều lĩnh vực khoa học.

Kiểm tra giả thuyết thống kê

Bất cứ khi nào một tập hợp kết quả khác với tập hợp khác, người ta phải dựa vào kiểm định giả thuyết thống kê hoặc kiểm định giả thuyết thống kê. Việc giải thích chúng đòi hỏi sự hiểu biết đúng đắn về giá trị p và giá trị tới hạn. Cũng cần hiểu rằng, bất kể mức độ ý nghĩa như thế nào, các thử nghiệm vẫn có thể có sai sót. Do đó, kết luận có thể không đúng.

Quá trình thử nghiệm bao gồmnhiều bước:

  1. Một giả thuyết ban đầu đang được tạo ra để nghiên cứu.
  2. Các giả thuyết thay thế và rỗng có liên quan được chỉ ra.
  3. Giải thích các giả định thống kê về mẫu trong thử nghiệm.
  4. Xác định bài kiểm tra nào phù hợp.
  5. Chọn mức ý nghĩa và ngưỡng xác suất mà dưới đó giả thuyết rỗng sẽ bị bác bỏ.
  6. Phân phối thống kê kiểm định giả thuyết rỗng cho thấy các giá trị có thể có mà tại đó giả thuyết rỗng bị bác bỏ.
  7. Đang tính toán.
  8. Một quyết định được đưa ra để bác bỏ hoặc chấp nhận giả thuyết rỗng để thay thế.

Có một giải pháp thay thế sử dụng giá trị p.

Ví dụ về thử nghiệm các giả thuyết thống kê
Ví dụ về thử nghiệm các giả thuyết thống kê

Thử nghiệm quan trọng

Dữ liệu thuần túy không có giá trị sử dụng thực tế mà không cần giải thích. Trong thống kê, khi cần đặt câu hỏi về dữ liệu và giải thích kết quả, các phương pháp thống kê được sử dụng để đảm bảo tính chính xác hoặc khả năng xảy ra của các câu trả lời. Khi kiểm tra các giả thuyết thống kê, lớp phương pháp này được gọi là kiểm định thống kê, hoặc kiểm tra ý nghĩa. Thuật ngữ “giả thuyết” gợi nhớ đến các phương pháp khoa học, nơi các giả thuyết và lý thuyết được nghiên cứu. Trong thống kê, một giả thuyết kiểm tra kết quả là một số lượng cho trước một giả định nhất định. Nó cho phép bạn giải thích liệu một giả định là đúng hay một vi phạm đã được thực hiện.

Giải thích thống kê các bài kiểm tra

Kiểm tra giả thuyếtđược sử dụng để xác định kết quả nghiên cứu nào sẽ dẫn đến việc bác bỏ giả thuyết vô hiệu đối với một mức ý nghĩa xác định trước. Kết quả của thử nghiệm giả thuyết thống kê phải được giải thích để công việc có thể tiếp tục thực hiện. Có hai hình thức phổ biến của tiêu chí kiểm định giả thuyết thống kê. Đây là giá trị p và giá trị tới hạn. Tùy thuộc vào tiêu chí đã chọn, kết quả thu được phải được diễn giải khác nhau.

Giá trị p là gì

Đầu ra được mô tả là có ý nghĩa thống kê khi diễn giải giá trị p. Trên thực tế, chỉ số này có nghĩa là xác suất sai sót nếu giả thuyết vô hiệu bị bác bỏ. Nói cách khác, nó có thể được sử dụng để đặt tên cho một giá trị có thể được sử dụng để giải thích hoặc định lượng một kết quả thử nghiệm, và để xác định xác suất sai sót khi bác bỏ giả thuyết vô hiệu. Ví dụ: bạn có thể thực hiện kiểm tra tính bình thường trên một mẫu dữ liệu và nhận thấy rằng có rất ít cơ hội xảy ra ngoại lệ. Tuy nhiên, giả thuyết vô hiệu không phải bị bác bỏ. Kiểm định giả thuyết thống kê có thể trả về giá trị p. Điều này được thực hiện bằng cách so sánh giá trị của p với một giá trị ngưỡng xác định trước được gọi là mức ý nghĩa.

Kiểm định thống kê các giả thuyết vô hiệu
Kiểm định thống kê các giả thuyết vô hiệu

Mức độ quan trọng

Mức độ quan trọng thường được viết bằng chữ cái viết thường "alpha" trong tiếng Hy Lạp. Giá trị chung được sử dụng cho alpha là 5% hoặc 0,05. Giá trị alpha nhỏ hơn gợi ý một cách giải thích đáng tin cậy hơn cho giả thuyết vô hiệu. Giá trị p được so sánh vớigiá trị alpha được chọn trước. Kết quả có ý nghĩa thống kê nếu giá trị p nhỏ hơn alpha. Mức ý nghĩa có thể được đảo ngược bằng cách trừ nó cho một. Điều này được thực hiện để xác định mức độ tin cậy của giả thuyết với dữ liệu mẫu quan sát. Khi sử dụng phương pháp này để kiểm tra các giả thuyết thống kê, giá trị P là xác suất. Điều này có nghĩa là trong quá trình diễn giải kết quả của một bài kiểm tra thống kê, người ta không biết điều gì là đúng hay sai.

Lý thuyết kiểm định giả thuyết thống kê

Việc bác bỏ giả thuyết không có nghĩa là có đủ bằng chứng thống kê cho thấy nó có vẻ khả thi. Nếu không, nó có nghĩa là không có đủ số liệu thống kê để bác bỏ nó. Người ta có thể nghĩ đến các thử nghiệm thống kê về sự phân đôi của việc bác bỏ và chấp nhận giả thuyết vô hiệu. Sự nguy hiểm của việc kiểm định thống kê đối với giả thuyết vô hiệu là, nếu được chấp nhận, nó có thể đúng. Thay vào đó, sẽ đúng hơn nếu nói rằng giả thuyết vô hiệu không bị bác bỏ vì không có đủ bằng chứng thống kê để bác bỏ nó.

Giả thuyết thống kê kiểm tra mức độ tốt của các tiêu chí phù hợp
Giả thuyết thống kê kiểm tra mức độ tốt của các tiêu chí phù hợp

Khoảnh khắc này thường gây nhầm lẫn cho những người mới làm quen với nghề. Trong trường hợp như vậy, điều quan trọng là phải nhắc nhở bản thân rằng kết quả là có xác suất và rằng ngay cả khi chấp nhận giả thuyết rỗng vẫn có một cơ hội sai sót nhỏ.

Giả thuyết rỗng đúng hay sai

Giải thích giá trị của p không có nghĩa là số 0giả thuyết đúng hay sai. Điều này có nghĩa là một lựa chọn đã được thực hiện để bác bỏ hoặc không bác bỏ giả thuyết vô hiệu ở một mức ý nghĩa thống kê nhất định dựa trên dữ liệu thực nghiệm và kiểm định thống kê đã chọn. Do đó, giá trị p có thể được coi là xác suất của dữ liệu được đưa ra theo một giả định xác định trước được nhúng trong các thử nghiệm thống kê. Giá trị p là thước đo khả năng mẫu dữ liệu sẽ được quan sát nếu giả thuyết rỗng là đúng.

Diễn giải các giá trị quan trọng

Một số bài kiểm tra không trả về p. Thay vào đó, chúng có thể trả về một danh sách các giá trị quan trọng. Kết quả của một nghiên cứu như vậy được giải thích theo một cách tương tự. Thay vì so sánh một giá trị p đơn lẻ với mức ý nghĩa xác định trước, thống kê thử nghiệm được so sánh với một giá trị tới hạn. Nếu nó nhỏ hơn, điều đó có nghĩa là không thể bác bỏ giả thuyết vô hiệu. Nếu lớn hơn hoặc bằng, giả thuyết rỗng nên bị bác bỏ. Ý nghĩa của thuật toán kiểm định giả thuyết thống kê và giải thích kết quả của nó tương tự như giá trị p. Mức ý nghĩa được chọn là một quyết định có xác suất để bác bỏ hoặc không bác bỏ giả định kiểm tra cơ sở đưa ra dữ liệu.

Lỗi trong kiểm tra thống kê

Việc giải thích một bài kiểm tra giả thuyết thống kê là có tính xác suất. Nhiệm vụ của việc kiểm tra các giả thuyết thống kê không phải để tìm ra một tuyên bố đúng hay sai. Bằng chứng kiểm tra có thể sai sót. Ví dụ: nếu alpha là 5%, điều này có nghĩa là hầu hết phần 1 trên 20giả thuyết vô hiệu sẽ bị bác bỏ do nhầm lẫn. Hoặc nó sẽ không do nhiễu thống kê trong mẫu dữ liệu. Với điểm này, một giá trị p nhỏ để bác bỏ giả thuyết rỗng có thể có nghĩa là nó sai hoặc một lỗi đã được thực hiện. Nếu loại lỗi này được thực hiện, kết quả được gọi là dương tính giả. Và lỗi như vậy là lỗi thuộc loại đầu tiên khi kiểm tra các giả thuyết thống kê. Mặt khác, nếu giá trị p đủ lớn để bác bỏ giả thuyết vô hiệu, thì điều đó có thể có nghĩa là nó đúng. Hoặc không chính xác, và một số trường hợp không chắc đã xảy ra do lỗi đã được thực hiện. Loại lỗi này được gọi là âm sai.

Kiểm định thống kê các giả thuyết vô hiệu
Kiểm định thống kê các giả thuyết vô hiệu

Xác suất sai sót

Khi kiểm tra các giả thuyết thống kê, vẫn có khả năng mắc phải bất kỳ loại lỗi nào trong số này. Dữ liệu sai hoặc kết luận sai là hoàn toàn có thể xảy ra. Tốt nhất, nên chọn mức ý nghĩa để giảm thiểu khả năng xảy ra một trong các lỗi này. Ví dụ, kiểm định thống kê các giả thuyết rỗng có thể có mức ý nghĩa rất thấp. Mặc dù các mức ý nghĩa như 0,05 và 0,01 là phổ biến trong nhiều lĩnh vực khoa học, mức ý nghĩa được sử dụng phổ biến nhất là 310 ^ -7, hoặc 0,0000003. Nó thường được gọi là “5-sigma”. Điều này có nghĩa là kết luận là ngẫu nhiên với xác suất 1 trong 3,5 triệu lần lặp lại thí nghiệm độc lập. Các ví dụ về thử nghiệm các giả thuyết thống kê thường mang những sai số như vậy. Đây cũng là lý do tại sao điều quan trọng là phải có kết quả độc lập.xác minh.

Ví dụ về việc sử dụng xác minh thống kê

Có một số ví dụ phổ biến về kiểm tra giả thuyết trong thực tế. Một trong những cách phổ biến nhất được biết đến là “Nếm trà”. Tiến sĩ Muriel Bristol, đồng nghiệp của nhà sáng lập sinh trắc học Robert Fisher, tuyên bố có thể biết chắc chắn liệu nó được thêm vào cốc trà hay sữa trước. Fisher đề nghị đưa cho cô ấy 8 cốc (mỗi loại 4 cốc) một cách ngẫu nhiên. Thống kê thử nghiệm rất đơn giản: đếm số lần thành công trong việc chọn một chiếc cốc. Vùng quan trọng là thành công duy nhất trong số 4, có thể dựa trên tiêu chí xác suất thông thường (< 5%; 1 trên 70 ≈ 1,4%). Fisher lập luận rằng một giả thuyết thay thế là không cần thiết. Quý cô xác định chính xác từng chiếc cốc, đây được coi là một kết quả có ý nghĩa thống kê. Kinh nghiệm này đã dẫn đến cuốn sách Phương pháp thống kê dành cho nhà nghiên cứu của Fisher.

Ví dụ bị cáo

Thủ tục xét xử thống kê có thể so sánh với một tòa án hình sự nơi bị cáo được cho là vô tội cho đến khi được chứng minh là có tội. Công tố viên cố gắng chứng minh tội lỗi của bị cáo. Chỉ khi có đủ bằng chứng buộc tội thì bị cáo mới được kết tội. Mở đầu phần thủ tục, có hai giả thuyết “Bị cáo không có tội” và “Bị cáo có tội”. Giả thuyết vô tội chỉ có thể bị bác bỏ khi rất khó xảy ra sai sót vì người ta không muốn kết tội một bị cáo vô tội. Lỗi như vậy được gọi là lỗi Loại I và sự xuất hiện của nóhiếm khi được kiểm soát. Do hành vi bất đối xứng này, lỗi Loại II, tức là thủ phạm trắng án, phổ biến hơn.

Ví dụ về xác thực thống kê
Ví dụ về xác thực thống kê

Thống kê hữu ích khi phân tích một lượng lớn dữ liệu. Điều này áp dụng tương tự cho việc kiểm tra các giả thuyết, có thể biện minh cho các kết luận ngay cả khi không có lý thuyết khoa học nào tồn tại. Trong ví dụ nếm trà, rõ ràng là không có sự khác biệt giữa việc đổ sữa vào trà hay đổ trà vào sữa.

Ứng dụng thực tế thực tế của kiểm định giả thuyết bao gồm:

  • kiểm tra xem đàn ông có gặp ác mộng nhiều hơn phụ nữ không;
  • phân bổ tài liệu;
  • Đánh giá ảnh hưởng của trăng tròn đối với hành vi;
  • xác định phạm vi mà dơi có thể phát hiện côn trùng bằng tiếng vang;
  • chọn phương tiện tốt nhất để bỏ thuốc lá;
  • Kiểm tra xem miếng dán cản có phản ánh hành vi của chủ xe hay không.

Kiểm tra giả thuyết thống kê đóng một vai trò quan trọng trong thống kê nói chung và trong suy luận thống kê. Kiểm tra giá trị được sử dụng để thay thế cho việc so sánh truyền thống giữa giá trị dự đoán và kết quả thực nghiệm ở cốt lõi của phương pháp khoa học. Khi một lý thuyết chỉ có khả năng dự đoán dấu hiệu của một mối quan hệ, các kiểm định giả thuyết có định hướng có thể được cấu hình theo cách mà chỉ một kết quả có ý nghĩa thống kê mới hỗ trợ lý thuyết. Hình thức lý thuyết đánh giá này là cứng nhắc nhấtchỉ trích việc sử dụng thử nghiệm giả thuyết.

Đề xuất: