Các khái niệm cơ bản của thống kê toán học. Ứng dụng của thống kê toán học

Mục lục:

Các khái niệm cơ bản của thống kê toán học. Ứng dụng của thống kê toán học
Các khái niệm cơ bản của thống kê toán học. Ứng dụng của thống kê toán học
Anonim

Thống kê toán học là một phương pháp luận cho phép bạn đưa ra quyết định sáng suốt khi đối mặt với các điều kiện không chắc chắn. Nghiên cứu các phương pháp thu thập và hệ thống hóa dữ liệu, xử lý kết quả cuối cùng của các thí nghiệm và thí nghiệm với tính ngẫu nhiên hàng loạt, và phát hiện ra bất kỳ mẫu nào là những gì ngành toán học này làm. Xem xét các khái niệm cơ bản của thống kê toán học.

Sự khác biệt với lý thuyết xác suất

Phương pháp thống kê toán học giao thoa chặt chẽ với lý thuyết xác suất. Cả hai nhánh của toán học đều liên quan đến việc nghiên cứu nhiều hiện tượng ngẫu nhiên. Hai ngành được kết nối với nhau bằng các định lý giới hạn. Tuy nhiên, có một sự khác biệt lớn giữa các ngành khoa học này. Nếu lý thuyết xác suất xác định các đặc điểm của một quá trình trong thế giới thực trên cơ sở mô hình toán học, thì thống kê toán học lại làm ngược lại - nó đặt các thuộc tính của mô hình thànhdựa trên thông tin quan sát được.

Lý thuyết xác suất và mat. số liệu thống kê
Lý thuyết xác suất và mat. số liệu thống kê

Bước

Việc áp dụng thống kê toán học chỉ có thể được thực hiện liên quan đến các sự kiện hoặc quá trình ngẫu nhiên, hay đúng hơn, với dữ liệu thu được từ việc quan sát chúng. Và điều này xảy ra trong nhiều giai đoạn. Đầu tiên, dữ liệu của các thí nghiệm và thực nghiệm trải qua một số quá trình xử lý nhất định. Chúng được sắp xếp để rõ ràng và dễ phân tích. Sau đó, một ước tính chính xác hoặc gần đúng của các tham số yêu cầu của quá trình ngẫu nhiên quan sát được thực hiện. Chúng có thể là:

  • đánh giá xác suất của một sự kiện (xác suất của nó ban đầu chưa biết);
  • nghiên cứu hành vi của một hàm phân phối không xác định;
  • ước tính kỳ vọng;
  • ước tính phương sai
  • vv
Các nguyên tắc cơ bản của chiếu. số liệu thống kê
Các nguyên tắc cơ bản của chiếu. số liệu thống kê

Giai đoạn thứ ba là xác minh bất kỳ giả thuyết nào được đặt ra trước khi phân tích, tức là thu được câu trả lời cho câu hỏi làm thế nào kết quả của các thí nghiệm tương ứng với các tính toán lý thuyết. Trên thực tế, đây là giai đoạn chính của thống kê toán học. Một ví dụ sẽ là xem xét liệu hành vi của một quá trình ngẫu nhiên được quan sát có nằm trong phân phối chuẩn hay không.

Quần thể

Các khái niệm cơ bản của thống kê toán học bao gồm tổng thể và tổng thể mẫu. Ngành học này liên quan đến việc nghiên cứu một tập hợp các đối tượng nhất định đối với một số tài sản. Một ví dụ là công việc của một tài xế taxi. Hãy xem xét các biến ngẫu nhiên sau:

  • tải hoặc số lượng khách hàng: mỗi ngày, trước bữa trưa, sau bữa trưa,…;
  • thời gian di chuyển trung bình;
  • số lượng ứng dụng đến hoặc tệp đính kèm của chúng với các quận thành phố và hơn thế nữa.

Cũng cần lưu ý rằng có thể nghiên cứu một tập hợp các quá trình ngẫu nhiên tương tự, đây cũng sẽ là một biến ngẫu nhiên có thể quan sát được.

Dân số
Dân số

Vì vậy, trong các phương pháp thống kê toán học, toàn bộ các đối tượng được nghiên cứu hoặc kết quả của các quan sát khác nhau được thực hiện trong cùng một điều kiện trên một đối tượng nhất định được gọi là tổng thể chung. Nói cách khác, về mặt toán học nghiêm ngặt hơn, nó là một biến ngẫu nhiên được xác định trong không gian của các sự kiện cơ bản, với một lớp các tập con được chỉ định trong đó, các phần tử của chúng có xác suất đã biết.

Quần thể mẫu

Có những trường hợp vì lý do nào đó (chi phí, thời gian) không thể hoặc không thực tế mà tiến hành một cuộc nghiên cứu liên tục để nghiên cứu từng đối tượng. Ví dụ, mở mọi lọ mứt đã niêm phong để kiểm tra chất lượng của nó là một quyết định không rõ ràng và việc cố gắng ước tính quỹ đạo của mỗi phân tử không khí trong một mét khối là không thể. Trong những trường hợp như vậy, phương pháp quan sát chọn lọc được sử dụng: một số đối tượng nhất định được chọn (thường là ngẫu nhiên) từ tổng thể chung và chúng được phân tích.

Mẫu từ chungtổng hợp
Mẫu từ chungtổng hợp

Những khái niệm này thoạt nghe có vẻ phức tạp. Vì vậy, để hiểu đầy đủ nội dung chuyên đề, các em cần nghiên cứu kỹ giáo trình "Lý thuyết xác suất và thống kê toán học" của V. E. Gmurman. Như vậy, tập lấy mẫu hay còn gọi là tập mẫu là một loạt các đối tượng được chọn ngẫu nhiên từ tập hợp chung. Theo thuật ngữ toán học nghiêm ngặt, đây là một chuỗi các biến ngẫu nhiên độc lập, được phân phối đồng đều, đối với mỗi biến ngẫu nhiên có phân phối trùng với phân bố được chỉ ra cho biến ngẫu nhiên chung.

Khái niệm cơ bản

Hãy xem xét ngắn gọn một số khái niệm cơ bản khác của thống kê toán học. Số lượng các đối tượng trong tổng thể hoặc mẫu chung được gọi là khối lượng. Các giá trị mẫu thu được trong quá trình thí nghiệm được gọi là độ thực mẫu. Để ước tính dân số chung dựa trên mẫu là đáng tin cậy, điều quan trọng là phải có cái gọi là mẫu đại diện hoặc mẫu đại diện. Điều này có nghĩa là mẫu phải đại diện đầy đủ cho dân số. Điều này chỉ có thể đạt được nếu tất cả các phần tử của tổng thể có xác suất nằm trong mẫu bằng nhau.

Các khái niệm cơ bản
Các khái niệm cơ bản

Mẫu phân biệt giữa trả lại và không trả lại. Trong trường hợp đầu tiên, trong nội dung của mẫu, phần tử lặp lại được trả về tập hợp chung, trong trường hợp thứ hai, nó không. Thông thường, trong thực tế, lấy mẫu không có thay thế được sử dụng. Cũng cần lưu ý rằng quy mô của dân số chung luôn vượt quá quy mô của mẫu một cách đáng kể. Hiện hữunhiều tùy chọn cho quá trình lấy mẫu:

  • đơn giản - các mục được chọn ngẫu nhiên tại một thời điểm;
  • đã nhập - dân số chung được chia thành nhiều loại và một lựa chọn được đưa ra từ mỗi loại; một ví dụ là cuộc khảo sát về cư dân: nam và nữ riêng biệt;
  • cơ - ví dụ: chọn mọi phần tử thứ 10;
  • serial - lựa chọn được thực hiện theo chuỗi các phần tử.

Phân phối thống kê

Theo Gmurman, lý thuyết xác suất và thống kê toán học là những bộ môn cực kỳ quan trọng trong giới khoa học, đặc biệt là trong phần thực hành của nó. Xem xét phân phối thống kê của mẫu.

Giả sử chúng ta có một nhóm học sinh đã được kiểm tra toán học. Kết quả là chúng tôi có một tập hợp các ước tính: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - đây là tài liệu thống kê chính của chúng tôi.

Trước hết, chúng ta cần sắp xếp nó, hoặc thực hiện một phép toán xếp hạng: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - và do đó có được một chuỗi biến thiên. Số lần lặp lại của mỗi đánh giá được gọi là tần suất đánh giá và tỷ lệ của chúng với cỡ mẫu được gọi là tần suất tương đối. Hãy lập bảng phân phối thống kê của mẫu hoặc chỉ một chuỗi thống kê:

ai 1 2 3 4 5
pi 1 1 2 4 3

hoặc

ai 1 2 3 4 5
pi 1/11 1/11 2/11 4/11 3/11

Hãy có một biến ngẫu nhiên mà chúng ta sẽ tiến hành một loạt các thử nghiệm và xem giá trị của biến này là bao nhiêu. Giả sử cô ấy lấy giá trị a1- m1lần; a2- m2lần, v.v. Kích thước của mẫu này sẽ là m1+… + mk=m. Tập hợpi, trong đó tôi thay đổi từ 1 đến k, là một chuỗi thống kê.

Phân phối khoảng cách

Trong cuốn sách "Lý thuyết xác suất và thống kê toán học" của VE Gmurman, một chuỗi thống kê khoảng thời gian cũng được trình bày. Việc biên dịch nó có thể thực hiện được khi giá trị của đối tượng địa lý đang nghiên cứu liên tục trong một khoảng thời gian nhất định và số lượng giá trị lớn. Hãy xem xét một nhóm sinh viên, hay đúng hơn, chiều cao của họ: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 171, 164, 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - tổng số 30 học sinh. Rõ ràng, chiều cao của một người là một giá trị liên tục. Chúng ta cần xác định bước khoảng. Đối với điều này, công thức Sturges được sử dụng.

h= max - min = 190 - 156 = 33 = 5, 59
1 + log2m 1 + log230 5, 9

Vì vậy, giá trị của 6 có thể được coi là kích thước của khoảng. Cũng cần nói rằng giá trị 1 + log2m là công thức củaxác định số khoảng (tất nhiên, với làm tròn). Như vậy, theo công thức ta thu được 6 khoảng, mỗi khoảng có kích thước là 6. Và giá trị đầu tiên của khoảng ban đầu sẽ là số được xác định theo công thức: min - h / 2=156 - 6/2=153. Hãy lập một bảng chứa các khoảng thời gian và số học sinh có mức tăng trưởng giảm xuống trong một khoảng thời gian nhất định.

H [153; 159) [159; 165) [165; 171) [171; 177) [177; 183) [183; 189)
P 2 5 3 9 8 3
P 0, 06 0, 17 0, 1 0, 3 0, 27 0, 1

Tất nhiên, đây không phải là tất cả, vì có nhiều công thức hơn trong thống kê toán học. Chúng tôi chỉ xem xét một số khái niệm cơ bản.

Lịch phân phối

Biểu đồ phân phối
Biểu đồ phân phối

Các khái niệm cơ bản của thống kê toán học cũng bao gồm một biểu diễn đồ họa của phân phối, được phân biệt bằng sự rõ ràng. Có hai loại đồ thị: đa giác và biểu đồ. Đầu tiên được sử dụng cho một chuỗi thống kê rời rạc. Và để phân phối liên tục, tương ứng là phân phối thứ hai.

Đề xuất: