Khái niệm về tính đại diện thường được tìm thấy trong báo cáo thống kê và trong việc chuẩn bị các bài phát biểu và báo cáo. Có lẽ, nếu không có nó, rất khó để hình dung bất kỳ hình thức trình bày thông tin nào để xem xét.
Tính đại diện - nó là gì?
Tính đại diện phản ánh cách các đối tượng hoặc bộ phận được chọn tương ứng với nội dung và ý nghĩa của tập dữ liệu mà chúng được chọn từ đó.
Các định nghĩa khác
Khái niệm về tính đại diện có thể được tiết lộ trong các bối cảnh khác nhau. Nhưng theo nghĩa của nó, tính đại diện là sự tương ứng của các đặc điểm và thuộc tính của các đơn vị được chọn từ tổng thể chung, phản ánh chính xác các đặc điểm của toàn bộ cơ sở dữ liệu chung.
Tính đại diện của thông tin cũng được định nghĩa là khả năng của dữ liệu mẫu để đại diện cho các tham số và thuộc tính của tổng thể quan trọng theo quan điểm của nghiên cứu.
Mẫu đại diện
Nguyên tắc lấy mẫu là chọnquan trọng nhất và phản ánh chính xác các thuộc tính của tổng tập dữ liệu. Vì vậy, các phương pháp khác nhau được sử dụng để cho phép thu được kết quả chính xác và ý tưởng chung về tổng thể, chỉ sử dụng các tài liệu mẫu mô tả chất lượng của tất cả dữ liệu.
Như vậy, không nhất thiết phải nghiên cứu toàn bộ tài liệu, nhưng chỉ cần xem xét tính đại diện của mẫu là đủ. Nó là gì? Đây là sự lựa chọn dữ liệu riêng lẻ để có ý tưởng về tổng khối lượng thông tin.
Tùy thuộc vào phương pháp, chúng được phân biệt là có xác suất và không thể xảy ra. Xác suất là một mẫu được thực hiện bằng cách tính toán các dữ liệu quan trọng và thú vị nhất, là các đại diện khác của dân số chung. Đó là sự lựa chọn có chủ ý hay sự lựa chọn ngẫu nhiên, dù sao cũng được biện minh bởi nội dung của nó.
Không thể cải tiến - đây là một trong những kiểu lấy mẫu ngẫu nhiên, được biên soạn theo nguyên tắc xổ số thông thường. Trong trường hợp này, ý kiến của người tạo ra mẫu đó không được tính đến. Chỉ có rất nhiều mù được sử dụng.
Lấy mẫu xác suất
Mẫu xác suất cũng có thể được chia thành nhiều loại:
- Một trong những nguyên tắc đơn giản và dễ hiểu nhất là lấy mẫu không đại diện. Ví dụ, phương pháp này thường được sử dụng trong các cuộc điều tra xã hội. Đồng thời, những người tham gia khảo sát không được chọn từ đám đông theo bất kỳ lý do cụ thể nào và thông tin được thu thập từ 50 người đầu tiên tham gia khảo sát.
- Cố ýCác mẫu khác nhau ở chỗ chúng có một số yêu cầu và điều kiện trong việc lựa chọn, nhưng vẫn dựa trên sự trùng hợp ngẫu nhiên, không theo đuổi mục tiêu đạt được số liệu thống kê tốt.
- Lấy mẫu dựa trên hạn ngạch là một biến thể khác của lấy mẫu không theo xác suất thường được sử dụng để kiểm tra các tập dữ liệu lớn. Nó sử dụng rất nhiều điều khoản và điều kiện. Các đối tượng được chọn phải tương ứng với chúng. Tức là, sử dụng ví dụ về một cuộc điều tra xã hội, có thể giả định rằng 100 người sẽ được phỏng vấn, nhưng chỉ xem xét ý kiến của một số người nhất định đáp ứng các yêu cầu đã thiết lập khi lập báo cáo thống kê.
Mẫu xác suất
Đối với các mẫu xác suất, một số tham số được tính toán mà các đối tượng trong mẫu sẽ tương ứng, và trong số đó, theo những cách khác nhau, chính xác những sự kiện và dữ liệu sẽ được trình bày dưới dạng tính đại diện của dữ liệu mẫu có thể đã chọn. Những cách tính toán dữ liệu cần thiết này có thể là:
Lấy mẫu ngẫu nhiên đơn giản. Nó bao gồm thực tế là trong số các phân đoạn đã chọn, lượng dữ liệu cần thiết được chọn theo phương pháp rút thăm hoàn toàn ngẫu nhiên, đây sẽ là một mẫu đại diện
Lấy mẫu ngẫu nhiên và có hệ thống giúp tạo ra một hệ thống để tính toán dữ liệu cần thiết dựa trên một phân đoạn được chọn ngẫu nhiên. Do đó, nếu số ngẫu nhiên đầu tiên cho biết số thứ tự của dữ liệu được chọn từ tổng dân số là 5, thì số tiếp theodữ liệu được chọn có thể là, ví dụ: 15, 25, 35, v.v. Ví dụ này giải thích rõ ràng rằng ngay cả một lựa chọn ngẫu nhiên cũng có thể dựa trên các tính toán có hệ thống về dữ liệu đầu vào cần thiết
Mẫu của người tiêu dùng
Lấy mẫu có chủ đích là một phương pháp xem xét từng phân đoạn riêng lẻ và dựa trên đánh giá của nó, một tập hợp được tổng hợp phản ánh các đặc điểm và tính chất của cơ sở dữ liệu tổng thể. Bằng cách này, nhiều dữ liệu được thu thập hơn đáp ứng các yêu cầu của mẫu đại diện. Có thể dễ dàng chọn một số tùy chọn sẽ không được bao gồm trong tổng số, mà không làm giảm chất lượng của dữ liệu đã chọn đại diện cho tổng dân số. Bằng cách này, tính đại diện của kết quả nghiên cứu được xác định.
Kích thước mẫu
Không phải vấn đề cuối cùng cần được giải quyết là kích thước mẫu cho một đại diện tiêu biểu của dân số. Cỡ mẫu không phải lúc nào cũng phụ thuộc vào số lượng nguồn trong tổng thể chung. Tuy nhiên, tính đại diện của tổng thể mẫu phụ thuộc trực tiếp vào việc chia kết quả thành bao nhiêu phân đoạn. Càng nhiều phân đoạn như vậy, càng nhiều dữ liệu được đưa vào mẫu kết quả. Nếu kết quả yêu cầu ký hiệu chung và không yêu cầu chi tiết cụ thể, thì mẫu sẽ nhỏ hơn, bởi vì, không đi sâu vào chi tiết, thông tin được trình bày hời hợt hơn, có nghĩa là cách đọc của nó sẽ chung chung.
Sai lầm về khái niệmtính đại diện
Lỗi tính đại diện là sự khác biệt cụ thể giữa các đặc điểm của tổng thể và dữ liệu mẫu. Khi thực hiện bất kỳ nghiên cứu mẫu nào, không thể có được dữ liệu chính xác tuyệt đối, như trong một nghiên cứu đầy đủ về các quần thể nói chung và một mẫu chỉ được cung cấp một phần thông tin và tham số, trong khi một nghiên cứu chi tiết hơn chỉ có thể thực hiện khi nghiên cứu toàn bộ quần thể. Do đó, một số điểm không chính xác và sai sót là không thể tránh khỏi.
Các loại lỗi
Phân biệt một số lỗi xảy ra khi biên dịch mẫu đại diện:
- Có hệ thống.
- Ngẫu nhiên.
- Cố ý.
- Vô tình.
- Chuẩn.
- Giới hạn.
Lý do cho sự xuất hiện của các sai số ngẫu nhiên có thể là tính chất không liên tục của nghiên cứu dân số chung. Thông thường, sai số ngẫu nhiên về tính đại diện có kích thước và tính chất không đáng kể.
Trong khi đó, lỗi hệ thống xảy ra khi các quy tắc chọn dữ liệu từ tổng thể chung bị vi phạm.
Sai số trung bình là sự khác biệt giữa giá trị trung bình của mẫu và tổng thể cơ bản. Nó không phụ thuộc vào số lượng đơn vị trong mẫu. Nó tỷ lệ nghịch với kích thước mẫu. Khi đó, âm lượng càng lớn thì giá trị của sai số trung bình càng nhỏ.
Sai số biên là sự khác biệt lớn nhất có thể có giữa các giá trị trung bình của mẫu được lấy và tổng dân số. Một lỗi như vậy được đặc trưng là các lỗi có thể xảy ra tối đatrong những điều kiện nhất định về sự xuất hiện của chúng.
Lỗi cố ý và vô ý của tính đại diện
Lỗi bù đắp dữ liệu có thể là cố ý hoặc vô ý.
Sau đó, lý do cho sự xuất hiện của các lỗi cố ý là cách tiếp cận lựa chọn dữ liệu theo phương pháp xác định xu hướng. Sai sót ngoài ý muốn xảy ra ngay cả ở khâu chuẩn bị quan sát mẫu, tạo thành mẫu đại diện. Để tránh những sai sót như vậy, cần tạo ra một khung lấy mẫu tốt để liệt kê các đơn vị lấy mẫu. Nó phải đáp ứng đầy đủ các mục tiêu của việc lấy mẫu, đáng tin cậy, bao gồm tất cả các khía cạnh của nghiên cứu.
Tính hợp lệ, độ tin cậy, tính đại diện. Tính toán lỗi
Tính sai số đại diện (Mm) của trung bình cộng (M).
Độ lệch chuẩn: kích thước mẫu (>30).
Lỗi tính đại diện (Mr) và giá trị tương đối (R): cỡ mẫu (n>30).
Trong trường hợp bạn phải nghiên cứu một quần thể có số lượng mẫu nhỏ và dưới 30 đơn vị, thì số lượng quan sát sẽ giảm đi một đơn vị.
Kích thước của lỗi tỷ lệ thuận với kích thước của mẫu. Tính đại diện của thông tin và việc tính toán mức độ có thể đưa ra dự báo chính xác phản ánh một lượng sai số biên nhất định.
Hệ thống biểu diễn
Không chỉ là một mẫu đại diện được sử dụng trong quá trình đánh giá việc trình bày thông tin, mà bản thân người nhận thông tin,sử dụng các hệ thống đại diện. Do đó, não bộ xử lý một lượng thông tin nhất định, tạo ra một mẫu đại diện từ toàn bộ luồng thông tin để đánh giá một cách định tính và nhanh chóng dữ liệu được gửi và hiểu được bản chất của vấn đề. Trả lời câu hỏi: "Tính đại diện - nó là gì?" - về quy mô ý thức của con người thì khá đơn giản. Để làm được điều này, não bộ sử dụng tất cả các cơ quan giác quan phụ, tùy thuộc vào loại thông tin nào cần được tách biệt khỏi dòng chảy chung. Do đó, họ phân biệt:
- Hệ thống biểu diễn thị giác, nơi liên quan đến các cơ quan nhận thức thị giác của mắt. Những người thường sử dụng một hệ thống như vậy được gọi là thị giác. Với sự trợ giúp của hệ thống này, một người xử lý thông tin dưới dạng hình ảnh.
- Hệ thống biểu diễn thính giác. Cơ quan chính được sử dụng là thính giác. Thông tin được cung cấp dưới dạng tệp âm thanh hoặc lời nói được xử lý bởi hệ thống cụ thể này. Những người cảm nhận thông tin tốt hơn bằng tai được gọi là thính giác.
- Hệ thống biểu diễn động học là xử lý luồng thông tin bằng cách nhận thức thông tin qua các kênh khứu giác và xúc giác.
Hệ thống biểu diễn kỹ thuật số được sử dụng cùng với những hệ thống khác như một phương tiện thu thập thông tin từ bên ngoài. Đây là nhận thức chủ quan-lôgic và sự hiểu biết về dữ liệu đã nhận
Vậy, tính đại diện - nó là gì? Một lựa chọn đơn giản từ một tập hợp hoặcthủ tục tích hợp trong việc xử lý thông tin? Chúng tôi chắc chắn có thể nói rằng tính đại diện quyết định phần lớn nhận thức của chúng tôi về các luồng dữ liệu, giúp tách biệt phần lớn và quan trọng nhất khỏi nó.