Mạng Bayes: định nghĩa, ví dụ và cách chúng hoạt động

Mục lục:

Mạng Bayes: định nghĩa, ví dụ và cách chúng hoạt động
Mạng Bayes: định nghĩa, ví dụ và cách chúng hoạt động
Anonim

Niềm tin, mạng quyết định, mô hình Bayesian (ian) hoặc mô hình đồ thị xoay chiều theo xác suất là một lược đồ biến thể (một loại mô hình thống kê) đại diện cho một tập hợp các biến và sự phụ thuộc có điều kiện của chúng thông qua biểu đồ xoay chiều có hướng (DAG).

Ví dụ, một mạng Bayes có thể đại diện cho các mối quan hệ xác suất giữa các bệnh và các triệu chứng. Với điều kiện thứ hai, mạng có thể được sử dụng để tính toán khả năng mắc các bệnh khác nhau. Trong video bên dưới, bạn có thể xem một ví dụ về mạng lưới tín ngưỡng Bayes với các phép tính.

Image
Image

Hiệu quả

Các thuật toán hiệu quả có thể thực hiện suy luận và học hỏi trên mạng Bayes. Các mạng mô hình hóa các biến (chẳng hạn như tín hiệu giọng nói hoặc chuỗi protein) được gọi là mạng động. Những khái quát của mạng Bayes có thể biểu diễn và giải quyết các vấn đề dưới sự không chắc chắn được gọi là sơ đồ ảnh hưởng.

Cốt

Chính thứcMạng Bayes là các DAG có các nút đại diện cho các biến theo nghĩa Bayes: chúng có thể là giá trị quan sát, biến ẩn, tham số chưa biết hoặc giả thuyết. Bởi vì nó rất thú vị.

Ví dụ về mạng Bayesian

Hai sự kiện có thể khiến cỏ bị ướt: vòi phun nước đang hoạt động hoặc mưa. Mưa ảnh hưởng trực tiếp đến việc sử dụng vòi phun nước (cụ thể là khi trời mưa, vòi phun nước thường không hoạt động). Tình huống này có thể được mô phỏng bằng mạng Bayes.

Công thức điển hình
Công thức điển hình

Mô phỏng

Bởi vì mạng Bayes là một mô hình hoàn chỉnh cho các biến của nó và các mối quan hệ của chúng, nó có thể được sử dụng để trả lời các truy vấn xác suất về chúng. Ví dụ, nó có thể được sử dụng để cập nhật kiến thức về trạng thái của một tập hợp con các biến khi dữ liệu khác (biến bằng chứng) được quan sát. Quá trình thú vị này được gọi là suy luận xác suất.

Một posteriori đưa ra một thống kê đủ phổ biến cho các ứng dụng khám phá khi chọn giá trị cho một tập hợp con các biến. Như vậy, có thể coi thuật toán này là một cơ chế tự động áp dụng định lý Bayes vào các bài toán phức tạp. Trong các hình ảnh trong bài viết, bạn có thể thấy các ví dụ về mạng lưới tín ngưỡng Bayes.

Mạng Bayes thực tế
Mạng Bayes thực tế

Phương thức xuất

Các phương pháp suy luận chính xác phổ biến nhất là: loại bỏ biến, loại bỏ (bằng tích phân hoặc tổng)từng tham số không phải truy vấn bằng cách phân bổ số lượng cho sản phẩm.

Nhấp vào truyền giống "cây" lưu trữ các phép tính để nhiều biến có thể được truy vấn cùng một lúc và các bằng chứng mới có thể được phổ biến một cách nhanh chóng; và đối sánh đệ quy và / hoặc tìm kiếm, cho phép cân bằng giữa không gian và thời gian và phù hợp với hiệu quả của việc loại bỏ biến khi sử dụng đủ dung lượng.

Tất cả các phương pháp này đều có độ phức tạp đặc biệt phụ thuộc theo cấp số nhân vào độ dài của mạng. Các thuật toán suy luận gần đúng phổ biến nhất là loại bỏ phân đoạn nhỏ, truyền bá niềm tin theo chu kỳ, truyền bá niềm tin tổng quát và các phương pháp biến phân.

Các loại mạng
Các loại mạng

Mạng

Để xác định đầy đủ mạng Bayes và do đó đại diện đầy đủ cho phân phối xác suất chung, cần phải chỉ định cho mỗi nút X phân phối xác suất cho X do cha mẹ của X.

Phân phối X theo điều kiện theo điều kiện của cha mẹ của nó có thể có bất kỳ dạng nào. Người ta thường làm việc với các phân phối rời rạc hoặc Gaussian vì nó đơn giản hóa các phép tính. Đôi khi chỉ có các ràng buộc phân phối được biết. Sau đó, bạn có thể sử dụng entropy để xác định phân phối đơn có entropy cao nhất theo các ràng buộc.

Tương tự, trong bối cảnh cụ thể của mạng Bayes động, phân phối có điều kiện cho sự phát triển theo thời gian của mạng tiềm ẩntrạng thái thường được đặt để tối đa hóa tốc độ entropy của quá trình ngẫu nhiên ngụ ý.

Trang web đáng tin cậy của Bayes
Trang web đáng tin cậy của Bayes

Việc tối đa hóa trực tiếp xác suất (hoặc xác suất sau) thường phức tạp do sự hiện diện của các biến không được quan sát. Điều này đặc biệt đúng với mạng quyết định Bayes.

Cách tiếp cận cổ điển

Cách tiếp cận cổ điển cho vấn đề này là thuật toán tối đa hóa kỳ vọng, thay thế việc tính toán các giá trị dự kiến của các biến không được quan sát phụ thuộc vào dữ liệu quan sát với việc tối đa hóa tổng xác suất (hoặc giá trị sau), giả sử rằng kỳ vọng đã tính toán trước đó các giá trị là chính xác. Trong các điều kiện có mức độ thường xuyên vừa phải, quá trình này hội tụ các giá trị lớn nhất (hoặc tối đa một posteriori) của các tham số.

Một cách tiếp cận hoàn chỉnh hơn của Bayes đối với các tham số là coi chúng như các biến bổ sung không được quan sát và tính toán phân phối sau đầy đủ trên tất cả các nút được cung cấp dữ liệu quan sát, sau đó tích hợp các tham số. Cách tiếp cận này có thể tốn kém và dẫn đến các mô hình lớn, làm cho các phương pháp điều chỉnh thông số cổ điển dễ tiếp cận hơn.

Trong trường hợp đơn giản nhất, mạng Bayes được định nghĩa bởi một chuyên gia và sau đó được sử dụng để thực hiện suy luận. Trong các ứng dụng khác, nhiệm vụ xác định là quá khó khăn đối với con người. Trong trường hợp này, cấu trúc của mạng nơ-ron Bayes và các tham số của phân phối cục bộ phải được học trong số dữ liệu.

Các mạng Bayes
Các mạng Bayes

Phương pháp thay thế

Một phương pháp học có cấu trúc thay thế sử dụng tìm kiếm tối ưu hóa. Điều này đòi hỏi phải áp dụng một chức năng đánh giá và một chiến lược tìm kiếm. Một thuật toán tính điểm phổ biến là xác suất sau của một cấu trúc được cung cấp dữ liệu đào tạo, chẳng hạn như BIC hoặc BDeu.

Thời gian cần thiết để tìm kiếm toàn diện trả về cấu trúc tối đa hóa điểm số là siêu cấp số nhân về số lượng biến. Chiến lược tìm kiếm địa phương thực hiện các thay đổi gia tăng để cải thiện ước tính cấu trúc. Friedman và các đồng nghiệp của ông đã xem xét việc sử dụng thông tin lẫn nhau giữa các biến để tìm ra cấu trúc mong muốn. Họ giới hạn tập hợp các ứng cử viên chính ở k nút và tìm kiếm chúng một cách kỹ lưỡng.

Một phương pháp đặc biệt nhanh chóng để nghiên cứu chính xác BN là tưởng tượng vấn đề như một bài toán tối ưu hóa và giải nó bằng cách sử dụng lập trình số nguyên. Các ràng buộc về tính đa dạng được thêm vào chương trình số nguyên (IP) trong quá trình giải dưới dạng các mặt phẳng cắt. Phương pháp như vậy có thể xử lý các vấn đề lên đến 100 biến.

Đồ thị và mạng
Đồ thị và mạng

Giải quyết vấn đề

Để giải các bài toán có hàng nghìn biến, cần có một cách tiếp cận khác. Đầu tiên là chọn một đơn đặt hàng và sau đó tìm cấu trúc BN tối ưu đối với đơn đặt hàng đó. Điều này ngụ ý làm việc trong không gian tìm kiếm theo thứ tự có thể, điều này thuận tiện vì nó nhỏ hơn không gian của cấu trúc mạng. Một số đơn đặt hàng sau đó được chọn và đánh giá. Phương pháp này hóa ratốt nhất có sẵn trong tài liệu khi số lượng biến rất lớn.

Một phương pháp khác là tập trung vào một lớp con của các mô hình có thể phân tách mà MLE được đóng. Sau đó, bạn có thể tìm thấy cấu trúc nhất quán cho hàng trăm biến.

Việc nghiên cứu các mạng Bayes với chiều rộng giới hạn là ba dòng là cần thiết để cung cấp suy luận chính xác, có thể giải thích được, vì độ phức tạp trong trường hợp xấu nhất của mạng sau là hàm mũ trong độ dài cây k (theo giả thuyết thời gian hàm mũ). Tuy nhiên, với tư cách là một thuộc tính toàn cục của biểu đồ, nó làm tăng đáng kể mức độ phức tạp của quá trình học tập. Trong bối cảnh này, K-tree có thể được sử dụng để học tập hiệu quả.

Mạng ngắn
Mạng ngắn

Phát triển

Việc phát triển Bayesian Web of Trust thường bắt đầu bằng việc tạo DAG G sao cho X thỏa mãn thuộc tính Markov cục bộ đối với G. Đôi khi đây là DAG nhân quả. Phân phối xác suất có điều kiện của mỗi biến trên cha mẹ của nó trong G. G.

Markov's "nút chăn" là một bộ nút thắt. Markov quilt làm cho nút độc lập với phần còn lại của phần trống của nút có cùng tên và có đủ kiến thức để tính toán phân phối của nó. X là mạng Bayes đối với G nếu mỗi nút độc lập có điều kiện với tất cả các nút khác, dựa trên Markovian của nóchăn.

Đề xuất: