Abstract

Rút gọn hay lựa chọn thuộc tính (RGTT) trên các hệ thông tin quyết định từ lâu đã được coi là bài toán then chốt và không thể thiếu của các lĩnh vực về khai phá cũng như phân tích dữ liệu. Một số tiếp cận theo hướng lý thuyết tập thô cùng các mở rộng đã mang tới nhiều phương pháp RGTT đạt hiệu quả ấn tượng. Tuy nhiên, cho tới nay, một số phương pháp theo lý thuyết tập mờ trực cảm chưa thực sự được biết tới. Các phương pháp theo tiếp cận này có một điểm mạnh là khả năng nâng cao hiệu năng phân lớp trên các bảng quyết định (DT) có tính nhiễu và không nhất quán. Bài báo này xuất phát từ một độ đo khoảng cách giữa hai phân hoạch mờ trực cảm và từ đó đề xuất một thuật toán RGTT hiệu quả. Cụ thể như sau, đầu tiên, chúng tôi thiết kế một thuật toán RGTT trên DT chưa có sự biến động. Tiếp theo, chúng tôi thiết kế một thuật toán gia tăng để xử lý trên DT trong trường hợp xóa bỏ tập đối tượng. Một số kết quả trong quá trình thử nghiệm đã chứng mình rằng, các phương pháp RGTT được đề xuất của chúng tôi có hiệu năng vượt trội khi so sánh với các phương pháp dựa trên cách tiếp cận tập thô, tập mờ về kích thước tập rút gọn (TRG) và hiệu quả phân lớp.

Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call