Abstract

Air merupakan sumber daya alam yang penting bagi kehidupan makhluk hidup di bumi, namun air sangat mudah terkontaminasi bakteri dan zat berbahaya. Oleh karena itu, penting untuk memperhatikan kualitas air di bumi. Untuk mengklasifikasikan kualitas air apakah aman atau tidak aman terdapat banyak metode yang dapat digunakan. Untuk memilih metode yang paling cocok, digunakan dengan tiga metode, yaitu K-Nearest Neighbors (KNN), Naïve Bayes, dan Logistic Regression. Dalam penelitian ini, dataset yang digunakan adalah Water Quality dari situs web Kaggle yang berisi 7999 sampel dengan 20 fitur dan 1 kelas target. Tujuan penelitian ini adalah membandingkan metode untuk mendapatkan nilai akurasi tertinggi, hasil akurasi yang diperoleh dari implementasi algoritma pada machine learning. Hasil yang diperoleh dari metode KNN, Naïve Bayes, dan Logistic Regression masing-masing sebesar 89.62%, 78.69%, dan 89.81%. Hasil akurasi tertinggi merupakan Logistic Regression, sehingga metode ini merupakan metode yang paling baik untuk klasifikasi data kualitas air.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.