Abstract

Partial least squares (PLS) regression and least absolute shrinkage and selection operator (LASSO) are the regression analysis techniques used to overcome the problems that can not be solved by ordinary least squares (OLS). The purpose of this research is to model and compare the performance of both PLS regression and LASSO to the diabetes mellitus study data which is divided into 30 groups of data redundancy as an example of microarray data. The survival time of diabetes mellitus patients as dependent variable while age, sex, body mass index, blood pressure, and six blood serum measurements as independent variables. By using paired sample t-test of adj R2 value, the result of this research concluded that the mean of adj R2 value of PLS regression is smaller than the mean of adj R2 value of LASSO. In other words, the performance of LASSO is better than PLS regression.

Highlights

  • overcome the problems that can not be solved by ordinary least squares

  • study data which is divided into 30 groups of data redundancy

  • six blood serum measurements as independent variables

Read more

Summary

PENDAHULUAN

Analisis regresi merupakan suatu alat yang digunakan dalam statistika untuk memprediksi salah satu variabel maupun variabel lainnya dengan memanfaatkan hubungan antar variabel tersebut (Neter et al, 1997). Terdapat sepuluh asumsi berdasarkan kerangka model regresi linear klasik, salah satunya adalah jumlah pengamatan dalam suatu penelitian lebih besar dari jumlah parameter yang akan diestimasi (Gujarati dan Porter, 2009). Regresi PLS adalah suatu teknik yang dikembangkan oleh Herman Wold pada tahun 1960an untuk membangun model yang bersifat prediksi saat variabel penjelas banyak dan sangat kolinear. (2012) pada data microarray diperoleh simpulan bahwa nilai root mean square error prediction (RMSEP) dari LASSO lebih kecil dibandingkan dengan regresi PLS. Sedangkan penelitian yang dilakukan oleh Chong dan Jun (2005) saat terdapat multikolinearitas diperoleh simpulan bahwa regresi PLS memiliki kinerja yang lebih baik jika dibandingkan dengan LASSO. Penelitian ini bertujuan untuk mengetahui model persamaan regresi PLS dan LASSO serta membandingkan kinerja kedua teknik tersebut menggunakan data penelitian diabetes melitus yang terbagi menjadi 30 kelompok pengulangan data dengan delapan pengamatan di setiap kelompok pengulangan

METODE PENELITIAN
Mencari nilai menggunakan persamaan dan nilai adj R2 menggunakan persamaan
HASIL DAN PEMBAHASAN
KESIMPULAN DAN SARAN
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call