Sağlık harcamasının tahmininde makine öğrenmesi regresyon yöntemlerinin karşılaştırılması

dc.contributor.authorÇınaroğlu, Songül
dc.date.accessioned2020-09-01T10:34:08Z
dc.date.available2020-09-01T10:34:08Z
dc.date.issued2017-08-19
dc.description.abstractFarklı veri setleri üzerinde yapılan uygulamalar sonucunda modellenmesi zor olan değişkenlerin varlığında klasik regresyon yöntemlerine alternatif olarak makine öğrenmesi regresyon yöntemlerinin kullanımı tavsiye edilmektedir. Sağlık harcaması modellenmesi zor olan bir değişken olup, literatürde makine öğrenmesi regresyon yöntemleri karşılaştırılarak bu değişkenin modellendiği bir çalışmaya rastlanmamıştır. Bu çalışmada kişi başı sağlık harcamasının tahmini amacıyla bir çoklu regresyon modeli oluşturulmuştur. Farklı hiperparametre değerleri belirlendiğinde elde edilen Lasso Regresyon, Rastgele Ağaç Regresyonu ile Destek Vektör Makinesi Regresyon performans sonuçları karşılaştırılmıştır. Çalışmada hiperparametre değeri olarak Lasso Regresyon için lamda (λ) değeri, Rastgele Ağaç Regresyonu için ağaç sayısı, Destek Vektör Regresyonu için epsilon ( ) değeri esas alınmıştır. Sonuçlar 5 ile 50 arasında değişen “k” parça çapraz geçerlilik uygulanarak performe edildiğinde makine öğrenmesi regresyon yöntemlerine ait performans sonuçlarının R 2 , RMSE ve MAE değerleri bakımından istatistiksel olarak anlamlı farklılıklar gösterdiği (p<0.001) tespit edilmiştir. Tahmin performanslarına ait yüzey ve çubuk grafikleri ile istatistiksel test sonuçları incelendiğinde farklı hiperparametre değerlerine göre Rastgele Ağaç Regresyonun (R 2 ˃ 0.7500, RMSE ≤ 0.6000 ve MAE ≤ 0.4000) daha iyi tahmin sonuçlarına sahip olduğu belirlenmiştir. Çalışma sonuçlarının, sağlık harcamasının modellendiği araştırmalar için makine öğrenmesi regresyon yöntemleri kullanıldığında en uygun hiperparametre değerlerinin belirlenmesi konusunda katkı sağlaması beklenmektedir.tr_TR
dc.description.abstractAs a result of experimental studies on different datasets, it is recommended to use machine learning regression methods as an alternative to classical regression methods in the existence of variables which are difficult to model. Health expenditure is an indicator which is difficult to model and there is no study in the literature about modelling health expenditure comparing machine learning regression methods. In this study a multiple regression model was conducted to predict health expenditure per capita. Performance results of Lasso Regression, Random Forest Regression and Support Vector Machine Regression compared when different hyperparameter values were determined. Lambda (λ) value for Lasso Regression, number of trees for Random Forest Regression, epsilon ( ) value for Support Vector Regression was determined as hyperparameter values. Study results performed by using “k” fold cross validation changed from 5 to 50, indicate the difference between machine learning results in terms of R 2 , RMSE and MAE values that are statistically significant (p<0.001). Surface and bar plots and statistical test results of prediction performances show that Random Forest Regression (R 2 ˃ 0.7500, RMSE ≤ 0.6000 ve MAE ≤ 0.4000) has better prediction performance according to different hyperparameter values. It is hoped that study results make contribution to studies about determining optimal hyperparameter values for machine learning regression methods for studies about modelling health expenditures.en_US
dc.identifier.citationÇınaroğlu, S. (2017). "Sağlık harcamasının tahmininde makine öğrenmesi regresyon yöntemlerinin karşılaştırılması". Uludağ Üniversitesi Mühendislik Fakültesi Dergisi, 22(2), 179-200.tr_TR
dc.identifier.endpage200tr_TR
dc.identifier.issn2148-4147
dc.identifier.issue2tr_TR
dc.identifier.startpage179tr_TR
dc.identifier.urihttps://dergipark.org.tr/tr/download/article-file/343260
dc.identifier.urihttp://hdl.handle.net/11452/12468
dc.identifier.volume22tr_TR
dc.language.isotrtr_TR
dc.publisherUludağ Üniversitesitr_TR
dc.relation.journalUludağ Üniversitesi Mühendislik Dergisi / Uludağ University Journal of The Faculty of Engineeringtr_TR
dc.relation.publicationcategoryMakale - Uluslararası Hakemli Dergitr_TR
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectMakine öğrenmesitr_TR
dc.subjectLasso regresyonen_US
dc.subjectRastgele ağaç regresyonutr_TR
dc.subjectDestek vektör regresyonutr_TR
dc.subjectSağlık harcamasıtr_TR
dc.subjectMachine learningen_US
dc.subjectLasso regressionen_US
dc.subjectRandom forest regressionen_US
dc.subjectSupport vector regressionen_US
dc.subjectHealth expenditureen_US
dc.titleSağlık harcamasının tahmininde makine öğrenmesi regresyon yöntemlerinin karşılaştırılmasıtr_TR
dc.title.alternativeComparison of machine learning regression methods to predict health expendituresen_US
dc.typeArticleen_US

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
22_2_16.pdf
Size:
1.6 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: