Türkiye’deki illerin göç göstergelerinin Python kullanılarak K-ortalamalar kümeleme yöntemi ile araştırılması
Date
2021-07-13
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Bursa Uludağ Üniversitesi
Abstract
Göç, ekonomik, siyasal, sosyal vb. nedenlerle bireylerin veya toplumların mevcut yaşadıkları yeri terk edip ikamet amacıyla başka yerlere gitmesi olarak tanımlanabilir. Kümeleme analizi ise hem makine öğrenmesinde hem de veri madenciliğinde yaygın olarak kullanılan bir tekniktir. Kümeleme işleminde esas olan kümelerin kendi içinde benzer, kümeler arası ise benzemez yapıda olacak şekilde ayırma işlemini yapmaktır. Bu çalışmanın temel amacı, Türkiye’deki 81 ilin göç istatistikleri dikkate alınarak illerin Kümeleme Analizi ile kümelenmesinin ortaya konulmasıdır. Bunun için Türkiye’nin iller bazında 2008-2020 yılları arasındaki TÜİK tarafından yayınlanan göç göstergeleri kullanılmıştır. K-ortalamalar algoritması Python yazılım dili kullanılarak uygulanmıştır. Değişkenler olarak; alınan göç, verilen göç, net göç ve net göç hızı verileri temel alınmıştır. Her bir değişken için ayrı ayrı kümeleme işlemi gerçekleştirilmiştir.
Migration, economic, political, social, etc. It can be defined as individuals or societies leaving their current place of residence and moving to other places for the purpose of residence. Cluster analysis is a widely used technique in both machine learning and data mining. The main thing in the clustering process is to separate the clusters in such a way that they have a similar structure within themselves and a dissimilar structure between clusters. The main purpose of this study is to reveal the clustering of provinces with Cluster Analysis, taking into account the migration statistics of 81 provinces in Turkey. For this, migration indicators published by TUIK between the years 2008-2020 on the basis of provinces of Turkey were used. K-means algorithm is implemented using Python programming language. As variables; based on migration received, migration given, net migration and net migration rate data. Clustering was performed separately for each variable.
Migration, economic, political, social, etc. It can be defined as individuals or societies leaving their current place of residence and moving to other places for the purpose of residence. Cluster analysis is a widely used technique in both machine learning and data mining. The main thing in the clustering process is to separate the clusters in such a way that they have a similar structure within themselves and a dissimilar structure between clusters. The main purpose of this study is to reveal the clustering of provinces with Cluster Analysis, taking into account the migration statistics of 81 provinces in Turkey. For this, migration indicators published by TUIK between the years 2008-2020 on the basis of provinces of Turkey were used. K-means algorithm is implemented using Python programming language. As variables; based on migration received, migration given, net migration and net migration rate data. Clustering was performed separately for each variable.
Description
Keywords
Göç göstergeleri, Python, K-ortalamalar, Migration indicators, K-means
Citation
Karakaya, S. (2021). Türkiye’deki illerin göç göstergelerinin Python kullanılarak K-ortalamalar kümeleme yöntemi ile araştırılması. Yayınlanmamış yüksek lisans tezi. Bursa Uludağ Üniversitesi Sosyal Bilimler Enstitüsü.