Şifreli ağ trafiğinin içerik açısından sınıflandırılması

dc.contributor.advisorCicioğlu, Murtaza
dc.contributor.advisorToğay, Cengiz
dc.contributor.authorBozkır, Ramazan
dc.contributor.departmentFen Bilimleri Enstitüsü
dc.contributor.departmentBilgisayar Mühendisliği Ana Bilim Dalı
dc.contributor.orcid0000-0002-0032-4270tr_TR
dc.date.accessioned2022-10-07T05:48:07Z
dc.date.available2022-10-07T05:48:07Z
dc.date.issued2022-06-24
dc.description.abstractGünümüzde internet kullanımının yaygınlaşması mevcut bilgisayar ağları altyapısının verimli ve güvenli bir şekilde yönetilmesini gerektirmektedir. Ayrıca, her geçen gün internet uygulamalarının kullanımındaki artış ile büyük veri hacmini oluşturan ağ trafikleri de ortaya çıkmaktadır. Büyük verilerin işlenebilmesi için performans odaklı yöntemlerin kullanılması gerekmektedir. Ağ trafiği verilerinin, ağ yönetimi ve ağ güvenliği gibi birçok çalışma alanındaki uygulamalar için sınıflandırma ihtiyacı bulunmaktadır. Ağ trafiğinin şifreli olması ve VPN kullanımı gibi uygulamalar ağ trafiği sınıflandırma sürecini zorlaştırmaktadır. Bu tez çalışmasında şifreli ağ trafiğinin sınıflandırılması için gerçek-zamanlı sistemlere kolay ve hızlı uygulanabilir performans-odaklı yeni bir platform geliştirilmiştir. Sınıflandırma sürecinde makine öğrenmesi tekniklerinden yararlanılmıştır. Deney tabanlı makine öğrenmesi tekniklerinin etkili bir şekilde uygulanabilmesi için süreç yönetim gerçekleştirilmiştir. Platformun tasarlanmasında güncel ve performanslı olan veri işleme için Apache Spark, öznitelik çıkarımı için NFStream ve süreç yönetimi için MLflow yazılım teknolojileri kullanılmıştır. Ayrıca, bu çalışma literatüre “pattern byte” isimli yeni bir öznitelik kazandırmıştır. Önerilen platform ile gerçekleştirilen deney kapsamında uygulama ve uygulama türlerine göre ağ trafiği makine öğrenmesi algoritmaları ile sınıflandırılmaktadır. Makine öğrenmesi algoritmalarından GBTree, LightGBM ve XGBoost algoritmalarının kullanılması sonucunda performans sonuçları değerlendirildi. Performans sonuçlarının değerlendirilmesi doğruluk, duyarlılık, kesinlik ve F1 skorları ile incelenmektedir. İncelenen sonuçlarda uygulama sınıflandırmasında GBTree, LightGBM, XGBoost algoritmaları sırasıyla yaklaşık %98, %89 ve %99 F1 skorlarına ulaşmaktadır. Uygulama türlerine göre sınıflandırmada ise tüm algoritmalar %99 F1 skoruna ulaşmaktadır. Sonuç olarak, algoritmalar arasında XGBoost algoritması her iki sınıflandırma probleminde %99’un üzerinde F1 skoru ile en iyi sonuca ulaştığı görülmüştür.tr_TR
dc.description.abstractToday, the widespread use of the Internet requires efficient and secure management of the existing computer network infrastructure. Network traffic as big data emerges as a result of increasing internet applications day by day. Therefore, performance-oriented methods should be used to process big data. Network traffic data needs to be classified for applications in many workspaces, such as network management and security. Network traffic encryption and applications such as VPN increases the complexity of network traffic classification process. In this thesis, a new performance-oriented platform has been developed for the classification of encrypted network traffic, which can be easily and quickly applied to real-time systems. Machine learning techniques were used in the classification process. Process management was carried out in order to apply experiment-based machine learning techniques effectively. Apache Spark for data processing, NFStream for feature extraction, and MLflow software technologies for process management were used in the design of the platform. In addition, this study has brought a new feature called “pattern byte” to the literature. Within the scope of the experiment carried out with the proposed platform, network traffic is classified by machine learning algorithms according to the application and application types. Performance results were evaluated as a result of using GBTree, LightGBM, and XGBoost algorithms from machine learning algorithms. Evaluation of performance results is examined by accuracy, recall, precision, and F1 scores. In the results examined, GBTree, LightGBM, and XGBoost algorithms achieve F1 scores of approximately 98%, 89%, and 99% in application classification. In classification according to application types, all algorithms reach 99% F1 scores. As a result, among the algorithms, it was seen that the XGBoost algorithm achieved the best result with an F1 score of over 99% in both classification problems.en_US
dc.format.extentVII, 54 sayfatr_TR
dc.identifier.citationBozkır, R. (2022). Şifreli ağ trafiğinin içerik açısından sınıflandırılması. Yayınlanmamış yüksek lisans tezi. Bursa Uludağ Üniversitesi Fen Bilimleri Enstitüsü.tr_TR
dc.identifier.urihttp://hdl.handle.net/11452/29010
dc.language.isotrtr_TR
dc.publisherBursa Uludağ Üniversitesitr_TR
dc.relation.publicationcategoryTeztr_TR
dc.relation.tubitak2210 Yurt İçi Yüksek Lisans Burs Programıtr_TR
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectAğ trafiği sınıflandırmatr_TR
dc.subjectAğ trafiğitr_TR
dc.subjectMakine öğrenmesitr_TR
dc.subjectTopluluk yöntemleritr_TR
dc.subjectNetwork traffic classificationen_US
dc.subjectNetwork trafficen_US
dc.subjectMachine learningen_US
dc.subjectEnsemble methodsen_US
dc.titleŞifreli ağ trafiğinin içerik açısından sınıflandırılmasıtr_TR
dc.title.alternativeContent classification of encrypted network trafficen_US
dc.typemasterThesisen_US
local.contributor.departmentFen Bilimleri Enstitüsü/Bilgisayar Mühendisliği Ana Bilim Dalıtr_TR

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Ramazan_Bozkır.pdf
Size:
3.24 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: