Derin öğrenme ile beklenti tabanlı duygu analizi
Date
2023
Authors
Turan, Melek
Journal Title
Journal ISSN
Volume Title
Publisher
Bursa Uludağ Üniversitesi
Abstract
Bu çalışmada, Türkçe metinlerdeki, belirli öğeler veya unsurları baz alarak, duygusal ifadelerin otomatik tahminlenmesine dayanmaktadır. Bu tekniğin, marka yönetimi, müşteri hizmetleri, reklamcılık ve diğer birçok alanda önemli bir rol oynaması hedeflenmektedir. Türkçe için yapılan beklenti tabanlı duygu analizi çalışmaları henüz sınırlıdır. Bu durum, Türkçe metinlerdeki duygusal ifadeleri tespit etmek için kullanılan yöntemlerle, Türkçe dilinin özelliklerini dikkate alarak etkili sonuçlar üretmeyi önemli kılmaktadır. Çalışmada, belirteç sınıflandırma ve duygu sınıflandırma olmak üzere iki ayrı yöntem kullanılmıştır. Belirteç sınıflandırma yöntemi için, Türkçe için önceden eğitilmiş BERT, ConvBERT, ELECTRA, DeBERTa, DistilBERT olmak üzere 5 farklı modelin karşılaştırmalı analizi gerçekleştirilmiştir. Belirteç sınıflandırma yöntemi ile metinlerdeki ayırıcı unsurların tespit edilmesi, bu unsurların temsil ettiği kategorilerin belirlenmesi sağlanmıştır. Duygu sınıflandırma için önceden eğitilmiş sıralı sınıflandırma modellerinden BERT, ConvBERT, ELECTRA, DistilBERT olmak üzere 4 farklı model kullanılmıştır. Pozitif, negatif ve nötr sınıflarından oluşan restoran (Pontiki vd., 2016) verileri ile eğitim gerçekleştirilmiştir. İki yöntem bir arada kullanarak tasarlanan arayüzde, girdi olarak verilen metin için ilk olarak, belirteç sınıflandırma ile belirteçler seçilmekte, seçilen belirteçler ait olduğu kategoriye göre sınıflandırılmakta, son olarak kategoriye ait duygu sınıfı sıralı sınıflandırma modelleri aracığı ile sunulmaktadır. Eğitimler sonucunda, modeller F1-skor, kesinlik, duyarlılık, doğruluk metriklerine göre değerlendirilmiştir.
This study is based on the automatic prediction of emotional expressions in Turkish texts, focusing on specific elements or aspects. This technique is expected to play an important role in branding, customer service, advertising and various other fields. There is a limited amount of research into Aspect Based Sentiment Analyzing (ABSA) in Turkish. This highlights the importance of the development of effective methods that take into account the characteristics of the Turkish language for the detection of emotional expressions in Turkish texts. This study used two methods, token classification and sentiment analysis.The token classification was carried out by using five different models: BERT, ConvBERT, ELECTRA, DeBERTa, and DistilBERT, which were pre-trained for Turkish. The aim of this method is the identification of differentiating elements in the texts and the determination of the categories they represent.. For sentiment analysis, four pre-trained sequential classification models—BERT, ConvBERT, ELECTRA, and DistilBERT—were used. The models were trained using restaurant data (Pontiki et al., 2016) consisting of positive, negative, and neutral classes. In the interface designed by combining these two methods, the input text was first analyzed using aspect-based sentiment classification to select relevant aspects. These aspects were then classified based on their corresponding categories, and the sentiment class specific to each category was determined using sequential classification models. The models were evaluated based on metrics such as F1-score, precision, recall, and accuracy.
This study is based on the automatic prediction of emotional expressions in Turkish texts, focusing on specific elements or aspects. This technique is expected to play an important role in branding, customer service, advertising and various other fields. There is a limited amount of research into Aspect Based Sentiment Analyzing (ABSA) in Turkish. This highlights the importance of the development of effective methods that take into account the characteristics of the Turkish language for the detection of emotional expressions in Turkish texts. This study used two methods, token classification and sentiment analysis.The token classification was carried out by using five different models: BERT, ConvBERT, ELECTRA, DeBERTa, and DistilBERT, which were pre-trained for Turkish. The aim of this method is the identification of differentiating elements in the texts and the determination of the categories they represent.. For sentiment analysis, four pre-trained sequential classification models—BERT, ConvBERT, ELECTRA, and DistilBERT—were used. The models were trained using restaurant data (Pontiki et al., 2016) consisting of positive, negative, and neutral classes. In the interface designed by combining these two methods, the input text was first analyzed using aspect-based sentiment classification to select relevant aspects. These aspects were then classified based on their corresponding categories, and the sentiment class specific to each category was determined using sequential classification models. The models were evaluated based on metrics such as F1-score, precision, recall, and accuracy.
Description
Keywords
Beklenti tabanlı duygu analizi, BERT, ConvBERT, ELECTRA, DeBERTa, DistilBERT, Sıralı sınıflandırma, Belirteç sınıflandırma, Aspect based sentiment analysis, Sequantial classification, Token classification
Citation
Turan, M. (2023). Derin öğrenme ile beklenti tabanlı duygu analizi. Yayınlanmamış yüksek lisans tezi. Bursa Uludağ Üniversitesi Fen Bilimleri Enstitüsü.