Publication:
Increasing robustness of I-vectors via masking: A case study in synthetic speech detection

dc.contributor.authorAydın, Barış
dc.contributor.authorDişken, Gökay
dc.date.accessioned2024-04-30T07:50:31Z
dc.date.available2024-04-30T07:50:31Z
dc.date.issued2024-03-15
dc.description.abstractEnsuring security in speaker recognition systems is crucial. In the past years, it has been demonstrated that spoofing attacks can fool these systems. In order to deal with this issue, spoof speech detection systems have been developed. While these systems have served with a good performance, their effectiveness tends to degrade under noise. Traditional speech enhancement methods are not efficient for improving performance, they even make it worse. In this research paper, performance of the noise mask obtained via a convolutional neural network structure for reducing the noise effects was investigated. The mask is used to suppress noisy regions of spectrograms in order to extract robust i-vectors. The proposed system is tested on the ASVspoof 2015 database with three different noise types and accomplished superior performance compared to the traditional systems. However, there is a loss of performance in noise types that are not encountered during training phase.en_US
dc.description.abstractKonuşmacı tanıma sistemleri için güvenlik hayati önem taşımaktadır. Geçtiğimiz yıllarda, sahte konuşma saldırılarının bu sistemleri kandırabildiği ortaya konmuştur. Bu durumu önlemek amacı ile sahte konuşma tespit sistemleri geliştirilmiştir. Bu tür sistemler bazı durumlarda oldukça yüksek performans sergilese de, gürültü altında performansları kötüleşmektedir. Geleneksel konuşma iyileştirme yöntemleri performansı artırmak bir yana, daha da kötüleştirmektedir. Bu çalışmada, konvolüsyonel sinir ağı yapısı kullanılarak elde edilen maskenin gürültü etkisini azaltmaktaki performansı incelenmiştir. Maske, spektrogramın gürültülü bölgelerini bastırmakta ve bu spektrogramdan elde edilen i-vectorleri gürbüz hale getirmekte kullanılmıştır. ASVspoof 2015 veri tabanı ve üç farklı gürültü tipi ile gerçekleştirilen testlerde önerilen sistemin geleneksel sistemlerden daha üstün olduğu gösterilmiştir. Ancak eğitim aşamasında karşılaşılmayan gürültü tiplerinde performans kaybı olmaktadırtr_TR
dc.description.sponsorshipBu çalışma TÜBİTAK (Proje No: 121E057) tarafından desteklenmiştir.tr_TR
dc.identifier.citationAydın, B. ve Dişken, G. (2024). ''Increasing robustness of I-vectors via masking: A case study in synthetic speech detection''. Uludağ Üniversitesi Mendislik Fakültesi Dergisi, 29(1), 191-204.en_US
dc.identifier.doihttps://doi.org/10.17482/uumfd.1311113en_US
dc.identifier.endpage204
dc.identifier.issue1
dc.identifier.startpage191
dc.identifier.urihttps://dergipark.org.tr/tr/download/article-file/3194791en_US
dc.identifier.urihttps://dergipark.org.tr/tr/pub/uumfd/issue/83653/1311113en_US
dc.identifier.urihttps://hdl.handle.net/11452/41311en_US
dc.identifier.volume29
dc.language.isoen
dc.publisherBursa Uludağ Üniversitesitr_TR
dc.relation.journalUludağ Üniversitesi Mühendislik Fakültesi Dergisitr_TR
dc.relation.publicationcategoryMakale - Uluslararası Hakemli Dergitr_TR
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectDeep learningen_US
dc.subjectConvolutional neural networken_US
dc.subjectSpoof detectionen_US
dc.subjectSpeaker recognitionen_US
dc.subjectRobust featuresen_US
dc.subjectDerin öğrenmetr_TR
dc.subjectEvrişimli sinir ağlarıtr_TR
dc.subjectSahte konuşma tanımatr_TR
dc.subjectKonuşmacı tanımatr_TR
dc.subjectGürbüz özniteliklertr_TR
dc.titleIncreasing robustness of I-vectors via masking: A case study in synthetic speech detectionen_US
dc.title.alternativeI-vectorlerin maskeleme yoluyla dayanıklılığının arttırılması: Sentetik konuşma tespitinde bir vaka çalışmasıtr_TR
dc.typeArticleen_US
dspace.entity.typePublicationen_US

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
29_1_13.pdf
Size:
885.43 KB
Format:
Adobe Portable Document Format