Co-occurrence weight selection for word embeddings to enhance test performance

dc.contributor.authorKoç, Aykut
dc.contributor.authorYücesoy, Veysel
dc.date.accessioned2020-08-19T05:21:47Z
dc.date.available2020-08-19T05:21:47Z
dc.date.issued2018-02-07
dc.description.abstractThis study revisits the problem of maximizing the performance of mathematical word representations for a given task. It is aimed to improve performance in analogy and similarity tasks by suggesting innovative weights instead of the counting weights used conventionally in counting-based methods of generating word representations (adding the statistics of word co-occurrences to the account). The language of study was selected as Turkish. The root structures of Turkish words were managed during the compilation of corpus such that each word having a suffix was considered as a new word. The performance of the proposed co-occurrence weights are analyzed with respect to the varying parameter and the results are presented within the paper.
dc.description.abstractBu çalışma, matematiksel kelime temsillerinin belirli bir görev için performanslarının en iyilenmesi problemini yeniden ele almaktadır. Sayma tabanlı (kelimelerin eşdizimlilik istatistiklerini hesaba katan) kelime temsili oluşturma yöntemlerinde klasik olarak kullanılan sayma ağırlıkları yerine yenilikçi ağırlıklar önererek analoji ve benzerlik bulma görevlerinde performans artışı sağlamak hedeflenmektedir. Çalışma dili olarak Türkçe seçilmiş, derlem oluşturulurken Türkçe’ye has ek-kök yapıları ek alan her kelime yeni bir kelime gibi kabul edilecek şekilde yorumlanmıştır. Önerilen eşdizimlilik ağırlıklarının performansı değişen parametreye göre analiz edilerek sonuçlar çalışma içerisinde paylaşılmıştır.
dc.identifier.citationKoç, A. ve Yücesoy, V. (2018). "Co-occurrence weight selection for word embeddings to enhance test performance". Uludağ Üniversitesi Mühendislik Fakültesi Dergisi, 23(1), 31-40.
dc.identifier.endpage40
dc.identifier.issn2148-4147
dc.identifier.issn2148-4155
dc.identifier.issue1
dc.identifier.startpage31
dc.identifier.urihttps://dergipark.org.tr/tr/download/article-file/453912
dc.identifier.urihttp://hdl.handle.net/11452/12310
dc.identifier.volume23
dc.language.isoen
dc.publisherUludağ Üniversitesi
dc.relation.journalUludağ Üniversitesi Mühendislik Dergisi / Uludağ University Journal of The Faculty of Engineering
dc.relation.publicationcategoryMakale - Uluslararası Hakemli Dergi
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectWord embeddings
dc.subjectNatural language processing
dc.subjectStatistical linguistics
dc.subjectKelime temsilleri
dc.subjectDoğal dil işleme
dc.subjectİstatistiksel dilbilimi
dc.titleCo-occurrence weight selection for word embeddings to enhance test performance
dc.title.alternativeKelime temsilleri için test performansını geliştirmeye yönelik eşdizimlilik ağırlıklarının seçimi
dc.typeArticle

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
23_1_3.pdf
Size:
927.59 KB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
Placeholder
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: