Please use this identifier to cite or link to this item:
https://hdl.handle.net/20.500.11851/10531
Title: | Türkçe sosyal medya mesajlarından kullanıcıların yaş ve cinsiyetini tahmin etme | Authors: | Görgün, Mustafa Kaan Demirok, Gökçe Başak Kutlu, Mücahid |
Abstract: | Sosyal medya platformları insanların herhangi bir konu hakkındaki fikirlerine dair çok yüksek miktarda veri sunmaktadır. Bu yüzden, bu tip platformlar market analizi ve toplumsal görüş tahmini gibi birçok çalışma için çok önemli veri kaynaklarıdır. Ancak, sosyal medya kullanıcıları bir toplumu tam anlamıyla yansıtmadığından ötürü sosyal medya verisindeki yanlılığı azaltmak için kullanıcıların yaşı ve cinsiyeti gibi çeşitli bilgileri de göz önünde bulundurarak sayma işlemi gibi ek adımların atılması gerekmektedir. Bu çalışmada verilen bir Türkçe Twitter hesabının paylaştığı mesajları kullanarak hesap sahibinin yaş aralığını ve cinsiyetini tahmin etme problemi konusunu ele aldık. Çalışma kapsamında 1040 Twitter kullanıcısının yaş ve cinsiyet bilgilerinden oluşan etiketli bir veri kümesi hazırlanmıştır. Ardından kelime, karakter, retweet, fastText ve BERT tabanlı beş farklı yöntem geliştirilmiştir. Yaptığımız kapsamlı deneylerden kullanıcıların paylaştıkları mesajların insanların yaş ve cinsiyet bilgisine dair önemli ipuçları sunduğunu göstermektedir. | URI: | https://doi.org/10.28948/ngmuh.1191719 https://search.trdizin.gov.tr/yayin/detay/1163673 https://hdl.handle.net/20.500.11851/10531 |
ISSN: | 2564-6605 |
Appears in Collections: | TR Dizin İndeksli Yayınlar / TR Dizin Indexed Publications Collection |
Show full item record
CORE Recommender
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.