Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11851/10531
Title: Türkçe sosyal medya mesajlarından kullanıcıların yaş ve cinsiyetini tahmin etme
Authors: Görgün, Mustafa Kaan
Demirok, Gökçe Başak
Kutlu, Mücahid
Abstract: Sosyal medya platformları insanların herhangi bir konu hakkındaki fikirlerine dair çok yüksek miktarda veri sunmaktadır. Bu yüzden, bu tip platformlar market analizi ve toplumsal görüş tahmini gibi birçok çalışma için çok önemli veri kaynaklarıdır. Ancak, sosyal medya kullanıcıları bir toplumu tam anlamıyla yansıtmadığından ötürü sosyal medya verisindeki yanlılığı azaltmak için kullanıcıların yaşı ve cinsiyeti gibi çeşitli bilgileri de göz önünde bulundurarak sayma işlemi gibi ek adımların atılması gerekmektedir. Bu çalışmada verilen bir Türkçe Twitter hesabının paylaştığı mesajları kullanarak hesap sahibinin yaş aralığını ve cinsiyetini tahmin etme problemi konusunu ele aldık. Çalışma kapsamında 1040 Twitter kullanıcısının yaş ve cinsiyet bilgilerinden oluşan etiketli bir veri kümesi hazırlanmıştır. Ardından kelime, karakter, retweet, fastText ve BERT tabanlı beş farklı yöntem geliştirilmiştir. Yaptığımız kapsamlı deneylerden kullanıcıların paylaştıkları mesajların insanların yaş ve cinsiyet bilgisine dair önemli ipuçları sunduğunu göstermektedir.
URI: https://doi.org/10.28948/ngmuh.1191719
https://search.trdizin.gov.tr/yayin/detay/1163673
https://hdl.handle.net/20.500.11851/10531
ISSN: 2564-6605
Appears in Collections:TR Dizin İndeksli Yayınlar / TR Dizin Indexed Publications Collection

Show full item record



CORE Recommender

Page view(s)

22
checked on Apr 22, 2024

Google ScholarTM

Check




Altmetric


Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.