Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11851/2279
Title: Sosyal medya profilleri arasında benzerlik tespiti ve gösterimi
Other Titles: Detection and visualization of similarities between social media profiles
Authors: Özyer, Tansel
Erdoğan, Ahmet Enis
Keywords: Social Media Analysis
Natural Language Processing
Word Embeddings
Word2Vec
Word Mover’s Distance
Named Entity Recognition
Topic Modelling
Latent Dirichlet Allocation
Conditional Random Fields
Paragraph2Vec
Sosyal medya Analizi
Doğal Dil İşleme
Kelime Katıştırma
Word2Vec
Word Mover’s Distance
Adlandırılmış Varlık Tespiti
Konu Modelleme
Latent Dirichlet Allocation
Conditional Random Fields
Paragraph2Vec
Issue Date: 2018
Publisher: TOBB University of Economics and Technology,Graduate School of Engineering and Science
TOBB ETÜ Fen Bilimleri Enstitüsü
Source: Erdoğan, A. (2018). Sosyal medya profilleri arasında benzerlik tespiti ve gösterimi. Ankara: TOBB ETÜ Fen Bilimleri Enstitüsü. [Yayınlanmamış yüksek lisans tezi]
Abstract: "Sosyal Medya" kullanıcıların bilgi paylaşımında bulunduğu platformlara verilen genel addır. Sosyal medya kullanımı son senelerde oldukça yaygınlaşmıştır. Kullanıcılar birden fazla Sosyal Medya Platformunda kişisel veya gündemdeki olaylar ile alakalı paylaşımlarda bulunmaktadır. Sosyal medyanın geniş kitleler tarafından kullanılması sosyal medya kullanıcıları hakkında bilgilerin çıkarılması ve kullanıcılar arasındaki benzerliklerin tespit edilmesi arayışını ortaya çıkarmıştır. Sosyal medya platformlarındaki kullanıcıların birbirlerine benzerliği tespit edildiği takdirde kullanıcıların eğilimleri, ilgi alanları, önem verdiği konular belirlenebilir. Ayrıca, reklamların hedef kitleye ulaşmasında da bu benzerlik bilgilerinden faydalanılabilir. Bununla birlikte, farklı amaçlarla gerçek sahibinin kim olduğunun doğrulanmasına ihtiyaç duyulan  hesaplar da bu bilgiler ışığında tespit edilebilir. Bu çalışmada Doğal Dil İşleme(DDİ) teknikleri kullanarak kullanıcıların paylaşımları arasındaki benzerliklerin tespit edilmesi için geliştirdiğimiz teknikler sunulmuştur. Konu Modelleme ve Adlandırılmış Varlık Tespiti teknikleri kullanılarak kullanıcıların yazılı paylaşımlarından nitelik çıkarımı yapılmıştır. Bu nitelikler Word Embedding teknikleri ve Word Mover's Distance tekniği kullanılarak kullanıcılar arasındaki benzerlikler çıkarılmıştır. DDİ tekniklerinin yanında kullanıcıların sosyal medya platformlarını kullandığı saatlerden, kullanıcı bilgilerinden ve kullanıcının arkadaşlarının isimlerinden yola çıkarak kullanıcılar arası benzerlik tespiti için teknikler önerilmiştir. Geliştirilen tekniklerden DDİ teknikleri ile oldukça etkili sonuçlar alınmıştır. Bu teknikler yardımı ile verilen bir kullanıcı kümesindeki toplulukların ve öbeklerin tespit edilebildiği gösterilmiştir. Ayrıca farklı sosyal medya platformlarındaki profiller arasında benzerlik tespiti yapılarak aynı kişiye ait sosyal medya profillerinin tespit edilebildiği gösterilmiştir. Çalışmada geliştirilen metriklerin farklı kullanıcı kümelerinde daha kolay denenmesi amacıyla bir web uygulaması geliştirilmiştir. Bu web uygulaması kullanıcılar arası benzerliklerin detaylı incelenmesini mümkün kılmıştır.
Social Media is a generic name given to the digital platforms where users share information. The use of social media has become very popular in recent years. Users share personal information or their ideas about daily events on different social media platforms. The widespread use of social media has led to an interest to extract information from social media profiles and detect similarities among users. If similarity is detected between users, this information can be used to determine the tendencies, interests of users, the things that he/she cares about. Also such an information would make advertisements reach to their target audience. In addition, this information can be used in cases where there is a need to verify the real owner of a social media account. In this study, we have developed techniques to determine the similarities among the users using Natural Language Processing (NLP) techniques. Additionally attempts have been made to identify similarities between users by users' access hours to the platform and users' friends list. However, more effective results were obtained with NLP techniques. Topic Modeling and Named Entity Recognition techniques were used to extract features from the posts of users. Similarities between users were derived by feeding these features to Word Mover's Distance algorithm. Effective results have been obtained using the techniques developed with NLP techniques. It has been shown that communities and clusters in a user set can be detected with the help of these techniques. It has also been shown that social media profiles belonging to a person can be detected by identifying similarities among profiles in different social media platforms. In addition, a web application is developed to make it easier to experiment with the metrics developed in this work.
URI: https://hdl.handle.net/20.500.11851/2279
https://tez.yok.gov.tr/UlusalTezMerkezi/tezSorguSonucYeni.jsp
Appears in Collections:Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses

Files in This Item:
File Description SizeFormat 
527382.pdf2.82 MBAdobe PDFThumbnail
View/Open
Show full item record

CORE Recommender

Page view(s)

18
checked on Dec 26, 2022

Download(s)

36
checked on Dec 26, 2022

Google ScholarTM

Check


Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.