Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11851/2282
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorÖzbayoğlu, Ahmet Murat-
dc.contributor.authorSarı, Mustafa-
dc.date.accessioned2019-12-25T10:08:01Z-
dc.date.available2019-12-25T10:08:01Z-
dc.date.issued2018
dc.identifier.citationSarı, M. (2018). Derin öğrenme yöntemleri kullanılarak Türkçe doküman sınıflandırma. Ankara: TOBB ETÜ Fen Bilimleri Enstitüsü. [Yayınlanmamış yüksek lisans tezi]en_US
dc.identifier.urihttps://hdl.handle.net/20.500.11851/2282-
dc.identifier.urihttps://tez.yok.gov.tr/UlusalTezMerkezi/tezSorguSonucYeni.jsp-
dc.description.abstractÇalışmamızda kaleme alınmış yazıların, yazarına ve konusuna göre birbirinden ayrılması ve sınıflandırılabilmesi amaçlanmıştır. Bir gazetenin köşe yazarlarının yazılarının vektörleri oluşturulmuştur ve birbirinden ne kadar ayrılabildiğinin analizi yapılmıştır. Yazarı bilinmeyen herhangi bir yazının hangi yazara ait olduğu belirlenebilir veya birbirlerine benzer stiller gruplanarak yazar profilleri oluşturulabilir. Konusu bilinmeyen bir yazının hangi konulara ait olabileceği belirlenebilir. DeepLearning4J Java kütüphanesi ve burada yer alan Doc2Vec sınıfı kullanılmıştır. 5,10,15 ve 20 yazar içeren modeller ve yazarların yazdıkları konulara göre modeller geliştirilmiştir. Bu şekilde elde edilen benzerlik vektörleri belirli bir eşik değeri ile karşılaştırılmıştır, değişik eşik değerleri seçimine bağlı model başarımları ölçülmüştür. Elde edilen sonuçlara göre bazı yazarlar belirgin bir şekilde diğer yazarlardan ayrılmaktadır. Yazılar konularına göre başarılı bir şekilde etiketlenebilmektedir. Bu yapı özellikle yazar profili çıkarımı, yazı tespiti veya konu gruplama gibi alanlarda kullanılabilecek niteliktedir.tr_TR
dc.description.abstractIn our study, it is aimed to distinguish and classify author profiles and text subjects with vectors which were created from authors posts. The vectors of the columnists of a newspaper were formed and analyzed for how much they could be separated from each other. Hence, author of any post, can be determined by this model. It also can group similar styles together. The DeepLearning4J Java library and the Doc2Vec class included are used during development. 5,10,15, 20 author vector models and their subject models were created according to their posts. The similarity vectors obtained in this way were compared with a certain threshold value, and the model performances based on the selection of different threshold values were measured. According to the results, some authors differed significantly from other authors. Articles can be successfully labeled according to their topics. This structure can be used especially in areas such as author profile extraction, article detection or subject grouping.en_US
dc.language.isotren_US
dc.publisherTOBB University of Economics and Technology,Graduate School of Engineering and Scienceen_US
dc.publisherTOBB ETÜ Fen Bilimleri Enstitüsütr_TR
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectPV-DBOWen_US
dc.subjectPV-DMen_US
dc.subjectDL4Jen_US
dc.subjectParagraph vectorsen_US
dc.subjectword2Vecen_US
dc.subjectdoc2Vecen_US
dc.subjectText miningen_US
dc.subjectPV-DBOWtr_TR
dc.subjectPV-DMtr_TR
dc.subjectDL4Jtr_TR
dc.subjectParagraf vektörleritr_TR
dc.subjectword2Vectr_TR
dc.subjectdoc2Vectr_TR
dc.subjectMetin madenciliğitr_TR
dc.titleDerin öğrenme yöntemleri kullanılarak Türkçe doküman sınıflandırmaen_US
dc.title.alternativeClassification Turkish documents using deep learning techniquesen_US
dc.typeMaster Thesisen_US
dc.departmentInstitutes, Graduate School of Engineering and Science, Computer Engineering Graduate Programsen_US
dc.departmentEnstitüler, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalıtr_TR
dc.relation.publicationcategoryTezen_US
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.grantfulltextopen-
item.fulltextWith Fulltext-
item.openairetypeMaster Thesis-
item.cerifentitytypePublications-
item.languageiso639-1tr-
Appears in Collections:Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses
Files in This Item:
File Description SizeFormat 
542590.pdf3.13 MBAdobe PDFThumbnail
View/Open
Show simple item record



CORE Recommender

Page view(s)

234
checked on Mar 25, 2024

Download(s)

148
checked on Mar 25, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.