Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11851/2295
Title: Metin dosyalarının birleştirilmesinde yakınlık ölçütlerinin kullanılması
Other Titles: A study on adjajency measures for reassembling text files
Authors: Şahin, Alperen
Advisors: Sencar, Hüsrev Tava
Keywords: File reassembly
File fragmentation
Text files
File carving
Dosya birleştirme
Dosya parçalanması
Metin dosyaları
Dosya kurtarma
Publisher: TOBB University of Economics and Technology,Graduate School of Engineering and Science
TOBB ETÜ Fen Bilimleri Enstitüsü
Source: Sahin, A. (2015). Metin dosyalarının birleştirilmesinde yakınlık ölçütlerinin kullanılması. Ankara: TOBB ETÜ Fen Bilimleri Enstitüsü. [Yayınlanmamış yüksek lisans tezi]
Abstract: Parçalanmış dosyaların kurtarılması öncelikli olarak parçalanmış dosyalar arasındaki yakınlığın doğru bir şekilde değerlendirilmesine dayanır. Metin tabanlı dosyalar veriyi oldukça zayıf bir yapıda tuttuğu için parçaların birleştirilmesi işi zorlu bir iştir. Bu çalışmada, metin dosyalarının birleştirilmesinde kullanılan mevcut yakınlık ölçütlerini değerlendirdik. Aldığımız sonuçlara göre mevcut metotların her birinin de tek başına değerlendirildiğinde hedeflenen noktadan uzak olduğu görüldü. Daha sonra PTCR isimli yeni metodu tanıttık. Bu metot metin dosyaları içerisinde gerek dosya tanımı, gerek verilerin sunulması gerekse de verilerin işlenmesinde kullanılan oldukça sınırlı karakteristik yapılardan yakınlık değerleri çıkarmayı hedefleyen bir metottur. Yaklaşımımız, daha verimli yakınlık değerlendirmeleri elde etmek için dosya içerisindeki dosyaya özel olan etiket-kelimelerin sıralamaları üzerine istatiksel bir model kurmaktadır. Sonuçlara göre birleştirme performansı PTCR metodunun da katkısıyla dikkate değer bir iyileşme göstermiştir.
Recovery of fragmented files relies on the ability to accurately evaluate the adjacency of two fragments. Text-based files typically organize data in a very weakly structured manner; therefore, fragment reassembly remains a challenging task. In this work, we evaluate existing adjacency measures that can be used for assembling fragmented test files. Our results show that individual performances of existing measures are far from adequately addressing this need. We then introduce a new approach that attempts to exploit the limited structural characteristics of text files which utilize constructs for description, presentation, and processing of file data. Our approach builds a statistical model of the ordering of file-type specific constructs and incorporates this information into adjacency measures for more reliable fragment reassembly. Results show that reassembly accuracy increases significantly with this approach.
URI: https://hdl.handle.net/20.500.11851/2295
https://tez.yok.gov.tr/UlusalTezMerkezi/tezSorguSonucYeni.jsp
Appears in Collections:Bilgisayar Mühendisliği Yüksek Lisans Tezleri / Computer Engineering Master Theses

Files in This Item:
File Description SizeFormat 
409927.pdf3.09 MBAdobe PDFThumbnail
View/Open
Show full item record



CORE Recommender

Page view(s)

12
checked on Apr 22, 2024

Download(s)

38
checked on Apr 22, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.