Evaluating the Feasibility of Inline FS Deduplication without Main Memory Caches

  • Type:Study Thesis
  • Date:09.11.2012
  • Supervisor:

    Prof. Dr. Frank Bellosa, Konrad Miller

  • Graduand:Christian Burkert
  • Links:PDF
  • Abstract (in German):

    In den letzten Jahren wurde die Vermeidung von Datenduplikaten als spezielle Form der Kompression immer wichtiger. Besonders im Bereich großer gewerblicher Anlagen zur Datensicherung und -archivierung soll Deduplikation den Einsatz von Festplattensystemen attraktiver machen und die etablierten Magnetbandspeicher ablösen. In diesen System werden typischerweise große Tabellen im Hauptspeicher vorgehalten um eine schnelle Erkennung von Duplikaten zu gewährleisten. Entsprechend hoch sind die Ressourcenanforderungen.

    Die vorliegende Studienarbeit untersucht, ob durch den Einsatz von Solid-State-Drives (SSD) auf Tabellen und Caches im Hauptspeicher verzichtet werden kann. Dazu wurde das Dateisystem ext4fs um eine cachelose Dedupliaktionsfunktion erweitert und getestet. Die Tests ergaben zeitliche Mehrkosten von 7 bis 55 Prozent verglichen zum unveränderten Dateisystem. Basierend auf diesen Ergebnisen scheint in Verzicht auf Caches in Umfeld von optimierten, gewerblichen Speichersystemen auch bei einer zukünftigen Verfügbarkeit von günstigen SSDs nicht sinnvoll. Dagegen könnte im privaten Einsatz der Verzicht vorteilhaft sein, da hier verschiedene Dienste auf einer Hardware integriert sind und durch die Hauptspeichereinsparung andere Dienste profitieren könnten.

    BibTex:
     
    @studythesis{burkert12fsdeduplication,
     author = {Christian Burkert},
     title = {Evaluating the Feasibility of Inline FS Deduplication without Main Memory Caches},
     type = {Study Thesis},
     address = {System Architecture Group, Karlsruhe Institute of Technology (KIT), Germany},
     month = nov # "09",
     year = 2012,
     url = {http://os.ibds.kit.edu/}
     }