ארכיונים הם תוכניות שיכולות לדחוס מידע בקבצים. ארכיונים מודרניים מאפשרים לך לשלב מספר קבצים בארכיון אחד ולהציג את תוכן ארכיונים כאלה. גודל הארכיון שנוצר בעזרתם מתגלה כקטן בהרבה מגודל הקובץ המקורי.
הוראות
שלב 1
עקרון הפעולה הכללי של מרבית הארכיונים מבוסס על אלגוריתם שפותח על ידי החוקרים א 'למפל וג'יי זיו בשנות ה -80 של המאה הקודמת. האלגוריתם שיצרו זיו ולמל מאפשר לך לחשב קוד כפול בקובץ וכך להקטין את גודלו. לשם כך, מילון מורכב מרצפי נתונים. לדוגמה, הקוד הבינארי של הקובץ מכיל את השילוב הבא: 10111011101110110011. קל לראות שהקוד 1011 חוזר עליו מספר פעמים. הארכיב מזהה קוד כזה וכותב אותו לארכיון פעם אחת בלבד, וכאשר פותח אותו, הוא שוב מחליף את הקוד במקומות הדרושים בקובץ.
שלב 2
עד כמה הארכיב ידחס את הקובץ תלוי בגודל מילון המקור. אם המילון גדול מדי, הוא ישפיע על גודל הארכיון. אם גודל המילון קטן מדי, עלולות להתרחש שגיאות בארכיון שנוצר. ניתן להגדיל את יחס הדחיסה של קובץ באמצעות קידוד אנטרופיה (מה שנקרא שיטת Huffman). עם קידוד אנטרופיה, נתחים בינאריים חוזרים נכתבים באמצעות קוד קצר. בארכיונים מודרניים, קידוד אנטרופיה משמש כשיטת קידוד נוספת.
שלב 3
במערכות יוניקס, gzip הוא הארכיב הפופולרי ביותר. ארכיב זה דוחס נתונים ללא הפסד ומבוסס על אלגוריתם Deflate. דחיסת הקבצים כאן מתרחשת בשתי גישות - ראשית, פיסות קוד כפולות מוחלפות, ואז הדמויות בהן מוחלפות בתווים חדשים בשיטת הופמן. לארכיונים למערכות יוניקס יש מספר חסרונות. הם מכוונים בעיקר לארכיונים המורכבים מקבצים רבים, כך שקשה לפתוח קובץ בודד. הסיבה לכך היא שארכיוני יוניקס רואים בארכיון מערך רציף של כל הקבצים שנארזו בו. הארכיון נוצר על בסיס המידע הכלול בכל קובץ.
שלב 4
במערכות Windows, ארכיונים כגון WinZip, 7-zip ו- WinRAR נפוצים. שלא כמו מערכות יוניקס, ארכיונים אלה מתמקדים בעבודה הן עם קבצים בודדים והן עם ארכיונים רציפים המורכבים מקבצים רבים. רוב הארכיונים המודרניים של Windows "מבינים" פורמטים רבים של ארכיון, תומכים בהצפנה ומסוגלים לדחוס קבצים גדולים מאוד (למשל, גודל הקובץ המרבי לארכיון WinRAR הוא יותר משמונה מיליארד ג'יגה).