ב-Online
 
 
 
 
 
 
 
 
איך עובד ZIP 

איך עובד ZIP

 
 
בלדד השוחי

בלדד השוחי עם סודן של תוכנות הכיווץ (והטרגדיה שמאחוריהן)

 
 
 
 
 
 
 
 
 
יש המון מצבים בהם אנשים רוצים להעביר קבצים ממחשב אחד למשנהו. הכתבה שאתם קוראים עכשיו אינה אלא קובץ שנמצא על השרתים של נענע, וכשלחצתם על הקישור ביקשתם מהשרתים הללו להעביר את הקובץ למחשב שלכם, כדי שתוכל לקרוא אותו. אבל לפעמים אנשים רוצים להעביר כמה קבצים יחד בחבילה אחת. התקנה של תוכנה חדשה, לדוגמא, דורשת על-פי-רוב כמה וכמה קבצים, אבל לכם הרבה יותר נח להוריד קובץ בודד המכיל את המרובה.
 
בשביל זה יש תוכנות ארכוב (מלשון ארכיון). תוכנת ארכוב מסוגלת לקחת ערימה של קבצים ולהפוך אותם לקובץ אחד גדול, ואחר-כך היא יכולה לקחת את הקובץ האחד הזה ולהפוך אותו בחזרה לערימת קבצים זהה לזו המקורית. עוד דבר שכדאי לעשות באותה הזדמנות זה לכווץ את החבילה במידת-האפשר, ולכן תוכנות ארכוב רבות מספקות גם שירותי דחיסה. הן יכולות לקחת קובץ גדול וליצור קובץ שמכיל את אותו מידע אבל בפחות מקום. גם כאן, כמובן, חשוב שהתוכנה תדע כיצד להחזיר את הקובץ לצורתו המקורית.
 

פיל כץ ז"ל

פיל כץ
 פיל כץ   
פעם, כשמישהו היה רוצה ליצור חבילה כזו הוא היה משתמש בתוכנה שנקראת ארק (ARC). התוכנה הזו קצת איטית, אבל היא היתה התוכנה הראשונה שעשתה את העבודה כמו שצריך על מחשבים-אישיים, ולכן כולם השתמשו בה - היא הפכה לסטנדרט.

אבל אז, באמצע שנות השמונים, קם בחור צעיר בשם פיל כץ (Katz) וכתב גרסא מהירה יותר של אותה תוכנה. הוא קרא לה פי-קיי-ארק (PkArc). החברה שמכרה את ארק התרגזה עליו מאד וגררה אותו לבית-משפט, אז כץ הפסיק להפיץ את התוכנה המשופרת וישב לכתוב תוכנה חדשה לגמרי, טובה אפילו יותר. הוא קרא לה פי-קיי-זיפ (PKZIP), והוא פרסם בפומבי בדיוק איך בנויים קבצי הארכיון הדחוסים שהיא מייצרת - בלי פאטנטים רשומים ובלי נעליים.
 
 
השילוב הזה של תוכנה מהירה ושל קבצים בעלי מבנה ברור, מתועד וחף מזכויות-יוצרים הפכו את פיל לבחור עשיר ואת קבצי ה-zip לסטנדרט החדש.
 
ההצלחה לא היטיבה עם פיל. הוא פיתח בעיית שתיה חמורה, ניתק קשר עם כל מכריו, ובארבע-עשרה באפריל של שנת אלפיים הוא נמצא מת בחדר מלון כשבידיו בקבוק ריק של שנאפס בטעם מנטה. סיבת המוות נקבעה כדימום מהלבלב שנגרם כתוצאה מצריכת אלכוהול מרובה. פיל היה בן 37 במותו, ואנחנו נשארנו לבד עם קבצי ה-zip.
 

הבה נארכב

הפיכה של מספר קבצים לקובץ אחד אינה פעולה מסובכת במיוחד. כל מה שצריך לעשות זה לקרוא את הקבצים בזה אחר זה, לכתוב את המידע לתוך קובץ אחד גדול, ולהוסיף מעין אינדקס או תוכן-עניינים שמציין בדיוק אילו קבצים נמצאים בארכיון ואיפה.

אבל היות שהתוכנה שלנו גם מארכבת וגם דוחסת, אנחנו חייבים להחליט מה לעשות קודם. אם קודם ניצור מכל הקבצים קובץ אחד גדול ורק אחר-כך נדחוס אותו, נאלץ "לפתוח" את כל הדחיסה אפילו אם אנחנו רוצים לחלץ מהארכיון קובץ אחד בלבד. כמו-כן נאלץ "לפתוח" את הדחיסה בכל פעם שנרצה להוסיף לארכיון קובץ חדש או להסיר ממנו קובץ מיותר לצמיתות.

כדי לעקוף את המגבלה הזו ארכיונים מסוג zip קודם-כל דוחסים כל קובץ בנפרד ורק אחר-כך מחברים את כל הקבצים יחד. השיטה הזו עלולה להפוך את הדחיסה לפחות יעילה, אבל בדרך-כלל זה שווה את זה.
 

שיטת ה-וכו' וכו' וכו'

הבעיה שעומדת בפני תוכנת הדחיסה אינה פשוטה כלל וכלל. עליה לקחת קובץ, כלומר פיסת מידע, ולדחוס אותה לתוך מקום קטן יותר בלי לאבד ממנה כלום. היא מסוגלת לעשות את זה בגלל שמידע בנוי מתבניות שחוזרות על עצמן, כמו פזמון בשיר. חשוב על הדרך בה רושמים מלים של שיר: בדרך-כלל מספיק לכתוב את מלות הפזמון רק פעם אחת, ואז בכל-פעם שהוא חוזר על עצמו מספיק לציין "פזמון" וכולם יודעים על מה מדובר.

תוכנת הדחיסה עושה דבר דומה. היא מגלה את ה"פזמונים" שנמצאים בקובץ, את המלים שחוזרות על עצמן בתדירות גבוהה, ואז בכל-פעם שתבנית חוזרת על עצמה אפשר לסמן אותה בקיצור. וככל שיש לך יותר תבניות שחוזרות על עצמן, כך תוכל לצמצם את המקום שהמידע תופס בעזרת דחיסה.
 
האמת? זה נכון לא רק במחשבים. ככל שמשהו נוטה יותר לחזור על עצמו כך קל יותר לסכם אותו בקיצור. אולי משום כך המצע של רוב המפלגות ניתן לסיכום בצורת ססמת-בחירות של משפט אחד.


בלדד השוחי
 
 
 
@@@@@@@@@@@@@@@@@@@ ilan @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
 
@@@@@@@@@@@@@@@@@@@ ilan @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
 
 
תגובות
הוסף תגובה0 תגובות
הוספת תגובה
מאת
 
נושא
 
תוכן
 
 
 
 
תודה! תגובתך התקבלה.
התגובה תתפרסם בכפוף לתנאי האתר.
 
 
 
 
 

כל הזכויות שמורות 2011 © נענע 10 בע"מ
 
 
 
 
כל הזכויות שמורות © Nana10 בע"מ
Video powered by