KOL שלום!
כיצד עובד קובץ
KOL שלום!
כיצד עובד קובץ MP3? (מה יש בתוכו וכיצד הוא מתורגם למוזיקה...?)
תודה מראש.
המידע נלקח מ: http://physics.technion.ac.il/~computer/pc_files/shonot.html
עקרונות הפעולה הבסיסיים של המכשירים שמשמשים אותנו מדי יום.
1. למרות השם הגרוע שניסו להדביק לו, בעיקר סביב משפט נאפסטר המתוקשר, MP3 הוא בן למשפחה מכובדת ורבת זכויות בעולם האינטרנט והמחשבים. ניסיון לתאר אותו כפרחח שמתעניין בעיקר ברוק כבד וכמי שנתפס כשידיו תחובות עמוק בכיסיהן של חברות התקליטים בהחלט אינו משקף את התמונה הנכונה.
עיון בשושלת היוחסין של MP3מגלה שאביו החוקי אינו אלא MPEG רב המוניטין, פורמט הדחיסה לקובצי וידאו ואודיו דיגיטליים. משפחת MPEG היא משפחה ברוכת ילדים, הכוללת בין השאר את MPEG1שהוא פורמט הדחיסה הבסיסי לווידאו ואודיו דיגיטלי, את MPEG2 שהוא הפורמט שיאפשר לטלוויזיה הדיגיטלית לתקשר במישרין עם יישומי מולטימדיה במחשב, את MPEG 1שכבה 3 המוכר יותר כ- MP3שבו יתמקד הדיון בהמשך, את MP4 המאיים לעשות לתעשיית הקולנוע את מה שעשה MP3 לתעשיית המוסיקה ועוד אחים המתמחים כולם בצדדים כאלה ואחרים של דחיסת קובצי קול, וידאו ומולטימדיה.
2. כדי להבין מה הקנה למשפחת MPEG את מעמדה, יש להתבונן בממדים המפלצתיים של קובצי קול, וידאו ומולטימדיה, או לחלופין בקצב הזחלני של הורדת קבצים כאלה מן הרשת. עוד קודם לכן, כדאי לחזור לרגע אל האופן שבו הם נוצרים, תהליך המוכר בשם דגימה. בתהליך הפיכתה של מוסיקה לקובץ דיגיטלי עובר גל הקול המקורי, הניתן לתיאור כקו אנלוגי עולה ויורד, דרך ממיר אנלוגי-דיגיטלי המודד את גובהו בנקודות שונות ומעניק לכל נקודה ערך מספרי. בשלב ההשמעה חוזר על עצמו התהליך במהופך, והערכים הדיגיטליים מתורגמים לצליל אנלוגי.
3. ככל שמספר הנקודות הנדגמות רב יותר, הדמיון בין המקור להקלטה גדול יותר.
אולם כדי להבין מדוע מודם סטנדרטי, הפועל במקרה הטוב בקצב של 56 אלף ביטים לשנייה, ימצא עצמו חסר אונים מול דיסק אודיו המנוגן בזמן אמת, יש לזכור כי האחרון משחרר מידע בקצב רצחני של 1.4 מגה-בייט לשנייה) בערך פי 25 ממהירות המודם(. מוסיקה באיכות המקובלת בתקליטורים נדגמת בקצב של 44,100 דגימות בשנייה בשני ערוצי סטריאו מקבילים, וכמות המידע האצורה בתקליטור עבור שנייה אחת של מוסיקה מגיעה ל- 176 אלף בייטים (כל בייט מכיל שמונה ביט, שהם הספרות אפס ואחת (כלומר, שיר שאורכו שלוש דקות מכיל כמעט 32 מיליון בייטים. כשמדובר בווידאו, המצב כמובן נעשה גרוע בהרבה, שכן כמות המידע שמכיל כל קטע עולה מאות מונים על קטע מוסיקלי באורך זהה (ובהנחה שלא מדובר בסרט אילם, יש לשמור במקביל לתמונה גם את פס הקול הנלווה אליה).
4. ההכרח להמתין 25 דקות כדי להוריד למחשב דקה בודדת של מוסיקה באיכות סי-די, ויותר משעתיים כדי להוריד דקה אחת של וידאו באיכות גבוהה )בקצב האמיתי של רוב קווי התקשורת מדובר בזמן ארוך בהרבה(, הוא בלתי נסבל עבור רוב משתמשי האינטרנט. כאן בדיוק נכנסות לתמונה תוכנות ה - CODEC)"דחיסה-פריסה "Compression Decompression)ו-MPEG בראשן.
CODEC היא נוסחה שמאפשרת להסיר מן הקובץ מידע שחוזר על עצמו, מידע שהמשתמש לא יבחין בהיעדרו או מידע שניתן להשלימו ממקורות אחרים. הסרת העודפים הללו מאפשרת להעביר את הקובץ שעבר דיאטה אל הצד המקבל במהירות גבוהה יחסית. שם ממתינה לו תוכנת הפריסה, שיכולה להחזיר אותו למצב המאפשר האזנה, צפייה או שימוש אחר בקובץ, לפי העניין. במצבים מסוימים יכולה הדחיסה לשפר את ההעברה, אפילו עד למצב המאפשר להאזין לקובץ או לצפות בו תוך כדי שהוא זורם בקווי התקשורת (Streaming)אם כי ברוב המקרים, כשמדובר בווידאו זורם, תהיה התוצאה בגודל של בול ובאיכות מקרטעת של פנס קסם ישן.
5. את תהליך הפרישה של קובץ MP3יכול לבצע כל מחשב שולחני ממוצע, ונגינתו מתבצעת בקצב של 128 קילו-בייט לשנייה. בגלל שזה לא קצב שמודם רגיל יכול לעמוד בו בזמן אמת, יש לשמור את הקובץ בדיסק הקשיח לפני השמעתו. הורדת הקובץ לדיסק, במהירויות הנזכרות, נעשית ביחס של 4.5:1שמשמעותו כארבע דקות וחצי של הורדה לדקה אחת של האזנה.
בבואו לטפל במוסיקה באיכות תקליטור, יחס הדחיסה שמשיג פורמט MP3 נע בין 1:10ל- 1:14 כלומר נפחו של שיר ממוצע מתכווץ מ-23 מגה-בייט לשלושה מגה-בייט בלבד. מה שמפתיע, זה שהכיווץ הזה מתרחש מבלי לוותר על איכות הצליל של הקובץ המקורי. הטכניקה שמאפשרת זאת קרויה "עיצוב קול תפישתי" (Perceptual Voice Shaping) ומתבססת על מאפייני השמיעה האנושית. הכיווץ מתבצע באמצעות השמטה של מידע בלתי נחוץ ו"דילול" מידע החוזר על עצמו.
6. בשלב השמטת המידע, שבו מושג עיקר החיסכון במשקל הקובץ, מבוצעות כמה פעולות ובראשן "גזירת" כל התדרים הנמצאים בתחום שאינו נקלט על ידי האוזן האנושית (רגישותם של מכשירי ההקלטה המודרניים גורמת לכך שקובצי הקול שהם מפיקים מכילים מידע רב שאינו בתחום השמע האנושי).בנוסף לכך, שיטת הכיווץ מסתמכת על העובדה שצלילים חזקים "מסתירים" צלילים חלשים מהם, ובמקומות שבהם תדר מסוים מושמע בצורה חזקה באופן משמעותי מכל שאר התדרים - היא מותירה בהם "חלון" ריק ממידע. חיסכון משמעותי נוסף מושג כתוצאה מן העובדה שחלק ניכר מהמידע הנשמר עבור שני ערוצי סטריאו הוא זהה, כך שניתן לשמור אותו רק פעם אחת ולפצלו שוב בשלב ההשמעה, תוך הוספת המידע הייחודי לכל ערוץ. את מה שנותר לאחר תהליך ההשמטה מוסיף MP3 ומכווץ, בעזרת אלגוריתם המצמצם אותו לגודלו הסופי.
התשובה ניתנה על ידי מריאנה גרינבלט מצוות מידעני KOL
[9652]     שלח לחבר:

    הדפס:

הוסף תגובה: