IMG·ARCH
العقدة 04شجرة الإدراك
SIGNAL

العين جهاز معيبعلم نفس بصري

اللون والرؤية: ما لا تراه العين

كل صيغة خَسورة مبنية على حقيقة واحدة: العين البشرية جهاز معيب ومتحيّز ومحدود — والضغط الذكي يستغلّ عيوبها بالضبط. هذه عقدة "ليش" خالصة: كل الضغط الخَسور يكمن جذره هنا.

صورتان: في الأولى خفضتَ دقّة السطوع للنصف؛ في الثانية أبقيت السطوع وخفضتَ دقّة اللون للربع. أيّهما تبدو أسوأ بوضوح؟ ولماذا؟ (تلميح: حين يخفت الضوء نرى الأشكال وتختفي الألوان.)

وتدرّج رمادي بـ٢٥٦ خطوة متساوية رقمياً — هل تبدو خطواته متساوية الإدراك؟ أم أن العين أحسّ بفروق الظلال الغامقة أكثر؟ وأين تهدر بِتّاتك إذن؟

العيب الأول: نفصل الإضاءة عن اللون

الرؤية ثلاثية (ثلاثة مستقبلات) → اللون = ٣ أرقام = إسقاط مُفقِد أصلاً للطيف. والدماغ لا يعالج R,G,B بتساوٍ: حسّاسيتنا المكانية لـالسطوع عالية جداً، ولـاللون أقلّ بكثير. لذا نحوّل لفضاء يفصلهما:

FIG 1 RGB → YCbCr — عزل ما يمكن التضحية به
RGB — الإضاءة مخلوطة R G B decorrelate YCbCr — معزولة Y — السطوع (نحفظه بدقّة) Cb — لون (نضحّي) Cr — لون (نضحّي) السطوع له الأولوية القصوى (تطوّرياً: تمييز الأشكال في الإضاءة الخافتة أهمّ من تمييز الألوان) التحويل لا يضغط — يهيّئ للخسارة
YCbCr تحويل خطّي (مصفوفة 3×3) لا يغيّر الحجم؛ فائدته أنه يعزل المعلومة المهمّة إدراكياً (Y) عن الأقل أهمية (Cb,Cr) لنوزّع البِتّات بعدالة إدراكية لا رياضية.

Chroma Subsampling: أول خسارة حقيقية

ما دام اللون منخفض الدقّة المكانية إدراكياً، نخزّن عيّنات لون أقل:

FIG 2 4:4:4 مقابل 4:2:0 — نصف بيانات اللون مجّاناً
4:4:4 — لون لكل بِكسل 9 عيّنات لون subsample → 4:2:0 — لون لكل 2×2 عيّنة لون / 4 بِكسلات
في 4:2:0 نخزّن قناة لون واحدة لكل ٢×٢ → وفّرنا نصف بيانات اللون فوراً، والعين بالكاد تلاحظ. (الشعارات الحادّة تُخزّن أحياناً 4:4:4 لتفادي "نزيف" اللون عند الحواف.)
ليش — هذا أبسط شكل لـ sampling

تذكّر وعد العقدة ٠٠: "الضغط الخَسور = أخذ عيّنات وتكميم أذكى". ها هو أخذ العيّنات الذكي، مطبَّق انتقائياً على القناة الأقل أهمية. التكميم الذكي قادم في العقدة ٠٥.

العيب الثاني: الإدراك لوغاريتمي — Gamma

العين لا ترى السطوع خطّياً: حسّاسيتنا للفروق في الظلال الغامقة أعلى بكثير منها في الفاتحة. لو خزّنّا السطوع خطّياً لأهدرنا مستويات على الفاتح وحرمنا الغامق فظهرت أحزمة. الحلّ: gamma encoding V' = V^(1/2.2).

FIG 3 منحنى gamma — توزيع المستويات إدراكياً
القيمة المخزّنة V → الضوء الفعلي → linear منحنى الإدراك خطوات أكثر للغامق (حيث العين حادّة) خطوات أقل للفاتح (حيث العين عمياء)
قيمة البِكسل التي تخزّنها ليست شدّة الضوء الفيزيائية بل قيمة مُرمّزة إدراكياً. ٨ بِت تكفي فقط لأنها موزّعة بذكاء gamma — لو خطّياً لاحتجت ١٢ بِت. هذا الجواب الكامل لسؤال "لماذا ٨ بِت؟" من العقدة ٠٠.

فضاءات أخرى — YCoCg و XYB

الفضاءالميزةيُستعمل في
YCbCrفصل إدراكي كلاسيكي (ليس عكسياً تماماً)JPEG, الخَسور عموماً
YCoCg-Rقابل للعكس تماماً (lossless)، جمع/طرح فقطWebP/JPEG XL اللاخسار
XYBإدراكي مشتقّ من نموذج بصري — يخفي الخطأ أدقّJPEG XL (الأساسي)
الفلسفة الجامعة

الضغط الخَسور الجيّد لا يرمي معلومات عشوائياً — يرمي بالضبط ما يقع في العمى الإدراكي للعين. كل تطوّر في الصيغ الخَسورة هو، جزئياً، نموذج عينٍ أدقّ. الرياضيات تخدم علم الإبصار، لا العكس.

  1. اكتب تحويل RGB→YCbCr والعكس (اكتب المصفوفة بنفسك من BT.601/709). لاحظ خطأ التقريب — من أين جاء؟ اربطه بأن YCbCr ليس عكسياً تماماً.
  2. نفّذ 4:2:0 يدوياً (متوسّط كل 2×2 من Cb,Cr). قارن بصرياً بالأصل. ثم طبّق نفس التخفيض على قناة Y وقارن — الفرق بين التجربتين هو جواب اللغز ١.
  3. طبّق gamma على تدرّج رمادي خطّي واعرض الفرق في نعومة الظلال.
  4. تحدٍّ: نفّذ YCoCg-R وأثبت أنه lossless بِتّياً، بخلاف YCbCr.
الخلاصة

الدماغ يفصل السطوع عن اللون ويعطي السطوع الأولوية → YCbCr + chroma subsampling. الإدراك غير خطّي → gamma. فضاءات أحدث (XYB) تطابق العين أدقّ. الآن عندنا السطوع معزولاً وجاهزاً للخسارة الذكية — لكن كيف نخسر تفاصيله غير المهمّة وحدها؟ يدخل أعظم اختراع: التحويل إلى مجال التردّد.