كيف نتعامل مع التراكم الهائل للمعلومات على الإنترنت؟

جمعة, 2016-06-24 13:30

ينطوي تجميع هذا الكم الهائل من المعلومات عن الاقتصاد والسلوك البشري على الإنترنت، على جانب سلبي مخالف للبديهة يكمن في تغاضينا عن الدروس المستقاة من الماضي.

ربما سمعت عن الإحصائية التي تفيد بأن 90 في المئة من بيانات العالم لم تُجمع إلا في السنوات القليلة الأخيرة. وهذا صحيح، إذ تعود أقدم معلومة تمكنت من العثور عليها تتعلق بمثل هذه الإحصائيات إلى مايو/ أيار 2013.

فعلى مدار العقود الثلاثة الأخيرة تقريبًا، تزداد البيانات في العالم كل عامين بنحو 10 أضعاف، وهذا المعدل يضع قانون "مور" الذي ينص على تضاعف قوة المعالج الإلكتروني كل عامين، على المحك.

ومن بين المشاكل التي يطرحها معدل زيادة المعلومات بهذا الشكل أن اللحظة الآنية ستطغى دومًا على الماضي حتى لو كان قريبًا.

تخيل أنك تتأمل مجلدًا للصور يضم الصور التي التقطت لك في السنين الأولى من عمرك، منذ الميلاد وحتى بلوغك 18 سنة.

لنفترض أن لديك صورتين للسنتين الأوليين من عمرك، فقياسًا على معدل زيادة المعلومات في العالم، سيكون لديك ألفان صورة للفترة ما بين سن السادسة وحتى الثامنة، ثم 200 ألف صورة للفترة ما بين سن 10 سنوات إلى 12 سنة، وتزيد بعد ذلك الصور زيادة مذهلة في الفترة ما بين سن 16 إلى 18 سنة لتصبح 200 مليون صورة.

وهذا يعني أن في السنتين الأخيرتين تُلتقط أكثر من ثلاث صور كل ثانية.

بالطبع، هذا القياس ليس قياسًا مثاليًا بالبيانات العالمية. في البداية، تُعزى زيادة البيانات في العالم، إلى حد كبير، إلى زيادة مصادر المعلومات التي أضافها عدد أكبر من الناس، فضلًا عن أن الصيغ التي تُختزن بها المعلومات أصبحت أكبر وأكثر تفصيلًا.

إلا أن ما ذكرناه عن التناسب يظل قائمًا، فإذا تأملت سجلًا ما مثل مجلد الصور الذي ذكرناه آنفًا، أو حاولت أن تحلله، فستجد أن المعلومات الأقدم تنذوي لتصبح بلا معنى، ولم لا؟ إذا كانت المعلومات المتاحة في الماضي أقل بكثير من التي أدخلت فيما بعد.

وتلك هي مشكلة تزايد البيانات الضخمة (الحجم الهائل من البيانات الناتجة عن أنشطة الناس عبر الإنترنت والتي يصعب معالجتها باستخدام تطبيقات معالجة البيانات التقليدية) التي يجري حاليًا تجميعها وتحليلها.

فحين تنظر إلى الماضي بحثًا عما له من أثر على المستقبل، ستجد الكثير من المعلومات الحديثة والقليل من المعلومات الأقدم. وقد نجم عن ذلك عدم التبصر بالعواقب في المستقبل، بسبب النزوع إلى المبالغة في تقييم الاتجاهات قصيرة المدى على حساب البيانات المسجلة في الماضي.

ولكي تدرك ما لذلك من أهمية، تأمل نتائج الأبحاث التي أجريت في مجال علم الاجتماع بصدد "التحيز للتجارب الأحدث"، التي ترصد النزعة إلى افتراض أن الأحداث التي ستقع مستقبلًا ستكون مشابهة للتجربة الحالية.

وتعد هذه النزعة أحد أشكال الاستدلال بالمعلومات المتاحة، أي النزوع إلى الاستناد عند التفكير، على نحو غير متكافئ، إلى ما يتبادر بسهولة إلى الذهن.

بالإضافة إلى أنها سمة سيكلوجية عامة، فإذا لاحظت أن أشهر الصيف، في المكان الذي تعيش فيه، أصبحت أكثر برودة، على نحو استثنائي، في السنوات الأخيرة القليلة، فربما تميل حينذاك إلى أن تقول إن أشهر الصيف أصبحت أكثر برودة بشكل عام، أو ربما تقول إن الطقس المحلي، حيث تعيش، يشهد انخفاضًا في درجات الحرارة.

وفي الواقع، ينبغي ألا تستنبط أي شيء من البيانات عند قرائتها، لأنك إن أردت أن تعرف أي شيء مفيد بشأن اتجاهات الطقس، فعليك أن تدرس الأمر باستفاضة أكثر من ذلك بكثير مع التركيز على العوامل طويلة المدى. أما عن البيانات قصيرة المدى، فمن الأفضل ألا تُعمل الفكر فيها على الإطلاق، ولكن من منّا يستطيع ذلك؟

وهذا ينطبق أيضًا على الظواهر الأكثر تعقيدًا في الواقع، ومن بينها، أسواق الأسهم والاقتصاد ونجاح الشركات أو إخفاقها، والحرب والسلام، وإقامة العلاقات، وحتى ازدهار الامبراطوريات وسقوطها. فإن تحليل البيانات قصيرة المدى ليس غير صحيح فحسب، ولكنّه أيضًا مؤذٍ ومُضلل.

وتأمل فقط جموع الاقتصاديين الذين اصطفوا للإعلان عن أحداث قبل وقوعها، مثل الأزمة المالية التي وقعت في سنة 2009، والتي لم يكن يخطر على بال أحد أنها حقيقة حتى حدثت بالفعل. إلا أن فكرة وجود تنبؤات صحيحة، في حد ذاتها، على ذلك النطاق الواسع تمثل جزءًا من المشكلة.

والجدير بالذكر، أن عنصر الحداثة يميل إلى أن يكون أحد العوامل الأساسية التي تؤخذ في الاعتبار عند اختيار البيانات التي ستُلغي والبيانات التي سيُحتفظ بها.

فالاتجاه الرقمي في العالم ينص على إلغاء القديم مع سائر البيانات القديمة والإبقاء على الجديد مع سائر البيانات الجديدة، وفي هذا الاتجاه تتسم خوارزميات البحث في جوهرها بالتحيز إلى كل ما هو جديد، وفيه أيضًا انتشرت الروابط غير الفعالة (الروابط التي لم تعد متاحة) لتصيب كل المجالات بدءًا من قرارات المحاكم العليا إلى خدمات مواقع التواصل الاجتماعي بأكملها.

وقد ترسخ هذا التحيز نحو الحاضر في بنية كل ما يحيط بنا من وسائل تكنولوجية، وهذا يرجع إلى العادة التي درجنا عليها التي تتمثل في الاستغناء عن أفضل الآلات التي كانت جديدة يومًا ما بعد نحو خمس سنوات من استخدامها.

ماذا نفعل إذن؟ ليس من المهم أن نحفظ البيانات القديمة بصورة أفضل فحسب، على الرغم من أن هذه الفكرة ليست سيئة، مع الأخذ في الاعتبار مدى قلة البيانات، في الوقت الحالي، التي يمكنها الاستمرار لعقود وليس سنوات.

بل إن الأهم من ذلك، تحديد البيانات التي تستحق الحفظ في الذاكرة في المقام الأول، وماذا يعني فرز البيانات للحفاظ على المعلومات ذات الأهمية منها، وحذف البيانات الأخرى، تحت مسمى المعرفة.

نحن نحتاج إلى ما أُفضل أن أطلق عليه "النسيان الذكي"، وأعني بذلك أن ندرب أدواتنا لتصبح أكثر كفاءة في ترك البيانات التي أُدخلت في الماضي القريب حتى يتسنى متابعة ما سيترتب عليها من تسلسل أكبر من البيانات.

وهذا يعني أن الأدوات تقوم باختيار البيانات وعرضها وحفظها ونقلها إلى المحفوظات، مثلما تنُظم الصور في مجلد الصور، وإن كان اختيار البيانات وعرضها ينطوي على الكثير من المعادلات الرياضية.

ولكن متى تكون قيمة مليوني صورة أقل من قيمة ألفي صورة؟ حينما تغطي العينة الأكبر حجمًا نطاقًا أقل، وحين تكون الأسئلة التي تُطرح بشأنها أقل أهمية، وحين تزرع التفاصيل التي توفرها الثقة الزائفة بدلًا من أن تغرس الشك المفيد.

ويوجد الكثير من مجموعات البيانات التي يصعب اختزالها، والتي عندما تكتمل، تصبح الأثمن بين سائر المجموعات، ومنها بيانات تسلسل الحمض النووي، والبيانات الديموغرافية (ذات الصلة بإحصاءات السكان)، والمعلومات الجغرافية والفيزيائية غير المعالجة والتي لا تقبل الشك.

وكلما زادت مرونة المعلومات في علم ما، زاد احتمال تناسب المقياس المستخدم مع الجودة تناسبًا عكسيًا، والأهم من ذلك، يصبح عامل الوقت نفسه بمثابة مرشِح للبيانات.

فإن لم نختر بعناية المعلومات التي يمكنها أن تحافظ على الماضي البعيد وتبرزه وتنقل ما فيه من معانٍ، سيمحو الحاضر بضجيجه المتزايد أثار الماضي بهدوء.

ويؤثر الوقت في مناح عدة، فيظل الوقت عاملًا مقيّدًا في جانب حاسم أخر، وهو مدى توفر الوقت للبشر وقدرتهم على الانتباه.

فتحتفظ اليوم الشركات والأفراد والحكومات، على حدٍ سواء، بعشرات أضعاف المعلومات التي كانت تحتفظ بها منذ بضع سنوات. ولكن لم يعد لدى أعضاء مجلس الإدارة ولا المديرون التنفيذيون ولا الرؤساء المنتخبون القدرة على الانتباه لفترات طويلة ولم تعد ساعات اليوم كافية.

وازدادت كفاءة الأدوات المتاحة في الوقت الحالي لتساعد صانعي القرار في طرح أسئلة مفيدة بصدد ما في حوزتهم من معلومات، ولكن لن تستطيع أن تحلل إلا البيانات التي لم يمحوها الوقت بعد.

إن تجميع المعلومات فحسب ليس هو الحل. ففي العصر الذي تضخمت فيه المعلومات بصورة هائلة، لا تقل المعلومات التي تفضل ألا تعرفها أهمية عما تفعله في الوقت الحالي

نقلا عن ا ل بي بي سي

اقرأ أيضا