لجان مقاومة النهود : مليشيا الدعم السريع استباحت المدينة وارتكبت جرائم قتل بدم بارد بحق مواطنين    كم تبلغ ثروة لامين جمال؟    شاهد بالصورة والفيديو.. حسناء الشاشة نورهان نجيب تحتفل بزفافها على أنغام الفنان عثمان بشة وتدخل في وصلة رقص مؤثرة مع والدها    حين يُجيد العازف التطبيل... ينكسر اللحن    شاهد بالفيديو.. في مشهد نال إعجاب الجمهور والمتابعون.. شباب سعوديون يقفون لحظة رفع العلم السوداني بإحدى الفعاليات    أبوعركي البخيت الفَنان الذي يَحتفظ بشبابه في (حنجرته)    جامعة ابن سينا تصدم الطلاب.. جامعات السوق الأسود والسمسرة    من رئاسة المحلية.. الناطق الرسمي باسم قوات الدعم السريع يعلن تحرير النهود (فيديو)    شاهد بالصور والفيديو.. بوصلة رقص مثيرة.. الفنانة هدى عربي تشعل حفل غنائي بالدوحة    تتسلل إلى الكبد.. "الملاريا الحبشية" ترعب السودانيين    بحضور عقار.. رئيس مجلس السيادة يعتمد نتيجة امتحانات الشهادة السودانية للدفعة المؤجلة للعام 2023م    إعلان نتيجة الشهادة السودانية الدفعة المؤجلة 2023 بنسبة نجاح عامة 69%    والد لامين يامال: لم تشاهدوا 10% من قدراته    احتجز معتقلين في حاويات.. تقرير أممي يدين "انتهاكات مروعة" للجيش السوداني    هجوم المليشيا علي النهود هدفه نهب وسرقة خيرات هذه المنطقة الغنية    عبد العاطي يؤكد على دعم مصر الكامل لأمن واستقرار ووحدة السودان وسلامة أراضيه    منتخب الشباب يختتم تحضيراته وبعثته تغادر فجرا الى عسلاية    اشراقة بطلاً لكاس السوبر بالقضارف    المريخ يواصل تحضيراته للقاء انتر نواكشوط    الحسم يتأجل.. 6 أهداف ترسم قمة مجنونة بين برشلونة وإنتر    استئناف العمل بمحطة مياه سوبا وتحسين إمدادات المياه في الخرطوم    هيئة مياه الخرطوم تعلن عن خطوة مهمة    هل أصبح أنشيلوتي قريباً من الهلال السعودي؟    جديد الإيجارات في مصر.. خبراء يكشفون مصير المستأجرين    باكستان تعلن إسقاط مسيَّرة هنديَّة خلال ليلة خامسة من المناوشات    ترامب: بوتين تخلى عن حلمه ويريد السلام    إيقاف مدافع ريال مدريد روديغر 6 مباريات    تجدد شكاوى المواطنين من سحب مبالغ مالية من تطبيق (بنكك)    ما حكم الدعاء بعد القراءة وقبل الركوع في الصلاة؟    عركي وفرفور وطه سليمان.. فنانون سودانيون أمام محكمة السوشيال ميديا    تعاون بين الجزيرة والفاو لإصلاح القطاع الزراعي وإعادة الإعمار    قُلْ: ليتني شمعةٌ في الظلامْ؟!    الكشف عن بشريات بشأن التيار الكهربائي للولاية للشمالية    ترامب: يجب السماح للسفن الأمريكية بالمرور مجاناً عبر قناتي السويس وبنما    كهرباء السودان توضح بشأن قطوعات التيار في ولايتين    تبادل جديد لإطلاق النار بين الهند وباكستان    علي طريقة محمد رمضان طه سليمان يثير الجدل في اغنيته الجديده "سوداني كياني"    دراسة: البروتين النباتي سر الحياة الطويلة    خبير الزلازل الهولندي يعلّق على زلزال تركيا    في حضرة الجراح: إستعادة التوازن الممكن    التحقيقات تكشف تفاصيل صادمة في قضية الإعلامية سارة خليفة    الجيش يشن غارات جوية على «بارا» وسقوط عشرات الضحايا    وزير المالية يرأس وفد السودان المشارك في إجتماعات الربيع بواشنطن    حملة لمكافحة الجريمة وإزالة الظواهر السالبة في مدينة بورتسودان    ارتفاع التضخم في السودان    شندي تحتاج لعمل كبير… بطلوا ثرثرة فوق النيل!!!!!    انتشار مرض "الغدة الدرقية" في دارفور يثير المخاوف    مستشفى الكدرو بالخرطوم بحري يستعد لاستقبال المرضى قريبًا    "مثلث الموت".. عادة يومية بريئة قد تنتهي بك في المستشفى    وفاة اللاعب أرون بوبيندزا في حادثة مأساوية    5 وفيات و19 مصابا في حريق "برج النهدة" بالشارقة    عضو وفد الحكومة السودانية يكشف ل "المحقق" ما دار في الكواليس: بيان محكمة العدل الدولية لم يصدر    ضبط عربة بوكس مستوبيشي بالحاج يوسف وعدد 3 مركبات ZY مسروقة وتوقف متهمين    الدفاع المدني ولاية الجزيرة يسيطر علي حريق باحدي المخازن الملحقة بنادي الاتحاد والمباني المجاورة    حسين خوجلي يكتب: نتنياهو وترامب يفعلان هذا اتعرفون لماذا؟    من حكمته تعالي أن جعل اختلاف ألسنتهم وألوانهم آيةً من آياته الباهرة    بعد سؤال الفنان حمزة العليلي .. الإفتاء: المسافر من السعودية إلى مصر غدا لا يجب عليه الصيام    بيان مجمع الفقه الإسلامي حول القدر الواجب إخراجه في زكاة الفطر    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



الانفجار المعلوماتي.. كيف تدير الكميات الهائلة من البيانات؟
نشر في الراكوبة يوم 01 - 11 - 2011

إن كنت تعتقد أن نظم تخزين المعلومات في مراكز البيانات الخاصة بك هي خارج نطاق السيطرة، فتصور أنك تمتلك 449 مليار مادة أو بند في قاعدة معلوماتك، أو أن تضيف 40 تيرابايت (تيرابايت تساوي 1012 بايت أي ألف غيغابايت) من البيانات الجديدة عليها كل أسبوع. وتشمل التحديات التي تواجه إدارة الكميات الهائلة من البيانات على مهمات تخزين ملفات كبيرة، وفتح أرشيفات طويلة الأمد، وطبعا إمكانية الوصول إلى هذه البيانات.
وعلى الرغم من أن إدارة البيانات كانت دائما المهمة الرئيسية لشركات تقنيات المعلومات، فإن الفورة الجنونية الحالية قد أخذت نشاط السوق إلى مستويات جديدة تماما، وفقا إلى ريتشارد وينتر المحلل في «وينتركورب كونسلتنغ سيرفيزيز» المؤسسة التي تدرس اتجاهات الأحجام الكبيرة من البيانات.
وتظهر المنتجات الجديدة بشكل منتظم من الشركات الراسخة القدم والناشئة على حد سواء، التي تعمل في مختلف المجالات. لذلك «فنحن نملك منتجات تقوم بتحريك البيانات ونقلها، ونسخها، وتحليلها بشكل فوري وسريع»، كما يقول وينتر، لذا فإن العمل جار على قدم وساق لمواجهة ومعالجة الأحجام الكبيرة من المعلومات التي تفرزها الشبكات الاجتماعية. ونظم الاستشعار، والدوائر الطبية وأجهزتها، وغيرها من مصادر المعلومات الجديدة التي تتوسع باستمرار.
* مكتبة الكونغرس
* وتطلب الأمر بالنسبة إلى «أمازون دوت كوم»، و«نيالسين»، و«مازدا»، ومكتبة الكونغرس، اعتماد أساليب جديدة ومبتكرة لمعالجة مليارات المعلومات والوسائط المخزنة، وتبويبها وتصنيفها، بغية استرجاعها والتنقيب عنها بسرعة، مع استئصال النواقص والأخطاء.
وتقوم مكتبة الكونغرس الأميركي بمعالجة 2.5 بيتابايت (بيتابايت تساوي 1015 بايت، أي ألف تيرابايت) من المعلومات والبيانات سنويا، التي تصل إلى كميات أسبوعية هائلة تصل إلى 400 تيرابايت. ويقدر توماس يوكيل رئيس مجموعة هندسة نظم المشاريع في المكتبة المذكورة أن عبء حمل هذه البيانات سيتضاعف أربع مرات في الأعوام القليلة المقبلة مع استمرارها في قيامها بعملها المزدوج، ألا وهو تقديم المعلومات للمؤرخين، وبالتالي حفظها في جميع أشكالها.
وتقوم المكتبة بتخزين المعلومات في 15 إلى 18 ألف قرص موصولة إلى 600 خادم موجودة في مركزين للبيانات. ويجري تخزين نحو 90 في المائة من البيانات، أو أكثر من 3 بيتابايت في شبكة منطقة خاصة بالحفظ والتخزين «سان SAN» موصولة جميعها بالألياف البصرية، في حين يجري تخزين الباقي في أقراص تخزين موصولة بالشبكة.
ويقول غريك شولتز المحلل في «ستوريج آي أو» للاستشارات في حديث نقلته مجلة «كومبيوتر وورلد»، أن مكتبة الكونغرس تمثل نموذجا لعمليات الحفظ والتخزين. وهي فريدة بحجم ما تستطيع تخزينه، خاصة على صعيد تصنيفها إلى مخزونات صوتية وسمعية قديمة، وتسجيلات، وفيديوهات، وصور، وملفات، فضلا عن أصناف الوسائط المتعددة جميعها.
وتستخدم المكتبة نظامين منفصلين كأفضل إجراء لحفظ البيانات، الأول عبارة عن مكتبة أشرطة كبيرة الحجم تتضمن ستة آلاف فتحة تشغيل للشرائط، وتستخدم نظام «آي بي إم جنرال باراليل فايل سيستم» GPFS. ويستخدم نظام الملفات هذا مبدءا شبيها بعلامات تعريف الصور الذي تعتمده «فليكر دوت كوم»، بحيث يجري ترميز الخوارزميات التي من شأنها جعل البيانات سهلة على المعالجة والاسترجاع بسرعة.
وثمة أرشيف إضافي يحتوي على نحو 9500 فتحة تشغيل للشرائط يتألف من مكتبات شرائط «أوراكل/ صن» التي تستخدم نظام «صن كويك فايل سيستم» QFS، بالإضافة إلى مكتبات شرائط «أوركل إس إل 8550». والنظام الثاني هو إرسال كل أرشيف إلى عملية حفظ طويلة الأمد يمكن استعادتها فورا للتحقق من صحة البيانات قبل تخزينها ثانية.
وتتضمن المكتبة اليوم نحو 500 مليون مادة في قاعدة المعلومات الواحدة، لكن يوكيل يتوقع تنامي هذا الرقم إلى خمسة مليارات بند. وللاستعداد لهذه الزيادة، شرع فريق يوكيل بإعادة التفكير في نظم جديدة للملفات يمكنها من التعامل مع العديد من المواد. وتقول جيني روث محللة الحفظ والتخزين في «غارتنر»، إن عملية زيادة التخزين بشكل صحيح أمر مهم. فعندما يرتفع تخزين البيانات عن حجم 10 بيتابايت، فإن الوقت المطلوب، والكلفة الإضافية لدعم هذه الملفات والتعامل معها، يرتفعان إلى العنان أيضا. وأحد المساعي لتذليل المشكلة هو الإبقاء على البنية الأساسية في مكان رئيسي للقيام بالتعامل مع غالبية عملية الاستيعاب هذه، مع الإبقاء على مرفق ثانوي طويل الأمد للتخزين الأرشيفي.
* تجربة «أمازون»
* وكانت «أمازون دوت كوم» عملاقة التجارة الإلكترونية التي غامرت في الدخول إلى الخدمات السحابية قد أصبحت بسرعة من كبريات الشركات الحافظة والمخزنة للبيانات في العالم إلى تربو على 450 مليار مادة مخزنة في السحاب لأغراضها الخاصة، ولأغراض زبائنها أيضا. ويعني هذا حسب أيسا هنري، نائبة رئيس الخدمات التخزينية في «أمازون ويب سيرفيسيز»، وجود 1500 مادة أو بند لكل شخص في الولايات المتحدة، باستثناء البنود الأخرى للأشخاص خارجها. وبعض بنود المحتويات هذه الموجودة في قاعدة البيانات ضخمة جدا يصل إلى 5 تيرابايت للواحد منها، ويمكنه أن يشكل قاعدة بيانات بحد ذاته. وتتوقع هنري أن تبلغ أحجام بنود المحتويات هذه 500 تيرابايت للواحد منها، بحلول عام 2016.
وأضافت أن السر يكمن في التعامل مع البيانات الكبيرة هذه في تجزئتها إلى قطع في عملية تدعى الموازاة. فبالنسبة إلى خدمة التخزين السحابي العام «إس3» تستخدم «أمازون» رمزها الخاص لتجزئة الملفات إلى أقسام، سعة كل منها 1000 ميغابايت. وهذا إجراء شائع، لكن الذي يجعل مسعى «أمازون» هذا فريدا من نوعه، هو أن عملية تجزئة الملفات وفصلها تتم في الزمن الحقيقي.
وتشكل الملفات الفاسدة تحديا آخر يتوجب على مديري التخزين مواجهتها لدى التعامل مع الكميات الكبيرة من البيانات. وغالبية الشركات لا تقلقها ملفات فاسدة بين الحين والآخر. ولكن عندما تكون مالكا ل449 مليار بند، فإنه حتى القليل من هذه الملفات يشكل تحديا كبيرا على صعيد التخزين.
وتؤكد هنري أن متطلبات تخزين البيانات في «أمازون» مقرر لها أن تنمو بشكل كبير مع قيام زبائنها بحفظ المزيد من بياناتهم في نظم «إس3» الخاصة بها. ومثال على ذلك قيام بعضهم بتخزين بيانات كبيرة الحجم عن التسلسل الوراثي في جينوم (الأطلس الوراثي) لبعض الحيوانات في خدماتها السحابية. ومع تنامي عمليات التخزين هذه، باتت «أمازون مستعدة لإضافة نقاط وعقد تخزينية جديدة بسرعة، لمواجهة المتطلبات المستجدة وفقا لهنري.
* تجربة «مازدا»
* وتدير شركة «مازدا موتور كورب» للسيارات بموظفيها ال800 في الولايات المتحدة نحو 90 تيرابايت من المعلومات المخزنة. ويقول باري بليكلي مهندس البنية الأساسية لعمليات الشركة في أميركا الشمالية إن الموظفين، ونحو 900 عميل، ينتجون كميات متزايدة من الملفات، والمواد التسويقية، وقواعد البيانات، وغيرها.
وقد قامت الشركة بالتخزين الافتراضي لكل الأشياء، ومن بينها البيانات المخزنة، وهي تستخدم عددا وأدوات لهذا الغرض من «كومبيلانت»، التي باتت الآن جزءا من «ديل»، و«ديل باور فولت NX3100» كنظام «سان» خاص بها، بالإضافة إلى نظم «في إم واير» لاستضافة الخوادم الافتراضية. ويجري ترحيل البيانات القديمة بسرعة إلى الأشرطة، لأن 80 في المائة من بيانات «مازدا» المخزنة تصبح قديمة خلال شهور، مما يعني أن أحجاما ضخمة من البيانات لا يجري الدخول إليها بتاتا، وفقا إلى بلايكلي، أحد موظفي «مازدا» في قسم تقنيات المعلومات.
ولاستيعاب مثل أنماط الاستخدام هذه، يجري التخزين الافتراضي بتركيب طبقي، أي بمستويات متعددة، بحيث تقوم أقراص سريعة بالحالة الصلبة، متصلة بقنوات من الألياف الضوئية (فايبر شانيل) بالتحول إلى المستوى، أو الطبقة الأولى بحيث تتولج 20 في المائة من احتياجات ومتطلبات الشركة من البيانات. وتجري أرشفة بقية البيانات في الأقراص البطيئة التي تعمل بسرعة 15 ألف دورة في الدقيقة على نظام «فايبر شانيل»، التي تشكل الطبقة الثانية. أما الطبقة الثالثة التي تعمل أقراصها بسرعة 7200 دورة بالدقيقة فمتصلة تسلسليا بنظام SCSI المستخدم لأغراض البث السريع للبيانات.
ويقول بلايكلي إن «مازدا» شرعت في وضع القليل من البيانات على الأشرطة، أي نحو 17 تيرابايت حاليا، في نطاق سعيها المستمر في عملية التخزين الافتراضي.
وتقوم شركة «نيالسن» المتخصصة بالمعايير والتصنيف التي تساعد في تقرير مدى طول البث الحي على الأثير بالنسبة إلى البرامج التلفزيونية، بتحليل عدد المشاهدين في نحو 20 ألف منزل، وتعقب البرامج الوطنية في نحو 24 ألف منزل، بحيث يجري وضع المعايير والتصنيفات حول عدد المشاهدين، مع تحليل عوامل الجودة، ووضعها في خدمة الزبائن خلال 24 ساعة بعد بث هذه البرامج.
وفي هذا الصدد يقول سكوت براون نائب رئيس الشركة، إن المعلومات يجري جمعها في مرفق مركزي للتحليل في ولاية فلوريدا، بحيث يتم تخزين نحو 20 تيرابايت في هذه الولاية، وفي ولاية أخرى هي أوهايو. وتستخدم الشركة لهذه الغاية نظم «سان» الفائقة السرعة، والتخزين الملحق بالشبكات.


انقر هنا لقراءة الخبر من مصدره.