free
hit counter
تقنيات تحليل البيانات

جمع البيانات تصنيفها و ترميزها

جمع البيانات تصنيفها و ترميزها – مقدمة

تلعب البيانات الاحصائية دورا هاما في حياتنا المعاصرة، فهي المادة الخام التي تعتمد عليها جميع البحوث    و الدراسات، و وسيلة هامة للتعبير الكمي و النوعي عن الظواهر و المشاكل المطروحة، و الركيزة الأساسية التي تبنى عليها الحلول المقترحة و تستند عليها القرارات و الاجراءات المتخذة. و قبل التطرق الى طرق جمع البيانات و تصنيفها و ترميزها؛ فلابد من التعرف على معنى البيانات و أنواعها، لأن ذلك سيجعل من هذه العمليات أكثر بساطة و سلاسة.

البيانات  Data

بشكل عام البيانات هي مجموعة من الحروف أو الكلمات أو الأرقام أو الرموز أو الصور (الخام) المتعلقة بموضوع معين. مثال على ذلك: بيانات الطالب (الأسماء – الأرقام المستوى – الشعبة – التخصص) ، وينتج عن هذه البيانات بعد المعالجة ما يطلق عليه مصطلح معلومات. و البيانات تنقسيم إلى مجموعتين هما:

البيانات النوعية Qualitative Data، البيانات الكمية Quantitative Data

البيانات النوعية Qualitative Data تقيس صفة ما لظاهرة معينة دون أن تأخذ قيما عددية، وتنقسم إلى نوعين هما :

  • البيانات الإسمية Nominal Data: هي بينات تعتمد علي التصنيف النوعي للوحدات على اساس خاصية او مجموعة من الخصائص التي تميز الوحدة عن الوحدات الأخرى ، كما ان هذه الوحدات لا يمكن المفاضلة. مثل الجنس يتكون من طبقتين ذكور و الإناث.
  • البيانات الترتيبية Ordinal Data: تعتمد علي التصنيف والترتيب معا، لذلك يلعب الترتيب دورا أساسيا في تحديد معالم الخاصية. مثل المستوى التعليمي( ابتدائي ، إعدادي، ثانوي، جامعي فأكثر)

البيانات الرقمية أو الكمية Quantitative Data: تأخذ قيما عددية صحيحة أو كسرية حسب ظروف الحالة المدروسة. تنقسم أيضا إلى نوعين هما:

  • البيانات الفترية Interval Data:يتميز هذا النوع من البيانات بتساوي المسافات بين الرتب، ويستخدم هذا النوع من البيانات كثيرا في العلوم التربوية والنفسية والاجتماعية مثل قياس الذكاء وغيرها ، والجدير بالذكر أنه في هذا النوع من البيانات الصفر غير حقيقي، أي ان الصفر في هذا النوع لا يعني عدم وجود الخاصية فدرجة طالب تساوي صفر مثلا لا يعني أنه لا يعرف شيء في المقرر.
  • البيانات النسبية Rational Data : و تعني خاصية النسبية أن للصفر خاصية العدم أي خاصية انعدام الظاهرة مثل سرعة سيارة تساوي صفر تعني أن السيارة متوقفة.

أولا : مصادر البيانات و طرق جمعها

  1. مصادر جمع البيانات:

يحتاج الباحث في دراسته الى بيانات تجمع من مصادر معينة، و هذه المصادر تنقسم الى نوعين اساسيين:

أ. المصادر الأولية (المباشرة): و يطلق عليها أيضا المصادر الميدانية، و هي تلك المصادر التي لها علاقة مباشرة بموضوع الدراسة، و يتم فيها جمع بيانات مجتمع الدراسة بطريقة مباشرة عن طريق الباحث أو من ينوب عنه.

ب. المصادر الثانوية (الغير مباشرة): و يطلق عليها أيضا المصادر التاريخية، وهي المصادر التي تحتوي على معلومات منقولة عن المصادر الأولية بشكل مباشر أو غير مباشر. و يلجأ الباحث الى هذه المصادر في حال وجد صعوبة في الحصول على البيانات من مصادرها الأولية، و في هذه الحالة يعتمد الباحث في حصوله على المعلومات المطلوبة للدراسة على بيانات لم يسهم في تجهيزها و تبويبها و تصنيفها، بل يكتفي بنقلها من مصادر ثانوية منشورة مثل السجلات و الدوريات و الكتب و التقارير الحكومية و الغير حكومية، و كذلك رسائل الماجستير و اطروحات الدكتوراه و غيرها من المصادر الموثوقة و المعلومة المصدر.

و تعد البيانات المأخوذة من المصادر الثانوية أقل دقة من البيانات في المصادر الأولية وذلك للأسباب عديدة منها:

  • احتمالات الخطأ في نقل الأرقام
  • احتمالات الإضافة إلى البيانات الأصلية ومن ثم الوقوع في خطأ تفسير البيانات.
  • احتمالات التحريف في البيانات مما يؤدي إلى تشويه المعنى.
  1. طرق جمع البيانات:

عند القيام بدراسة ما فإن الأمر يتطلب جمع بيانات عن عناصر المجتمع قيد الدراسة، و هذه العملية ترتبط بالدرجة الأولى بالمصادر التي يعتمد الباحث عليها في الحصول على البيانات ، ففي حالة اعتماده على المصادر الثانوية فإن عملية جمع البيانات تعتمد على تحديد هذه المصادر و مراجعتها و التدقيق فيها و من ثم يقوم الباحث بتلخيص و ترتيب و تبويب هذه البيانات، اما في حالة اعتماده على المصادر الأولية فنميز نقطتين أساسيتين و هما: الاولى الطريقة التي سينتهجها في جمع البيانات، و الثانية فهي الأدوات التي يجمع بها البيانات.

أ. طريقة جمع البيانات:  ويتم جمع البيانات الإحصائية من الميدان باستخدام إحدى الطريقتين:

  • طريقة الحصر (المسح) الشامل: يتم من خلالها تجميع البيانات من جميع عناصر مجتمع الدراسة، وتعتبر هذه الطريقة من أفضل طرق جمع البيانات لأنها تعطي بيانات كاملة حول موضوع الدراسة، و يعاب عليها ارتفاع التكاليف ماديا و بشريا و زمنيا في حالة اتساع مجتمع الدراسة.
  • طريقة المعاينة: تستخدم هذه الطريقة في حال تعذر إجراء الدراسة بأسلوب المسح الشامل، و في هذه الطريقة يمكن الاكتفاء ببيانات عن جزء من المجتمع، اذ يتم اختيار عينة من عناصر المجتمع، و يشترط فيها التمثيل الجيد له.

ب. ادوات جمع البيانات: بعد أن يختار الباحث طريقة جمع البيانات من المصدر المباشر، يمكنه ان يختار أحد الأسلوبين التاليين:

  • الاسلوب الميداني المباشر: و يتطلب هذا الأسلوب الاتصال المباشر للباحث أو من ينوب عنه بعناصر المجتمع أو أفراد العينة، و من الأدوات التي يستخدمها هذا الأسلوب ( الاستبيان، المقابلة، الملاحظة…).
  • اسلوب المراسلة غير المباشر: يتطلب هذا الأسلوب ارسال الاستمارة لمصدر البيانات بالبريد أو الهاتف أو الفاكس أو الانترنت….

و على العموم فإنه يمكن الجمع بين أكثر من طريقة تبعا لطبيعة الدراسة و أهدافها.

الاستبيانات توزيع مباشر الاستبيانات باستخدام البريد الاستبيانات طريقة الهاتف الاستبيانات الالكترونية المقابلة
السرعة بطيئة بطيئة بطيئة سريعة سريعة
التكلفة مرتفعة مرتفعة مرتفعة منخفضة مرتفعة
الحجم العينات الكبيرة العينات الكبيرة العينات الكبيرة العينات الكبيرة العينات الصغيرة
+ نسبة استرجاع الاستمارات عالية و في نفس وقت التوزيع الحصول على معلومات دقيقة ، لأن الاجابة تكون في وقت عدم انشغال المفحوص لا تحتاج الى عملية التفريغ، حيث تتم عملية إضافة أي بيانات إلى قاعدة البيانات اليا الحصول على توضيحات مباشرة من المفحوص لأجوبته، مما يضمن الحصول على بيانات أدق و أصح.
عملية التوزيع و التفريغ متعبة.

صعوبة توفر الوقت المناسب دائما

عملية التوزيع و التفريغ متعبة.

الشخص قد لا يعبئ الاستبيان

بنفسه (التزوير).

الشخص قد لا يعبئ الاستبيان بنفسه.

احتمال التزوير وارد جدا

صعوبة القيام بها في حال العينات الكبيرة

 

ثانيا : تصنيف البيانات و مراجعتها

بعد الانتهاء من جمع البيانات، فإنها تحتاج الى تصنيف ثم الى مراجعة.

  1. تصنيف البيانات:

يعد تصنيف البيانات الخطوة التالية و المكملة لمرحلة جمع البيانات، و فيها يلجأ الباحث الى حصر هذه البيانات و عرضها بطريقة مختصرة تساعد على فهمها و تيسر تحليلها احصائيا. لهذا لابد من وضع نظام للتصنيف قبل البدء في عملية جمع البيانات، و يعتمد هذا النظام على اساسين رئيسيان وهما : نوع البيانات ( نوعية أو كمية) ، وتصميم البحث( نوع المتغيرات مستقلة، تابعة، وسيط)

1.1 شروط التصنيف:

هناك عدة شروط لابد من مراعاتها أثناء عملية التصنيف، منها :

  1. ان يقوم التصنيف على اساس واحد و بموجب خاصية واحدة ( الجنس ، التخصص….) في كل مستوى و ذلك حتى لا تتداخل الفئات و تتشابك. مثال: تصنيف الطلاب على اساس الجنس : ذكور و اناث، ثم في مستوى ثاني حسب المستوى ( الليسانس ، الماستر، ماجستير، دكتوراه) و هكذا
  2. ان تكون فئات التصنيف شاملة بحيث تغطي كل الوحدات التي تتضمنها الخاصية، و أن تتطابق مع الفئات الموجودة في الواقع مثال: تصنف تخصصات قسم الاعلام و الاتصال الى : صحافة مكتوبة، علاقات عامة، سمعي بصري.

و في بعض الحالات قد تكون هناك بعض الفئات الشاذة و في هذه الحالة يمكن اضافة فئات تصنيف مثل: بيانات أخرى، أقل من ، أكبر من… لتغطية هذه الحالات الشاذة.

  1. ضرورة الاحتياط لبعض الحالات، و منها:
  • صعوبة عملية التصنيف عند دراسة الظواهر الجديدة التي يجد فيها الباحث معطيات كثيرة و لكنها غير متناسقة، و في هذه الحالة ينصح باللجوء الى تصنيف تجريبي قبل تعميمه.
  • و قد يصادف الباحث أيضا صعوبة في التصنيف عند استعمال الاسئلة المفتوحة، و التي عادة ما يتنوع محتوى اجاباتها و يتفاوت شكلا و مضمونا، و في هذه الحالة على الباحث ان يختار عينة ممثلة عن اجابات كل سؤال مفتوح، و يحللها ثم يختار العبارات الرئيسية و منها بهدف استعمالها كأساس للتصنيف.
  • قد يجد الباحث نفسه أمام نسبة مرتفعة من الاجابات على خيار أخرى، و في هذه الحالة عليه أن يراجع هذه الاجابات ليتخذ منها أساس التصنيف.

 المراجعة و التدقيق

عند اتمام عملية جمع البيانات وفق الوسيلة المناسبة لذلك البحث يتوجب الامر مراجعة وتدقيق البيانات لغرض التأكد من مطابقتها وتكاملها مع متطلبات الدراسة فعلى سبيل المثال لو كانت الوسيلة المستخدمة في جمع البيانات هي الاستبيان عندئذ يتوجب مراجعة وتدقيق الاستمارات الاحصائية التي تم جمعها واستبعاد ما هو غير متكامل او واضح او دقيق وعزل الاستمارات التي يعتقد الباحث انها غير مطابقة لما هو مطلوب.

و من الأمور التي التركيز عليها في هذه العملية ما يلي:

  1. عدم وضوح الكتابة، في هذه الحالة يراجع المبحوث للاستيضاح و في حالة التعذر تلغى اجابته.
  2. مدى توخي الدقة من المبحوث في اجابته، و يلاحظ ذلك من خلال التعارض في الاجابة، الاجابات النمطية….
  3. ترك بعض الأسئلة دون الاجابة

ثالثا.  ترميز البيانات

نلجأ في كثير من الأحيان إلى ترميز البيانات بشكل واضح و وحيد، و ذلك لتسهيل معالجتها بواسطة البرامج الاحصائية المختلفة. و حتى يحصل الغرض من عملية الترميز فان على الباحث ان يقوم بهذه العملية على اسس منهجية ، مستخدما في ذلك الأرقام و الرموز و الأرقام و الرموز معا تبعا لطبيعة البيانات المراد ترميزها و في ما يلي عرض لأمثلة توضح العملية في كل حالة من الحالات الثلاث:

  1. استخدام الرموز : مثال: ترميز البيانات المتعلقة بالمستوى الدراسي(Level of education) نستخدم الرمز L-edu
  1. استخدام الأرقام: مثال: ترميز الحالات المرتبطة بالمستوى الدراسي، نفرض انه لدينا المستويات التالية:
  • ثانوي و نرمز له بالرمز 1
  • جامعي و نرمز له بالرمز 2
  • دراسات عليا و نرمز له بالرمز 3
  1. استخدام الرموز و الأرقام معا: هناك حالات عديدة تستدعي استخدام الرموز و الأرقام معا نظرا لارتباطها ببعضها و مثال ذلك ترميز عبارات أو بنود استبيان ما و ليكن اختبار القلق و هو مقياس يتكون من 50 بند و في هذه الحالة عملية الترميز ترتبط بمتغيرين و هما اسم المقياس، و رقم البند
  • اسم المقياس  Test Anxiety و نرمز له بالرمز Tan
  • رقم البند  Item No نرمز له بالرمز  INo

و بعد ذلك يمكن ترميز بنود المقياس الخمسين كما يلي:

  • البند رقم 1 و يرمز له بالرمز Tan- Ino1
  • البند رقم 2 و يرمز له بالرمز Tan- Ino2

و هكذا حتى نصل الى البند رقم 50 و يرمز له بالرمز Tan- Ino50

ملاحظات هامة

  • استخدام اختصارات بسيطة و مفهومة
  • عدم استخدام الفراغ في عملية الترميز
  • عدم استخدام رموز تتطابق مع اسماء الدوال الاحصائية

يستحسن انشاء دليل الترميز و الذي يضم التعريف بالبيانات و خصائصها و رموزها المستخدمة.

 

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

هذا الموقع يستخدم Akismet للحدّ من التعليقات المزعجة والغير مرغوبة. تعرّف على كيفية معالجة بيانات تعليقك.