Sunday, December 24, 2006

مفاتيح الاسترجاع أو نقاط الإتاحة

من المعروف أن النظم الآلية تتيح إمكانية الوصول للوعاء تحت أكثر من نقطة إتاحة واحدة... على حين تتيح الفهارس التقليدية الوصول إلى الأوعية من خلال : المؤلفين والعناوين والموضوعات فقط، سواء أكانت في شكل رؤوس لفظية أم في شكل رموز تصنيفية. كما يمكن أن تقدم نقاط إتاحة إضافية تحت المؤلفين المشاركين ، أو المترجمين ، أو المحققين ، وكذلك تحت أسماء الهيئات ، وعناوين السلاسل. ولاعتبارات اقتصادية مالية... يصعب تقديم نقاط إتاحة أكثر من ذلك في الفهارس التقليدية. أما النظم الآلية .. فلا شك أنها تتيح عناصر بيانات استرجاعية ، أو نقاط إتاحة أكثر من تلك المسموح بها في الفهارس التقليدية ؛ حيث يمكن الاسترجاع والبحث تحت أى عنصر بيانات في التسجيلة ، مثل : كلمة من اسم الهيئة ، وسنة النشر، ولغة الوعاء، والمادة الإيضاحية، بل أكثر من ذلك يمكن الاسترجاع بالكلمات المفتاحية في العنوان ، هذا بالإضافة إلى نقاط الاتاحة الأساسية: كاسم المؤلف ، أو العنوان ، أو الموضوع.([1])انظر الجدول (2-7) مفاتيح الاسترجاع وأنواعها في مرصد البيانات والذي يبين مدى تنوع مفاتيح الاسترجاع في المرصد التجريبي. ([1]) محمد فتحى عبدالهادى ، نبيلة خليفة جمعة ، يسرية زايد. الاتجاهات الحديثة في الفهرسة. مصدر سابق، ص 170 ، 171.

الملف المقلوب

يسميه البعض الملف القاموسي Dictionary File ، أو الكشفي Indexed File ... وهو أكثر الطرق فاعلية لاسترجاع المعلومات ، فنظام الملف المقلوب يوازي تقريبًا أساليب تكشيف الكتب؛ والمداخل الكشفية أو نقاط الإتاحة في مراصد البيانات يتم وضعها في كشاف يربط بين تلك المداخل أو النقاط وروابط وجودها في الملف الرئيسي؛ وتتمثل تلك الروابط في أرقام تسجيلات الملف الرئيسي.( ) ويوضح بورش Burch( ) أنه إذا تضمن الملف المقلوب كل الحقول وعناصر البيانات الموجودة في الملف الرئيسي ، أو زادت التسجيلات بشكل كبير ؛ فإن الملف المقلوب يتضخم ؛ مما يؤدي إلى: (1) حاجته لحيز أكبر في مساحة التخزين على وسيط التخزين المستخدم ، (2) صعوبة عمليات التحديث والصيانة ، (3) البطء في عمليات الاسترجاع. وهذا بالطبع له تأثيراته الاقتصادية على موردي مراصد البيانات والمستفيدين. كل هذا جعل بعض النظم تلجأ إلى الحل الوسط ، وهو (الانتقاء) أو (الاختيار) لنقاط الوصول ؛ أو بمعنى آخر أن يتضمن الملف المقلوب عناصر مختارة جزئيًا من الملف الرئيسي ، ويتم الاختيار أو الانتقاء وفقًا لاحتياجات المستفيدين ، ووفقًا لدراسة للحقول الأكثر استخدامًا في الاسترجاع. ويبين نيجز Negus( ) أن مصممي نظم استرجاع المعلومات في محاولة منهم لتصميم مراصد بيانات وفق منهج فعال واقتصادي يلجأون إلى تصنيف (تقسيم) مصطلحات الكشاف (الملف المقلوب) في مجموعات وفقًا لأنواعها ؛ بحيث تشكل كل مجموعة ملفًا منفصلاً. ونتيجة لذلك فإن أغلب النظم تتطلب أن يحدد المستفيد ملف الكشاف / أو الجزء الذي يتوقع أن يظهر فيه البحث ؛ وذلك بأن يحدد حقول بيانات بعينها ؛ مثل : المؤلف ، أو العنوان. كما يوضح نيجز كيف أن بعض النظم تستخدم لواحق الكلمات بالنسبة لبعض الحقول ، وتستخدم سوابق الكلمات مع حقول أخرى. ويعمل هذا الأسلوب - في الغالب - من أجل زيادة فاعلية البحث في ملفات الكشاف (الملفات المقلوبة). فنجد مثلاً : أن جميع مصطلحات الكشاف (الملف / أو المفات المقلوبة) في نظام ديالوج تقع في ملف واحد. ولتجميع كل المصطلحات المتجانسة معًا ، ومن ثم تلافي إجراءات البحث غير الضرورية، فقد تم استخدام سوابق الكلمات التي هي في الواقع أجزاء من مصطلحات البحث مثل : Au-Smith ، وهذا يعني أن المطلوب استرجاع تعبير البحث المحدد ( وهو في المثال: Smith) في حقل المؤلف . والمقطع (Au) هو سابقة لتحديد الملف. أما عن لواحق البحث فتستخدم بعض النظم كنموذج لبحث ما : word/DE والتى تعني أن البحث عن تعبير البحث المحدد (وهو في المثال : word) في حقل الواصفات ، والمقطع (DE) هو لاحقة لتحديد الملف. أما علامتا (-) و (/) فهي فواصل بين تعبير البحث والسوابق أو اللواحق يفهمها محرك البحث. وفي منظومة CDS-ISIS( ) يتيح الملف المقلوب Inverted File طرقًا إضافية للوصول إلى التسجيلات غير رقمها الفريد (MFN) ، فهو مقلوب الملف الرئيسي ، أو بمعنى آخر هو أشبه بالكشافات التى تلحق بالأعمال المرجعية ؛ حيث يتيح الوصول إلى التسجيلات الببليوجرافية عن طريق المؤلف أو العنوان أو أي عنصر بيانات آخر موجود في التسجيلة. ويحتوى هذا الملف على جميع المداخل التى قد تستخدم كنقاط إتاحة وأمام كل منها أرقام التسجيلات التى وردت منها. ومثال ذلك : بفرض وجود أربع تسجيلات رئيسية (11 ، 32 ، 51 ، 182) تحتوي على مصطلح معلومات، فسيكون البناء المنطقي للتسجيلة الخاصة بالمصطلح في الملف المقلوب كما يلي: المعلومات 11 32 51 182 يمثل مصطلح (المعلومات) في هذا المثال ما نسميه (نقطة الوصول) أو (مصطلح القاموس)، وكل إحالة (رقم تسجيلة) تظهر إلى جانب المصطلح تسمى تدوينة Posting. يتيح نظام CDS-ISIS إنشاء الملفات المقلوبة بشكل انتقائي ؛ حيث يمكن انتقاء حقل / أو حقول فرعية / أو عناصر منها / أو كلمات مفردة / أوعبارات / أو واصفات من الحقول المنتقاة لإدراجها في الملف المقلوب. ويتم هذا الاختيار أو الانتقاء وفقـًا لملف آخر يسمى جدول اختيار الحقول FST الذي سيحتوي على الحقول التي ستقلب (أي يتم إدراجها في الملف المقلوب) ، وعلى تقنية التكشيف التي ستستخدم لكل حقل. ويختلف نظام CDS-ISIS عن نظم استرجاع المعلومات التي يتم فيها إنشاء ملفات مستقلة لكل حقل قابل للاسترجاع ؛ وذلك لأن CDS-ISIS يستخدم ملفًا مقلوبًا واحدًا لكل الحقول القابلة للبحث في مرصد البيانات. ونتيجة للبناء الخاص للملف المقلوب فإنه يعادل من الناحية الوظيفية تعددية الملفات المقلوبة ؛ حيث إن كل تدوينة Posting في الملف المقلوب لا تحتوي في الواقع على رقم الملف الرئيسي فقط ، وإنما تحتوي كذلك على معلومات إضافية تعرف بدقة بالحقل الذي استخرجت منه البيانات ، وكذلك موقع (المصطلح) النسبي ضمن الحقل. أما عن الطول الأقصى لنقطة الوصول (أي مصطلح القاموس) فيصل إلى 30 حرفًا، والعناصر التي يكون طولها أكثر من ذلك يتم بترها قبل إدراجها في الملف المقلوب. انظر شكل (2-8) الذي يبين العلاقة بين الملف الرئيسي والملف المقلوب، والشكل (2-9) نموذج لعينة من تسجيلات الملف المقلوب لعدد خمس تسجيلات من الملف الرئيسي.

الملف الرئيسي

يطلق بعضهم على الملف الرئيسي Main File تسميات أخري مثل: الملف التتابعيSequential ، أو التسلسلي Serial ، أو المتتالي ، أو الخطي ؛ ذلك لأن ترتيب التسجيلات فيه تأتي متسلسلة بحسب الإدخال ؛ بحيث تكون التسجيلة مجاورة بشكل منطقي للتسجيلة التي تسبقها، ففي الملف الذي يتم الاحتفاظ به حسب ترتيب أرقام التسجيل (أرقام الملف الرئيسي) تقع التسجيلة المخزنة برقم 1234 بين التسجيلتين 1233 ، و 1235 ... وهذا يعني أن التسجيلات الموجودة في وسيط التخزين (الشريط أو القرص الممغنط) ستكون مرتبة ماديًا بنفس ترتيب تتابعها. والسمة الرئيسية لهذا الأسلوب من أساليب تنظيم الملفات ، هي أنه يمكن - بسرعة وببساطة – استرجاع عدد معين من التسجيلات المتتابعة. أما العيوب الأساسية لهذا الأسلوب فتنشأ من مشكلات صيانة الملف ؛ إذ إنه في حالة إضافة تسجيلة ما في وسط الملف – مثلاً – فإن ذلك يستلزم إعادة استنساخ الملف بأكمله من أجل إدخال التسجيلة في موقعها الصحيح من التسلسل. أما العيب الرئيسي الخاص بالبحث فيكمن في ضرورة قراءة (مسح Scan) كل تسجيلة في الملف ، إذا كان البحث يتضمن أحد الحقول التي ليست مفتاحًا للبحث (أي مفتاح يستخدم للوصول إلى التسجيلة المحفوظة ؛ وهو رقم الملف الرئيسي المذكور آنفًا) . ومن الواضح أن هذه العملية الأخيرة تتم ببطء شديد ، وخاصة عندما تكون الملفات ضخمة وعدد التسجيلات كبيرًا. وأغلب النظم التي كانت تعمل على دفعات كانت تستخدم هذا الأسلوب ؛ أما الآن (أي بعد 1987) فإن جميع خدمات الاسترجاع الرئيسية تستخدم تركيبات الملف المقلوب.([1])وفي منظومة CDS-ISIS يشتمل الملف الرئيسي على جميع التسجيلات ؛ مرتبة وفق المعيار الزمني لورود التسجيلات ؛ فما يأتي أولاً يسجل أولاً ؛ وتعرف كل تسجيلة برقم فريد ، يعطى تلقائياً من قبل CDS-ISIS عند إنشاء التسجيلة ، ويسمى رقم الملف الرئيسي (رمر: MFN) Master File Number .([2]) انظر الأشكال (2-6) و (2-7) التي تشتمل على نماذج لعينة من تسجيلات الملف الرئيسي في أشكال عرض مختلفة. ([1]) كلايتون ، مارلين. إدارة مشاريع التشغيل الآلي في المكتبات . مصدر سابق ، ص 81 بتصرف. ([2]) جامعة الدول العربية ، الأمانة العامة ، مركز التوثيق والمعلومات . دليل استعمال نظام CDS-ISIS المعرب الطبعة 3.03 . مصدر سابق ، ص 23.

تركيبات العرض

يتيح نظام CDS/ISIS تحديد المتطلبات الدقيقة لشكل عرض التسجيلات على الشاشة ، أو للإخراج على الطابعة ، ويوفر إمكانية عرض محتويات التسجيلات الببليوجرافية في أى نسق أو شكل يرغب فيه ؛ حيث يمكن عرض التسجيلات وفقاً لـ : 1- شكل العرض المتوافق مع قواعد الفهرسة الأنجلو أمريكية. انظر الشكل (2-5) 2- شكل العرض الكامل بأسماء الحقول. انظر الشكل (2-6) 3- شكل العرض الكامل بتيجان الحقول. انظر الشكل (2-7)

جدول اختيار الحقول

يتم من خلال هذا الجدول اختيار الحقول والحقول الفرعية التى تصلح لأن تكون نقاط إتاحة (تدرج هذه النقاط مرتبة هجائيا في الملف المقلوب Inverted File) ، ويتم تعريف كل نقطة إتاحة في سطر مستقل يتكون من: 1- محدد الحقل (التاج) TAG. 2- تقنية التكشيف Indexing Technique: وهى الطريقة التى يراد بها استرجاع الحقل ، ولدينا هنا (9) تسع تقنيات للبحث ، يوضحها الجدول (2-5).3- شكل استخراج البيانات Data Extraction Format: هو وصف لتركيبة استخراج البيانات التى يتكون منها الملف المقلوب (الملف القاموسي) مما يعطي مرونة كبيرة في التعامل مع البيانات.([1]) انظر جدول (2-6) الخاص باختيار الحقول لمرصد البيانات التجريبي. ([1]) أسامة لطفي محمد. التطبيق المتكامل لنظام CDS-ISIS في المكتبات.... مصدر سابق ، ص 58.

استمارة إدخال البيانات

يتم تصميم استمارة الإدخال وفقاً لجدول تعريف الحقول ، ويمكن إنشاء أكثر من استمارة إدخال بيانات لنفس القاعدة. فيمكن إنشاء استمارة منفصلة لكل وعاء على حدة. وتستعمل شاشات إدخال البيانات لإدخال وتعديل تسجيلات قاعدة البيانات.

جدول تعريف الحقول

يوفر هذا الجدول معلومات عن محتويات تسجيلات الملف الرئيسى في قاعدة البيانات ، كما يعرف - بصورة خاصة - مختلف الحقول ، التى قد تكون موجودة في القاعدة ، ويضم هذا الجدول عناصر البيانات التالية: 1- معرف الحقل أو التاج Field Tag: وهو قيمة رقمية فريدة لتحديد ذاتية الحقل. ويمكن استخدام هذا التاج في كل مرة لإعلام النظام بأداء وظيفة معينة تتعلق بهذا الحقل، وهو عبارة عن رقم صحيح يترواح بين 1 و 32000. 2- اسم الحقل Field Name : هو الاسم الوصفى للحقل ، يستخدم عادة في استمارة إدخال البيانات ، أو لترميز الحقول. ويكون في حدود 30 حرفًا ، ويمكن أن تستخدم الحروف والأرقام والعلامات الخاصة في تسميته. 3- طول الحقل Field Length: وهو رقم يشير إلى الطول الأقصى للحقل ، قد يصل في CDS-ISIS إلى 1600 تمثيلة لجميع الحقول ، ما عدا الحقل النمطي الذي يبلغ الحد الأقصى له 20 تمثيلة ، ويمكن أن تصل تكرارات الحقل المتكرر حتى 8000 تكرار بحيث لا يتعدى الطول الأقصى للحقل وهو 1600 تمثيلة. 4- نوع الحقل Field Type: يمكن أن يكون الحقل إما مختلطًا ؛ أي يشتمل على تمثيلات هجا-رقمية Alpha-Numeric ، أو هجائيًا Alphapetical يشتمل على تمثيلات هجائية فقط ، أو رقميًا Numerical يشتمل على تمثيلات رقمية فقط ، أو نمطيًا Pattern يشتمل على تمثيلات حسب نمط معين. 5- تكرارية الحقل Repetition : يستخدم للدلالة على التكرار ، حينما يكون الحقل متكرراً ، ويمكن أن يوجد أكثر من مرة في التسجيلة. 6- الحقول الفرعية Subfields : وهو بيان خاص بوجود الحقول الفرعية. والمحددات في هذه الحالة تكون علامة (^) متلوة بتمثيلة واحدة هجائية مـن (a - z) أو مـن (أ - ى) أو رقمية (1-9).7- النمط Pattern: وهو وصف محتويات الحقل تمثيلة تمثيلة.([1]) انظر الجدول (2-2). ([1]) أسامة لطفي محمد. التطبيق المتكامل لنظام CDS-ISIS في المكتبات.... مصدر سابق ، ص 52.

ملفات تعريف مرصد البيانات

يتألف تعريف قاعدة البيانات في برمجيات CDS-ISIS من المكونات التالية ، التى يكون كل منها ملفًا مستقلاً: أ- جدول تعريف الحقول Field Defination Table (FDT). ب- استمارة إدخال البيانات Data Entry Work Sheet. ج- تركيبة العرض Display Format. د- جدول اختيار الحقول Field Select Table (FST).