فصلنامه علوم و فناوري اطلاعات

دوره 22شمارهء 1و2 (پاييز و زمستان1385) صفحه:149-162


مفهوم ابرداده و هدف آن[1]


كارن كويل
مترجم: 1) علي‌اکبر خاصه


1) عضو هيئت علمي دانشگاه پيام نور - مركز صومعه‌سرا
پست‌الكترونيكي:


1. مقدمه
دنياي فناوري اطلاعات را صحبت درباره ابرداده فرا گرفته است. به نظر مي‌رسد امروزه هر كسي در حال ايجاد يك قالب ابرداده‌اي است. در «اچ‌تي‌ام‌ال»[2] يك برچسب <meta> وجود دارد كه به منظور حمل ابرداده براي منابع اينترنتي به‌كار مي‌رود؛ دانشمندان ابرداده را به‌منظور توصيف ژنوم‌‌ها ايجاد ‌كرده‌اند؛ ناشران داراي يك قالب ابرداده‌اي مي‌باشند كه انتقال داده‌‌هاي مربوط به قيمت و تبليغات براي خرده‌فروشان را تسهيل مي‌كند. چه اتفاقي در دنياي فناوري در حال شكل‌گيري است كه همگان را به اين باور رهنمون ساخته است كه: پاسخ، همان ابرداده است؟ اگر ابرداده پاسخ باشد، پس پرسش كدام است و آن براي كتابخانه‌‌ها و فهرست‌‌هاي كتابخانه‌اي چه‌ معنايي دارد؟

2. تعريف ابرداده
ابتدا بايد مشخص كنيم كه منظور ما از ابرداده چيست. تعريف رايج اين است كه ابرداده  «داده‌‌هايي در باره داده‌‌ها» مي‌باشد. اين تعريف ساده است، اما به فهم اين‌كه ابرداده كاملاً درباره چيست چندان كمكي نمي‌كند. آنچه كه متعاقباً خواهد آمد سادگي كم‌تري دارد، ولي درك ابرداده را براي ما ميسر مي‌سازد. اول اينكه، ابرداده همان اطلاعات مصنوع[3] است، بدين معنا كه ابرداده ابداع آدمي است و در طبيعت يافت نمي‌شود. استفاده از طول و عرض جغرافيايي به منظور توصيف زمين و نقاط روي آن، مثالي مناسب از اطلاعات مصنوع مي‌باشد. گرچه امروزه كاملاً به ديدن نقشه‌‌ها و منحني‌هاي روي آن عادت كرده‌ايم، اما يك سياره واقعي مسلماً فاقد خطوط پيراموني است؛ ولي ابداع طول و عرض جغرافيايي اين امكان را ميسر مي‌نمايد تا درباره مكان‌هاي روي سياره بحث كنيم و بدون داشتن علائم راهنما در مناطق وسيع كنكاش نماييم.
اين نكته ما را به دومين ويژگي لازم ابرداده رهنمون مي‌سازد: ابرداده توسط افراد براي نيل به يک هدف يا يک عملکرد خاص ايجاد شده است. بنابراين نقشه يک سيستم مترو که به رانندگان داده مي‌شود، شامل رمز‌هاي رنگي مسير‌ها و نماد‌هايي است که به‌منظور راهنمايي آنان در مسير‌هاي پرپيچ و خم و نقاط تردد مورد استفاده قرار مي‌گيرد. اين نقشه غالباً به‌ ندرت نمايانگر مقياس واقعي و جغرافياي شهري است که داراي مترو بوده، اما کاملاً مفيد مي‌باشد، زيرا به جاي تاكيد بر دقت جغرافيايي، با محوريت متروگرايانه به مسئله مي‌پردازد. نقشه راه‌هاي همان ناحيه، ازنظر جغرافيايي صحيح‌تر خواهد بود؛ اما چنانچه اين نقشه توسط يک هيئت گردشگري طراحي شده باشد، در آن هتل‌ها، موزه‌‌ها، نقاط ديدني، و امکانات پارکينگ برجسته‌نمايي خواهند شد. نقشه ناحيه‌‌اي که توسط باشگاه‌ پياده‌روي استفاده مي‌شود بر راهنماهاي طبيعي و ريخت‌شناسي آن ناحيه تأکيد خواهد داشت. همان طور که فقط يك نوع نقشه واحد وجود ندارد که برطرف‌کننده همه نياز‌ها باشد، هيچ نوع واحدي از ابرداده براي مدارک يا ديگر اشياي اطلاعاتي نيز وجود ندارد. دليلش هم اين است که اين خود شيء نيست که ابرداده را تعيين مي‌کند، بلکه نياز‌ها و اهداف افرادي که آن‌ را ايجاد مي‌كنند و آن‌هايي که از آن استفاده خواهند كرد تعيين‌كننده نوع ابرداده آن خواهد بود. بدون اين‌که بيش از حد دشوارگويي كنيم، تنها كافي است بگوييم كه ابرداده، جهان نيست، بلکه نحوه نگاه ما به جهان در يک لحظه زماني با منظوري خاص است.
ابرداده همچنين غالباً همچون جانشيني
[4] براي شيء واقعي است. در يك فهرست کتابخانه‌اي، مدخل‌ها جانشيني براي کتب موجود در قفسه‌ها مي‌باشند. در حالي‌که براي کاربران کتابخانه، نگاه کردن به هر کتاب به منظور تعيين کتابي كه مي‌خواهند دشوار خواهد بود، اما دست‌كم اين است که کتاب به صورت فيزيکي خود در آنجا هست. در محيط رقومي، نقش جانشيني ابرداده، نقشي کليدي است، زيرا بسياري از منابع به راحتي قابل مرور نيستند و برخي ديگر حامل داده‌‌هاي روشن در باره خود نيستند. افزايش علاقه به ابرداده، قسمتي از تلاش در جهت سازماندهي جهان نسبتاً بي‌نظم منابع رقومي، و فراهم‌آوري خدمات و دسترسي در مکاني است که قبلاً وجود نداشته. همچنين روشي براي تبادل داده‌‌ها بين ذخاير ناهمگن منابع، و براي تأمين امکان کاوش در انبارهاي رقومي است.

3. «اكس‌ام‌ال»[5] و «آردي‌اف»[6]
«اكس‌ام‌ال» و «آر‌دي‌اف» دو سرنامي هستند که هر جا سخني از ابرداده پيش آيد، متوجه خواهيد شد که از اين دو نيز نام برده مي‌شود. «اكس‌ام‌ال» زبان نشانه‌گذاري گسترش‌پذير (2) و «آر‌دي‌اف»، چارچوب توصيف منبع (3) است. برخي طوري در مورد اين دو صحبت مي‌کنند که گويي اين‌ها خود، قالب‌هاي ابرداده‌‌اي هستند، اما اين امر نوعي اغتشاش بين فرم و محتوا است. «اكس‌ام‌ال» و «آر‌دي‌اف» در واقع قالب‌‌هاي داده‌‌اي عمومي هستند که مي‌توانند کاربرد‌هاي زيادي داشته باشند؛ خصوصاً «اكس‌ام‌ال» كه غالباً به عنوان نوعي قالب مدرک مورد استفاده قرار مي‌گيرد و قالب وسيع‌تري است که «اچ‌تي‌ام‌ال» از آن مشتق شده است.
چنانچه با ساختار ركوردي «اكس‌ام‌ال» آشنا نباشيد، ممكن است براي شما كاملاً پيچيده و مرموز به‌نظر برسد. هرچند به وسيله آن مي‌توان ركورد‌‌هاي پيچيده ابرداده‌‌اي ايجاد كرد، اما شكل اساسي آن بسيار ساده است. اگر به ركورد مارك به‌عنوان ركورد حاوي فيلدهاي برچسب‌دار بنگريد، مانند استفاده از «245» به جاي «عنوان»:

245 $a Hamlet, Prince of Denmark

در اين صورت «اكس‌ام‌ال» نيز يك روش ديگر براي برچسب‌زني يك قطعه از داده‌ها است، گرچه برگذاردن يك برچسب آغازين و يك برچسب پاياني (با يك "/" قبل از نام برچسب) حول هر عنصر داده‌‌اي تأكيد دارد:

<title>Hamlet, Prince of Denmark</title>

برچسب‌ها، مادامي كه آن‌ها را از قبل و در يك ساختار مشخص با فرمت داده‌‌اي تعريف كنيد، مي‌توانند هر چيزي كه شما دوست داريد باشند. پس، بسته به ترجيح شما، تعريفتان مي‌تواند داراي هر يك از اين‌ها به‌جاي يك عنوان باشد:

<245>Hamlet, Prince of Denmark</245>
<ti>hamlet, prince of Denmark</ti>

«اكس‌ام‌ال» نيز مانند برچسب‌ها و فيلدهاي فرعي مارك[7] ذاتاً سلسله‌مراتبي است. رجحان آن بر مارك 21 اين‌است كه برخلاف مارك 21 كه داراي دو سطح‌ـ برچسب و فيلد فرعي‌ـ است، بسته به نياز مي‌تواند سطوح سلسله‌مراتبي بسياري داشته باشد. در «اكس‌ام‌ال» سلسله‌مراتب بمانند عروسك‌هاي روسي در هر چند سطح كه مورد نياز باشد «آشيان» مي‌كنند.
«چارچوب توصيف منبع» (آردي‌اف) يكي دو مرحله فراتر از «اكس‌ام‌ال» است. «آردي‌اف» بر روابط بين عناصر داده‌‌اي تاكيد دارد. يك رابطه كليدي در آردي‌اف «درباره» است كه در آن، يك منبع وبي، هدف گزاره «آردي‌اف» است، و ديگر فيلدهاي موجود در گزاره درباره منبع هستند. اين ساده‌ترين حالت است. آردي‌اف مي‌تواند از رابطه‌هايي همچون:
 

subClassOf
subPropertyOf
member
isDefinedby

و... نيز استفاده كند. «آر‌دي‌اف» جزء لازم اقدامي است كه «وب معنايي» (4) نام گرفته، كه اقدام «كنسرسيوم وب جهاني» در راستاي افزودن يك جزء معنايي به‌منظور به‌اشتراك‌گذاري داده‌ها در اينترنت مي‌باشد. «آردي‌اف» پيچيده‌تر و كم‌استعمال‌تر از «اكس‌ام‌ال» است، و هنوز مشخص نيست كه آيا  به عنوان يك زبان عمومي در توصيف دنياي وب مثمرثمر، موفق گردد. قطعاً چنين به‌نظر مي‌رسد كه «آردي‌اف» نسبت به «اكس‌ام‌ال» مستلزم درك عميق‌تري از برخي مفاهيم فلسفي مي‌باشد و تعداد افرادي كه آن ‌را ذاتاً گيج‌كننده مي‌يابند (و من در آن گروه قرار دارم) بسيار بيش‌تر از آن‌هايي است كه به آن به‌عنوان يك راه حل مي‌نگرند. (مثال موجود در زير يك ركورد «كريتيو كامنز»[8] است كه از يك فرمت ساده آردي‌اف استفاده مي‌كند.)

4. ابرداده براي اشياي شبه‌مدرك
ما به عنوان کتابدار ابتدائاً با ابرداده براي مدارک و اشياي شبه‌مدرک کار مي‌كنيم، گرچه با درنظرگرفتن خط كاري‌مان مي‌توانيم از عهده ذخيره‌سازي، سازماندهي و فراهم‌آوري خدمات در حيطه ديگر انواع ابرداده‌‌اي از قبيل ابرداده علمي نيز برآييم. اما اين مقاله بر ابرداده‌‌اي تمرکز دارد که مدارک را توصيف مي‌کند و سؤال اصلي هم اين است که فرق اين ابرداده با فهرستنويسي کتابخانه‌‌اي چيست؟ به‌ خاطر داشته باشيد که فرمت‌هاي ابرداده‌‌اي معرفي‌شده در اين مقاله (هسته دابلين[9] ،«مدز»[10] ، و «متس»[11]) تنها سه فرمت از چندين فرمت مورد استفاده امروزي، اما رايج‌ترين فرمت‌هاي مورداستفاده در کتابخانه‌هاي رقومي هستند.
بدون شک فهرست‌نويسي کتابخانه‌‌اي جزء جدايي‌ناپذير ابرداده مدرک است و مي‌توان منشأ آن را اواسط دهه 1800ميلادي با قواعد «جيووت»
[12] و «پانيتزي»[13] دانست. فهرست‌نويسي تقريباً براي هر فرد داراي تحصيلات متوسطه در جهان انگلوامريکايي شناخته‌شده است. بطور کلي نمونه‌هاي فهرست‌نويسي کتابخانه‌‌اي عمدتاً همه طرحواره‌هاي ابرداده‌‌‌اي که براي کتاب (گرچه نه الزاماً براي مقالات مجلات) به‌کار مي‌روند را شامل مي‌شوند. در عين حال، هنگامي که سازندگان برنامه‌هاي کاربردي اينترنتي براي مدارک پيوسته به ابرداده نياز داشتند، از استاندارد کتابخانه‌‌اي استفاده نكردند. در واقع استاندارد ابرداده‌‌اي مدرک که غالباً در برنامه‌هاي کاربردي غيرکتابخانه‌‌اي مورد استفاده قرار مي‌گيرد «هسته دابلين» (دابلين کور) است. براي فهم دليل اين امر بايد به اهدافش بنگريم.

5. هسته دابلين
به‌خاطر اين‌که کلمه «دابلين» در عبارت «هسته دابلين» به شهر «دابلين» ايالت اوهايو که مقر «اُسي‌ال‌سي»[14] است اشاره دارد، و چون اُسي‌ال‌سي سازمان حامي هسته دابلين است، شايد چنين تصور شود که هسته دابلين برآمده از سنت کتابخانه‌‌اي است. در واقع تلاش زيادي براي متمايز کردن هسته دابلين از سنت کتابخانه‌‌اي شده است، و تا حدود زيادي نيز موفقيت‌آميز بوده. هدف هسته دابلين ايجاد مجموعه‌‌اي ساده از عناصر داده‌‌اي به منظور توصيف مدارک و ساير اشياي موجود در اينترنت مي‌باشد و قرار بود آنقدر ساده باشد که هر فردي بتواند براي مدارک خودش ركوردي ايجاد كند. هسته دابلين داراي 15 عنصر «هسته» (5) است که با استفاده از برخي بيانگرها مي‌توان جزئيات بيش‌تري به آن‌ها افزود. عناصر هسته‌ بسيار كلي هستند؛ از اين رو، هسته به‌جاي «مؤلف»[15] داراي «پديدآور»[16] است، و پديدآور ممكن است شامل مؤلف يا آهنگساز و... شود. من مي‌توانم براحتي براي هر چيزي يك ركورد هسته دابلين ايجاد كنم، حتي براي همين مقاله‌‌اي كه هنوز به پايان نرسانده‌ام:

creator = Karen Coyle
title = Understanding Metadata and its Purpose
date= December, 2004
description = the first draft of an article for journal of Academic Librarianship
subject = metadata
type = text

اميد مي‌رفت كه با هسته دابلين، مدارک اينترنتي حامل توصيف‌هاي کتابشناختي خود باشند و از اين‌رو عناصر داده‌‌اي را براي اطلاعاتي از قبيل مؤلف, عنوان, و تاريخ، کدگذاري نمايند. از يك نظر، اين عمل بيانگر يك ديدگاه شديداً کتابدارانه است، زيرا معتقد است كه هسته دابلين بايد امکان يافتن مدارک از طريق مؤلف يا عنوان را فراهم نمايد. امروزه از هسته دابلين در اينترنت استفاده بسيار زيادي مي‌شود، هر چند اين استفاده منتهي به ايجاد فهرستي از منابع اينترنتي نشده است. در عوض هسته دابلين تبديل به ابرداده توصيف مدرک براي انواع برنامه‌هاي کاربردي مبتني بر وب شده است. مجوز «كريتيو كامنز» نمونه‌‌اي از اين نوع مي‌باشد.
«كريتيو كامنز» (6) هم يک خدمت وب است و هم نوعي جنبش اجتماعي، كه توسط «لري لسيگ»
[17] استاد حقوق استانفورد ايجاد شد که به خاطر انتقاد به تقويت قانون حق مؤلف به بهاي حق عموم در استفاده و بازاستفاده[18] از ايده‌هاي پيشينيان، مشهور است (7). با هدف مجاب‌کردن مؤلفان به صدور اجازه استفاده از آثارشان، مجموعه کوچکي از مجوز‌ها ايجاد شد كه براحتي به فايل‌هاي اينترنتي ضميمه شوند. اين مجوز‌ها بيانگر اجازه استفاده و بازاستفاده از آثار هستند و به وسيله مؤلفشان اعطا شده‌اند. علاوه بر اين مجوز، نرم‌افزار «كريتيو كامنز» به مؤلف امكان مي‌دهد كه بخش کوچکي از آنچه را كتابداران، ابرداده «توصيفي» مي‌نامند نيز اضافه كند: مؤلف، عنوان، تاريخ، و توصيف کوتاهي از منبع. در اين‌ها نيز از عناصر توصيفي داده‌‌اي هسته دابلين- يعني پديدآور، عنوان، و تاريخ- استفاده شده (که در ركورد به صورت “dc:creator,” “dc:title,” و غيره رمزگذاري مي‌شوند) (تصوير 1).

تصوير 1   «مجوز كريتيو كامنز» كه در آن، عناصر ابرداده‌‌اي هسته دابلين به‌صورت پررنگ نشان داده شده‌اند.

<!--/Creative Commons License-->

<!--

<rdf:RDF xmlns="http://web.resource.org/cc/"

xmlns:dc="http://purl.org/dc/elements/1.1/"

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">

<Work rdf:about="">

<dc:title>Metadata:Data with a Purpose</dc:title>

<dc:date>2004</dc:date>

<dc:description>A general discussion of document/resource metadata and some related uses.</dc:description>

<dc:creator><Agent>

<dc:title>Karen Coyle</dc:title>

</Agent></dc: creator>

<dc:rights><Agent>

<dc:title>Karen Coyle</dc:title>

</Agent></dc: rights>

<dc:type rdf: resource= "http://purl.org/dc/dcmitype/Text"/>

<dc:source rdf: resource= "http://www.kcoyle.net/metapurpose.html"/>

<license rdf: resource= "http://creativecommons.org/licenses/by-nc-nd/2.0"/>

</Work>

<License rdf: about= "http://creativecommons.org/licenses/by-nc-nd/2.0"/>

<permits rdf: resource= "http://web.resource.org/cc/Reproduction"/>

<permits rdf: resource= "http://web.resource.org/cc/Distribution"/>

<requires rdf: resource= "http://web.resource.org/cc/Notice"/>

<requires rdf: resource= "http://web.resource.org/cc/Attribution"/>

<prohibits rdf: resource= "http://web.resource.org/cc/CommercialUse"/>

</License>

</rdf:RDF>

استفاده از «مجوز كريتيو كامنز» مستلزم هيچ نوع آگاهي از قوانين يا قراردادهاي حق مؤلف نيست و عناصر توصيفي، همان عناصري هستند که اكثر افراد مي‌توانند به سادگي آن‌ها را درك كنند. در اين مفهوم، هسته دابلين با ايجاد هسته‌‌اي از عناصر توصيفي که بتوان در برنامه‌هاي مختلف کاربردي وبي گنجاند، به هدف خود رسيده است.
يکي از چيزهايي که استفاده از هسته دابلين را براي همه تسهيل مي‌كند، فقدان الزام به هرگونه قوانين فهرست‌نويسي است. اين چيزي است که با مشرب فهرست‌نويسي کتابخانه‌‌اي مغايرت دارد و پرواضح است كه باز-استفاده‌پذيري از محتويات ركورد‌هاي هسته دابلين را کاهش مي‌دهد. در استاندارد هسته دابلين توصيفاتي براي هر يك از عناصر داده‌‌اي وجود دارد؛ بنابراين مفهوم عنصر داده‌‌اي به طور كلي تعريف شده است.  اما وقتي مي‌گوييم

“creator=Karen Coyle.”

همانقدر درست است که بگوييم

“creator=Coyle, Karen.”

اما مزيت آن در اين است که احتمال استفاده از هسته دابلين براي تعدادي از جوامع و فرهنگ‌هاي مختلف وجود دارد؛ اشكال آشكار آن در اين است که محتواي فيلدها در برنامه‌هاي کاربردي يكسان نيست، و اين امر مشکل ميانکنش‌پذيري را به وجود مي‌آورد.

6. «مُدز»: مارک ملايم‌تر و مهربان‌تر
فرمت مارک براي کدگذاري اطلاعات کتابشناختي، ركورد بسيار پيچيده‌‌اي است كه در جهان کتابداري کاملاً شناخته شده و در سامانه‌هاي كتابخانه‌‌اي ايالات متحده، کانادا، و ديگر کشورها، خصوصاً در كشورهاي انگليسي زبان، از آن حمايت مي‌شود. در محيط شبکه‌اي که ابرداده توصيفي را مي‌توان در بين سيستم‌ها انتقال داد و در/با ديگر انواع ابرداده تلفيق كرد، استفاده از ركورد‌هاي مارک براي چنين هدفي ايده‌آل به‌نظر مي‌رسد. اما مشکل مارک اين است که اين تلفيق و گنجاندن عموماً مستلزم استفاده از ساختار داده‌‌اي «اكس‌ام‌ال» است، در حالي كه مارک يک ركورد «اكس‌ام‌ال» نيست. کتابخانه کنگره روشي براي تبديل ركورد مارک به «اكس‌ام‌ال» ايجاد نموده، اما اين روش طرفداران چنداني پيدا نکرده و علتش هم شايد موجه باشد: ركورد مارک بزرگ‌تر و مفصل‌تر از چيزي است که اکثر سامانه‌ها به آن نياز دارند و استفاده آن از برچسب‌هاي عددي و کدهاي فيلد فرعي، فهم آن را بدون آموزش قابل توجه مشکل مي‌سازد. بنابراين، نياز به نسخه‌‌اي ملايم‌تر و مهربان‌تر از مارک که بتواند عناصر داده‌‌اي کليدي يك ركورد مارک را بپذيرد و آن‌ها را به قالبي آسان- فهم از «اكس‌ام‌ال» انتقال دهد احساس مي‌شد. از اين‌رو« استاندارد ابرداده‌اي توصيف شيء»[19] («مُدز») متولد شد.در «مُدز» به‌جاي
برچسب‌هاي سه‌رقمي و كدهاي فيلد فرعي مارك، از برچسب‌هاي انسان-فهم (يعني
"title" به‌جاي"245" ) استفاده مي‌شود. «مُدز» اكثر عناصر داده‌‌اي فيلدهاي ثابت، به استثناي كدهاي قالب فيزيكي (از 007) و بسياري از كدهاي نوع[20] (از 008) را ناديده مي‌انگارد. همچنين سودمندي‌ها و نوآوري‌هاي جديدي نيز در خود دارد. «مُدز» ساختاري به اسم «نام» تعريف مي‌ كند كه نمايانگر فيلدها و فيلدهاي فرعي مربوط به نام‌هاي شخصي و تنالگاني و مربوط به كنفرانس‌ها است. اين ساختار مي‌تواند هر جا كه نام‌ها ظاهر مي‌شوند، چه به عنوان مدخل‌هاي اصلي، و چه شناسه‌هاي افزوده، يا موضوع‌ها مورد استفاده قرار گيرد. بنابراين، با يك فيلد نام مثل:

<name type=”personal”>
    <namePart>Shakespear, Williame</namePart>
    <namePart type=”date”>1564-1616</namePart>
</name>                          

مي‌توان به عنوان يك فيلد مؤلف استفاده كرد، يا مي‌تواند بخشي از يك سرعنوان موضوعي باشد:

<subject authority=”lcsh”>

<name type=”personal”>

<namePart>Shakespeare, William</namePart>

<namePart type=”date”>1564-1616</namePart>

</name>

<topic>Bibliography</topic>

<topic>Periodicals</topic>

</subject>

«مُدز» گرچه از مارك 21 مشتق شده و بسيار مفصل‌تر از هسته دابلين است، اما قواعدش به‌‌مراتب كم‌تر از مارك 21 مي‌باشد. در«مُدز» نيز مانند هسته دابلين هيچ فيلد لازمي وجود ندارد و همه فيلدها تكرارپذير هستند. «مُدز» حاوي بسياري از مزاياي مارك است، ولي تفاوت‌هاي اساسي نيز با مارك 21 دارد: اصلاً مفاهيم «شناسه اصلي» يا «شناسه افزوده» ندارد و همه مؤلفان فقط مؤلف هستند؛ و هر ركورد ممكن است داراي عناوين متعدد، و بدون يك «عنوان اصلي» باشد. هنگامي كه ركورد‌هاي مارك 21 به «مُدز» تبديل مي‌شوند، ركوردي در قالب «اكس‌ام‌ال» به دست مي‌آوريد كه نوعي “MARC-lite” مي‌باشد. ركورد‌هاي «مُدز» را مي‌توان از ابرداده‌هاي كتابشناختي ‌‌كه در اصل به‌عنوان فهرست‌نويسي كتابخانه‌‌اي توليد نشده‌اند- از قبيل استنادات مقاله‌اي- نيز به وجود آورد؛ و غالباً در پايگاه‌هاي اطلاعاتي كه داراي تركيبي از فهرست‌نويسي كتابخانه‌‌اي و ديگر داده‌هاي كتابشناختي هستند استفاده مي‌شود.

7. «مِتس»: ابرداده به مثابه ساختار
نوعي ابرداده مدرك وجود دارد كه هدف از آن، «توصيف»ـ به معنايي كه در فهرست‌نويسي داردـ نيست. فرمت ابرداده‌‌اي كه به‌وسيله كتابخانه‌ها و آرشيوهاي رقومي استفاده مي‌شود و «استاندارد ابرداده‌‌اي كدگذاري و ارسال»[21] (مِتس) (8) نام دارد، مثالي از اين نوع مي‌باشد. «مِتس» به نقش اين استاندارد به‌عنوان «لفاف»[22] اشاره دارد و به‌منظور كنارهم‌ نگه‌داشتن فايل‌هايي كه يك شيء رقومي را مي‌سازند به‌وجود آمده است. مدارك رقومي بر خلاف يك كتاب‌ صحافي‌شده، غالباً از تعدادي فايل‌هاي مجزا كه نشان‌دهنده صفحات يا ديگر واحدهاي آن مدرك هستند به‌وجود مي‌آيند. و بر خلاف يك كتاب فيزيكي، هيچ جلد يا صفحه عنوان مرئي ندارند، و كسي نمي‌تواند صفحات را ورق بزند تا به مكان مشخصي در كتاب برسد. به «مِتس» به‌مثابه صحافي، جلد، و محمل گروهي از فايل‌هاي رقومي بنگريد، كه شامل اطلاعات فني كه براي مديريت و فهم آن فايل مورد نياز هستند- از قبيل قالب‌هاي فايل، فناوري مورد استفاده در اسكن (چنانچه منشأ آن فايل از كاغذ آغاز شده باشد)، و استحاله‌ها و فشرده‌سازي‌هاي رقومي كه بر روي فايل‌ها مورد استفاده قرار گرفته‌اند نيز مي‌شود. چيزي كه در «مِتس» تعريف نشده، ابرداده توصيفي است. در عوض، كساني كه ركورد‌هاي «مِتس» را ايجاد مي‌كنند اين امكان را دارند كه هر نوع ابرداده توصيفي‌ را كه براي استفاده با آن مواد مي‌پسندند، در آن بگنجانند. اين نكته يكي از ويژگي‌هاي مهم جهان ابرداده‌اي را نشان مي‌دهد، كه در مثال «كريتيو كامنز»‌ نيز قابل مشاهده است: ابرداده به‌جاي اين‌كه دوباره ابداع شود مي‌تواند مورد بازاستفاده قرار گيرد. ركوردهاي «مِتس» معمولاً حامل ابرداده‌هاي توصيفي موجود در هسته دابلين يا «مُدز» هستند.

8. ابرداده و فهرست‌نويسي كتابخانه‌‌اي
به طور كلي، اين‌ها چه ربطي به فهرست‌نويسي كتابخانه‌‌اي دارند و مهم‌تر از همه آيا ابرداده جاي فهرستنويسي را خواهد گرفت؟ پيش‌تر گفته شد كه يكي از مهم‌ترين مشكلات در ركورد‌هاي هسته دابلين، نبود قواعد فهرست‌نويسي است و به همين دليل پيش‌بيني‌پذيري‌ اندكي بين جوامع يا پروژه‌ها، از نظر محتواي فيلدها وجود دارد. چيزي كه فهرست‌نويسي و فهرست‌هاي كتابخانه‌‌اي فراهم مي‌كنند، درجه بالاي مطابقت در داده‌هاي ضبط‌شده در ركورد‌ها است. اين انطباق، خدمتي براي كاربران است تا بتوانند به راحتي از كتابخانه‌‌اي به كتابخانه ديگر بروند. اما مهم‌ترين ارزش اين انطباق، ايجاد توانايي فهرست‌نويسي تعاوني و تبادل ركورد‌هاي فهرست‌نويسي بين كتابخانه‌ها و سامانه‌هاي كتابخانه‌‌اي است. همچنين به فروشندگان سامانه‌هاي كتابخانه‌‌اي اين امكان را مي‌دهد كه محصولي توليد كنند كه در هر كتابخانه‌‌اي قابل استفاده باشد، درست مثل فهرستبرگه استاندارد كه براي هر كشوي فهرستبرگه‌‌اي، مناسب است.
كارآيي‌هايي كه از اين انطباق منتج مي‌شوند بسيار زيادند و جامعه كتابداري در فهرست‌نويسي مواد اوليه‌اش به آن‌ها چشم دارد. ولي همراه با حركت كتابخانه‌ها به سمت سازماندهي مواد داراي قالب‌هاي جديد، نه قواعد فهرست‌نويسي و نه سامانه‌هاي كتابخانه‌‌اي نمي‌توانند راه‌حل‌هاي عملي ارائه نمايند. فرض كنيد آرشيوي از عكس‌هاي شهرتان كه متعلق به اوايل قرن 20 است در اختيار داريد و مي‌خواهيد آن را بر روي وب در دسترس همگان قرار دهيد. و فرض كنيم كه تعداد آن‌ها حدود هزار عدد است. شما هيچ گونه اطلاعاتي درباره عكاس و تاريخ عكسبرداري اكثر آن‌ها نداريد. فردي قبلاً با مداد بر پشت آن‌ها چيزي درباره تصوير نوشته است، مثلاً «خيابان اصلي، حدود 1910». فهرست‌نويسي و توليد ركورد‌هاي مارك 21 از اين عكس‌ها بسيار وقتگير، و ركوردهاي حاصله نيز حاوي اطلاعات اندكي خواهد بود. در عوض مي‌توانيد يك ركورد هسته دابلين ايجاد كنيد كه فقط داراي اطلاعات زير است:

date= حدود 1910
description= خيابان اصلي

گرچه ركورد‌هايي نظير ركورد مذكور ممكن است از اهداف فناوري‌هاي ابركاوش (كه به هر كاوش اجازه مي‌دهند در پايگاه‌هاي اطلاعاتي با فرمت‌هاي مختلف ابرداد‌ه‌اي مورد جستجو قرار گيرند) باشند، ولي اين ركورد را نمي‌توانيد به فهرست پيوسته خود وارد كنيد. مهم‌ترين مزيت در اينجا اين است كه اين ركورد‌‌ها را مي‌توان با سرعت و راحتي هر چه تمام‌تر به‌وسيله كارمندان كتابخانه‌‌ و با حداقل آموزش ايجاد نمود؛ و بنابراين برخي ابرداده‌‌ها را مي‌توان براي منابعي ايجاد نمود كه در غير اين‌صورت، هيچ مي‌شدند.
ابرداده‌‌اي نظير هسته دابلين فاقد سطحي مناسب از پيش‌بيني‌پذيري است تا امكان بازاستفاده وسيع و نظام‌مند از ركورد‌ها را فراهم نمايد. در واقع اين فرمت‌هاي ابرداده‌‌اي و ديگر فرمت‌هاي داده‌‌اي كه از آن‌ها استفاده مي‌كنند، غالباً در سامانه‌هايي تك‌كاره و مستقل مورد استفاده قرار مي‌گيرند. هنگامي كه اين سامانه‌هاي تك‌‌كاره شروع به تبادل داده‌‌ها نمايند، درست مثل كتابخانه‌‌ها كه اين كار را در اواخر قرن 19 آغاز كردند، سازندگان ممكن است به اين نتيجه برسند كه: اين محتواي ركوردهاي ابرداده‌‌اي است كه باعث تفاوت يك راه‌حل تك‌سامانه‌اي با يك جهان منسجم كتابشناختي مي‌شود، نه ساختار ركوردي آن‌ها. به عبارت ديگر ممكن است روزي شاهد باشيم كه ابرداده رشد كند و تبديل به فهرست‌نويسي شود.

9. يادداشت‌‌ها و منابع
1)    اين كنايه را هم به «تام دلسي»[23] كارشناس كتابخانه ملي كانادا («ابرداده: فهرست‌نويسي براي همه»، و هم به «مايكل گورمن»[24] («... ابرداده فهرست‌نويسي به‌وسيله همه است») نسبت مي‌دهند.
2)    استانداردهاي «اكس‌ام‌ال» توسط كنسرسيوم وب جهان‌گستر (قابل دسترسي در www.w3.org/XML/) تعيين شده است، اما بسياري از استانداردهاي برنامه‌هاي كاربردي «اكس‌ام‌ال» نيز توسط ساير گروه‌ها نظير «گروه استانداردهاي تجارت الكترونيكي» (OASIS) به وجود آمده اند (http://www.oasis-open.org/).

3)       http://www.w3.org/RDF/

4)       http://www.w3.org/2001/sw/

5)    پانزده عنصر دابلين كور عبارت‌اند از: همكار، دامنه پوشش، پديدآور، تاريخ، توصيف، قالب، شناساگر، زبان، ناشر، وابستگي، حقوق، منبع، موضوع، عنوان، و نوع رسانه. براي كسب اطلاعات بيش‌تر به http://dublincore.org مراجعه كنيد.

6)       http://www.creativecommons.org

7)       «لاورنس لسيگ»[25] مولف آثار زير مي باشد:

Code and other laws of cyberspace (New York: Basic Books, c1999); The future of ideas: the fate of the commons in a connected world (New York: Random House, 2001); Free culture: how big media uses technology and the law to lock down culture and control creativity (New York: Penguin Press, 2004).

8)    http://www.loc.gov/standards/mets/

پي‌نوشت‌ها

   [1]. Karen Coyle. 2005. Understanding Metadata and Its Purpose. The Journal of Academaic Librarianship 31(2): 160-63.
[2]. HTML (Hypertext Markup Language).
[3].constructed information
[4].surrogate
[5].XML (eXtensible Markup Language)
[6].RDF (Resource Description Framework)
[7]. MARC (Machine Readable Catalog)
[8].Creative Commons

يك سازمان غيرانتفاعي كه متعهد به گسترش طيف آثار خلاقه‌اي است كه به‌صورت قانوني در دسترس همگان هستند. اين سازمان چندين مجوز حق تكثير (كپي‌رايت) منتشر كرده كه Creative Commons Licenses نام دارند.

  [9]. Dublin Core
  [10]. Metadataa Object Description Standard (MODS)
  [11]. Metadata Encoding and Transmission Standard (METS)
  [12]. Jewett
  [13]. Panizzi
  [14]. OCLC
  [15]. author
  [16]. creator
  [17]. Larry Lessig
  [18]. Re-use
  [19]. Metadata Object Description Standard
  [20]. genre
  [21]. Metadata Encoding and Transmission Standard
  [22]. wrapper
  [23]. Tom Delsey
  [24]. Michael Gorman
  [25]
. Lawrence Lessig