دوره 22شمارهء 1و2 (پاييز و زمستان1385) صفحه:149-162
مفهوم ابرداده و هدف آن[1]
كارن كويل
مترجم: 1) علياکبر خاصه
1) عضو هيئت علمي دانشگاه پيام نور - مركز صومعهسرا
پستالكترونيكي:
1. مقدمه
دنياي
فناوري اطلاعات را صحبت درباره ابرداده فرا گرفته است. به نظر ميرسد امروزه هر كسي
در حال ايجاد يك قالب ابردادهاي است. در «اچتيامال»[2]
يك
برچسب <meta>
وجود دارد كه به منظور حمل ابرداده براي
منابع اينترنتي بهكار ميرود؛ دانشمندان ابرداده را بهمنظور توصيف ژنومها ايجاد
كردهاند؛ ناشران داراي يك قالب ابردادهاي ميباشند كه انتقال دادههاي مربوط به
قيمت
و
تبليغات براي خردهفروشان را تسهيل ميكند. چه اتفاقي در دنياي فناوري در حال
شكلگيري است كه همگان را به اين باور رهنمون ساخته است كه: پاسخ، همان ابرداده
است؟ اگر ابرداده پاسخ باشد، پس پرسش كدام است و آن براي كتابخانهها و فهرستهاي
كتابخانهاي چه معنايي دارد؟
2. تعريف ابرداده
ابتدا بايد مشخص كنيم
كه منظور ما از ابرداده چيست. تعريف رايج اين است كه ابرداده «دادههايي در باره
دادهها» ميباشد. اين تعريف ساده است، اما به فهم اينكه ابرداده كاملاً درباره
چيست چندان كمكي نميكند. آنچه كه متعاقباً خواهد آمد سادگي كمتري دارد، ولي درك
ابرداده را براي ما ميسر ميسازد. اول اينكه، ابرداده همان اطلاعات مصنوع[3]
است، بدين معنا كه ابرداده ابداع آدمي است و در طبيعت يافت نميشود. استفاده از طول
و عرض جغرافيايي به منظور توصيف زمين و نقاط روي آن، مثالي مناسب از اطلاعات مصنوع
ميباشد. گرچه امروزه كاملاً به ديدن نقشهها و منحنيهاي روي آن عادت كردهايم،
اما يك سياره واقعي مسلماً فاقد خطوط پيراموني است؛ ولي ابداع طول و عرض جغرافيايي
اين امكان را ميسر مينمايد تا درباره مكانهاي روي سياره بحث كنيم و بدون داشتن
علائم راهنما در مناطق وسيع كنكاش نماييم.
اين نكته ما را به
دومين ويژگي لازم ابرداده رهنمون ميسازد: ابرداده توسط افراد براي نيل به يک هدف
يا يک عملکرد خاص ايجاد شده است. بنابراين نقشه يک سيستم مترو که به رانندگان داده
ميشود، شامل رمزهاي رنگي مسيرها و نمادهايي است که بهمنظور راهنمايي آنان در
مسيرهاي پرپيچ و خم و نقاط تردد مورد استفاده قرار ميگيرد. اين نقشه غالباً به
ندرت نمايانگر مقياس واقعي و جغرافياي شهري است که داراي مترو بوده، اما کاملاً
مفيد ميباشد، زيرا به جاي تاكيد بر دقت جغرافيايي، با محوريت متروگرايانه به مسئله
ميپردازد. نقشه راههاي همان ناحيه، ازنظر جغرافيايي صحيحتر خواهد بود؛ اما
چنانچه اين نقشه توسط يک هيئت گردشگري طراحي شده باشد، در آن هتلها، موزهها،
نقاط ديدني، و امکانات پارکينگ برجستهنمايي خواهند شد. نقشه ناحيهاي که توسط
باشگاه پيادهروي استفاده ميشود بر راهنماهاي طبيعي و ريختشناسي آن ناحيه تأکيد
خواهد داشت. همان طور که فقط يك نوع نقشه واحد وجود ندارد که برطرفکننده همه
نيازها باشد، هيچ نوع واحدي از ابرداده براي مدارک يا ديگر اشياي اطلاعاتي نيز
وجود ندارد. دليلش هم اين است که اين خود شيء نيست که ابرداده را تعيين ميکند،
بلکه نيازها و اهداف افرادي که آن را ايجاد ميكنند و آنهايي که از آن استفاده
خواهند كرد تعيينكننده نوع ابرداده آن خواهد بود. بدون اينکه بيش از حد دشوارگويي
كنيم، تنها كافي است بگوييم كه ابرداده، جهان نيست، بلکه نحوه نگاه ما به جهان در
يک لحظه زماني با منظوري خاص است.
ابرداده همچنين غالباً
همچون جانشيني[4]
براي شيء واقعي است. در يك فهرست کتابخانهاي، مدخلها جانشيني براي کتب موجود در
قفسهها ميباشند. در حاليکه براي کاربران کتابخانه، نگاه کردن به هر کتاب به
منظور تعيين کتابي كه ميخواهند دشوار خواهد بود، اما دستكم اين است که کتاب به
صورت فيزيکي خود در آنجا هست. در محيط رقومي، نقش جانشيني ابرداده، نقشي کليدي است،
زيرا بسياري از منابع به راحتي قابل مرور نيستند و برخي ديگر حامل دادههاي روشن
در باره خود نيستند. افزايش علاقه به ابرداده، قسمتي از تلاش در جهت سازماندهي جهان
نسبتاً بينظم منابع رقومي، و فراهمآوري خدمات و دسترسي در مکاني است که قبلاً
وجود نداشته. همچنين روشي براي تبادل دادهها بين ذخاير ناهمگن منابع، و براي
تأمين امکان کاوش در انبارهاي رقومي است.
3. «اكسامال»[5]
و «آردياف»[6]
«اكسامال» و
«آردياف» دو سرنامي هستند که هر جا سخني از ابرداده پيش آيد، متوجه خواهيد شد که
از اين دو نيز نام برده ميشود. «اكسامال» زبان نشانهگذاري گسترشپذير (2) و
«آردياف»، چارچوب توصيف منبع (3) است. برخي طوري در مورد اين دو صحبت ميکنند که
گويي اينها خود، قالبهاي ابردادهاي هستند، اما اين امر نوعي اغتشاش بين فرم و
محتوا است. «اكسامال» و «آردياف» در واقع قالبهاي دادهاي عمومي هستند که
ميتوانند کاربردهاي زيادي داشته باشند؛ خصوصاً «اكسامال» كه غالباً به عنوان
نوعي قالب مدرک مورد استفاده قرار ميگيرد و قالب وسيعتري است که «اچتيامال» از
آن مشتق شده است.
چنانچه با ساختار
ركوردي «اكسامال» آشنا نباشيد، ممكن است براي شما كاملاً پيچيده و مرموز بهنظر
برسد. هرچند به وسيله آن ميتوان ركوردهاي پيچيده ابردادهاي ايجاد كرد، اما شكل
اساسي آن بسيار ساده است. اگر به ركورد مارك بهعنوان ركورد حاوي فيلدهاي برچسبدار
بنگريد، مانند استفاده از «245» به جاي «عنوان»:
245 $a Hamlet, Prince of Denmark
در اين صورت «اكسامال» نيز يك روش ديگر براي برچسبزني يك قطعه از دادهها است، گرچه برگذاردن يك برچسب آغازين و يك برچسب پاياني (با يك "/" قبل از نام برچسب) حول هر عنصر دادهاي تأكيد دارد:
<title>Hamlet, Prince of Denmark</title>
برچسبها، مادامي كه آنها را از قبل و در يك ساختار مشخص با فرمت دادهاي تعريف كنيد، ميتوانند هر چيزي كه شما دوست داريد باشند. پس، بسته به ترجيح شما، تعريفتان ميتواند داراي هر يك از اينها بهجاي يك عنوان باشد:
<245>Hamlet,
Prince of Denmark</245>
<ti>hamlet,
prince of Denmark</ti>
«اكسامال» نيز مانند
برچسبها و فيلدهاي فرعي مارك[7]
ذاتاً سلسلهمراتبي است. رجحان آن بر مارك 21 ايناست كه برخلاف مارك 21 كه داراي
دو سطحـ برچسب و فيلد فرعيـ است، بسته به نياز ميتواند سطوح سلسلهمراتبي بسياري
داشته باشد. در «اكسامال» سلسلهمراتب بمانند عروسكهاي روسي در هر چند سطح كه
مورد نياز باشد «آشيان» ميكنند.
«چارچوب توصيف منبع»
(آردياف) يكي دو مرحله فراتر از «اكسامال» است. «آردياف» بر روابط بين عناصر
دادهاي تاكيد دارد. يك رابطه كليدي در آردياف «درباره» است كه در آن، يك منبع
وبي، هدف گزاره «آردياف» است، و ديگر فيلدهاي موجود در گزاره درباره منبع هستند.
اين سادهترين حالت است. آردياف ميتواند از رابطههايي همچون:
subClassOf
subPropertyOf
member
isDefinedby
و... نيز استفاده كند. «آردياف» جزء لازم اقدامي است كه «وب معنايي» (4) نام گرفته، كه اقدام «كنسرسيوم وب جهاني» در راستاي افزودن يك جزء معنايي بهمنظور بهاشتراكگذاري دادهها در اينترنت ميباشد. «آردياف» پيچيدهتر و كماستعمالتر از «اكسامال» است، و هنوز مشخص نيست كه آيا به عنوان يك زبان عمومي در توصيف دنياي وب مثمرثمر، موفق گردد. قطعاً چنين بهنظر ميرسد كه «آردياف» نسبت به «اكسامال» مستلزم درك عميقتري از برخي مفاهيم فلسفي ميباشد و تعداد افرادي كه آن را ذاتاً گيجكننده مييابند (و من در آن گروه قرار دارم) بسيار بيشتر از آنهايي است كه به آن بهعنوان يك راه حل مينگرند. (مثال موجود در زير يك ركورد «كريتيو كامنز»[8] است كه از يك فرمت ساده آردياف استفاده ميكند.)
4. ابرداده براي
اشياي شبهمدرك
ما به عنوان کتابدار
ابتدائاً با ابرداده براي مدارک و اشياي شبهمدرک کار ميكنيم، گرچه با درنظرگرفتن
خط كاريمان ميتوانيم از عهده ذخيرهسازي، سازماندهي و فراهمآوري خدمات در حيطه
ديگر انواع ابردادهاي از قبيل ابرداده علمي نيز برآييم. اما اين مقاله بر
ابردادهاي تمرکز دارد که مدارک را توصيف ميکند و سؤال اصلي هم اين است که فرق
اين ابرداده با فهرستنويسي کتابخانهاي چيست؟ به خاطر داشته باشيد که فرمتهاي
ابردادهاي معرفيشده در اين مقاله (هسته دابلين[9]
،«مدز»[10]
، و «متس»[11])
تنها سه فرمت از چندين فرمت مورد استفاده امروزي، اما رايجترين فرمتهاي
مورداستفاده در کتابخانههاي رقومي هستند.
بدون شک فهرستنويسي
کتابخانهاي جزء جداييناپذير ابرداده مدرک است و ميتوان منشأ آن را اواسط دهه
1800ميلادي با قواعد «جيووت»[12]
و «پانيتزي»[13]
دانست.
فهرستنويسي تقريباً براي هر فرد داراي تحصيلات متوسطه در جهان انگلوامريکايي
شناختهشده است. بطور کلي نمونههاي فهرستنويسي کتابخانهاي عمدتاً همه
طرحوارههاي ابردادهاي که براي کتاب (گرچه نه الزاماً براي مقالات مجلات) بهکار
ميروند را شامل ميشوند. در عين حال، هنگامي که سازندگان برنامههاي کاربردي
اينترنتي براي مدارک پيوسته به ابرداده نياز داشتند، از استاندارد کتابخانهاي
استفاده نكردند. در واقع استاندارد ابردادهاي مدرک که غالباً در برنامههاي
کاربردي غيرکتابخانهاي مورد استفاده قرار ميگيرد «هسته دابلين» (دابلين کور)
است. براي فهم دليل اين امر بايد به اهدافش بنگريم.
5. هسته دابلين
بهخاطر اينکه کلمه
«دابلين» در عبارت «هسته دابلين» به شهر «دابلين» ايالت اوهايو که مقر «اُسيالسي»[14]
است اشاره دارد، و چون اُسيالسي سازمان حامي هسته دابلين است، شايد چنين تصور شود
که هسته دابلين برآمده از سنت کتابخانهاي است. در واقع تلاش زيادي براي متمايز
کردن هسته دابلين از سنت کتابخانهاي شده است، و تا حدود زيادي نيز موفقيتآميز
بوده. هدف هسته دابلين ايجاد مجموعهاي ساده از عناصر دادهاي به منظور توصيف
مدارک و ساير اشياي موجود در اينترنت ميباشد و قرار بود آنقدر ساده باشد که هر
فردي بتواند براي مدارک خودش ركوردي ايجاد كند. هسته دابلين داراي 15 عنصر «هسته»
(5) است که با استفاده از برخي بيانگرها ميتوان جزئيات بيشتري به آنها افزود.
عناصر هسته بسيار كلي هستند؛ از اين رو، هسته بهجاي «مؤلف»[15]
داراي «پديدآور»[16]
است، و پديدآور ممكن است شامل مؤلف يا آهنگساز و... شود. من ميتوانم براحتي براي
هر چيزي يك ركورد هسته دابلين ايجاد كنم، حتي براي همين مقالهاي كه هنوز به پايان
نرساندهام:
creator = Karen Coyle
title = Understanding Metadata and
its Purpose
date= December, 2004
description = the first draft of an
article for journal of Academic Librarianship
subject = metadata
type = text
اميد ميرفت كه با
هسته دابلين، مدارک اينترنتي حامل توصيفهاي کتابشناختي خود باشند و از اينرو
عناصر دادهاي را براي اطلاعاتي از قبيل مؤلف, عنوان, و تاريخ، کدگذاري نمايند. از
يك نظر، اين عمل بيانگر يك ديدگاه شديداً کتابدارانه است، زيرا معتقد است كه هسته
دابلين بايد امکان يافتن مدارک از طريق مؤلف يا عنوان را فراهم نمايد. امروزه از
هسته دابلين در اينترنت استفاده بسيار زيادي ميشود، هر چند اين استفاده منتهي به
ايجاد فهرستي از منابع اينترنتي نشده است. در عوض هسته دابلين تبديل به ابرداده
توصيف مدرک براي انواع برنامههاي کاربردي مبتني بر وب شده است. مجوز «كريتيو
كامنز» نمونهاي از اين نوع ميباشد.
«كريتيو كامنز» (6) هم
يک خدمت وب است و هم نوعي جنبش اجتماعي، كه توسط «لري لسيگ»[17]
استاد
حقوق استانفورد ايجاد شد که به خاطر انتقاد به تقويت قانون حق مؤلف به بهاي حق عموم
در استفاده و بازاستفاده[18]
از
ايدههاي پيشينيان، مشهور است (7). با هدف مجابکردن مؤلفان به صدور اجازه استفاده
از آثارشان، مجموعه کوچکي از مجوزها ايجاد شد كه براحتي به فايلهاي اينترنتي
ضميمه شوند. اين مجوزها بيانگر اجازه استفاده و بازاستفاده از آثار هستند و به
وسيله مؤلفشان اعطا شدهاند. علاوه بر اين مجوز، نرمافزار «كريتيو كامنز» به مؤلف
امكان ميدهد كه بخش کوچکي از آنچه را كتابداران، ابرداده «توصيفي» مينامند نيز
اضافه كند: مؤلف، عنوان، تاريخ، و توصيف کوتاهي از منبع. در اينها نيز از عناصر
توصيفي دادهاي هسته دابلين- يعني پديدآور، عنوان، و تاريخ- استفاده شده (که در
ركورد به صورت
“dc:creator,” “dc:title,”
و غيره رمزگذاري ميشوند) (تصوير 1).
تصوير 1 «مجوز كريتيو كامنز» كه در آن، عناصر ابردادهاي هسته دابلين بهصورت پررنگ نشان داده شدهاند.
|
<!--/Creative Commons License--> <!-- <rdf:RDF xmlns="http://web.resource.org/cc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"> <Work rdf:about=""> <dc:title>Metadata:Data with a Purpose</dc:title> <dc:date>2004</dc:date> <dc:description>A general discussion of document/resource metadata and some related uses.</dc:description> <dc:creator><Agent> <dc:title>Karen Coyle</dc:title> </Agent></dc: creator> <dc:rights><Agent> <dc:title>Karen Coyle</dc:title> </Agent></dc: rights> <dc:type rdf: resource= "http://purl.org/dc/dcmitype/Text"/> <dc:source rdf: resource= "http://www.kcoyle.net/metapurpose.html"/> <license rdf: resource= "http://creativecommons.org/licenses/by-nc-nd/2.0"/> </Work> <License rdf: about= "http://creativecommons.org/licenses/by-nc-nd/2.0"/> <permits rdf: resource= "http://web.resource.org/cc/Reproduction"/> <permits rdf: resource= "http://web.resource.org/cc/Distribution"/> <requires rdf: resource= "http://web.resource.org/cc/Notice"/> <requires rdf: resource= "http://web.resource.org/cc/Attribution"/> <prohibits rdf: resource= "http://web.resource.org/cc/CommercialUse"/> </License> </rdf:RDF> |
استفاده از «مجوز
كريتيو كامنز» مستلزم هيچ نوع آگاهي از قوانين يا قراردادهاي حق مؤلف نيست و عناصر
توصيفي، همان عناصري هستند که اكثر افراد ميتوانند به سادگي آنها را درك كنند. در
اين مفهوم، هسته دابلين با ايجاد هستهاي از عناصر توصيفي که بتوان در برنامههاي
مختلف کاربردي وبي گنجاند، به هدف خود رسيده است.
يکي از چيزهايي که
استفاده از هسته دابلين را براي همه تسهيل ميكند، فقدان الزام به هرگونه قوانين
فهرستنويسي است. اين چيزي است که با مشرب فهرستنويسي کتابخانهاي مغايرت دارد و
پرواضح است كه باز-استفادهپذيري از محتويات ركوردهاي هسته دابلين را کاهش ميدهد.
در استاندارد هسته دابلين توصيفاتي براي هر يك از عناصر دادهاي وجود دارد؛
بنابراين مفهوم عنصر دادهاي به طور كلي تعريف شده است. اما وقتي ميگوييم
“creator=Karen Coyle.”
همانقدر درست است که بگوييم
“creator=Coyle, Karen.”
اما مزيت آن در اين است که احتمال استفاده از هسته دابلين براي تعدادي از جوامع و فرهنگهاي مختلف وجود دارد؛ اشكال آشكار آن در اين است که محتواي فيلدها در برنامههاي کاربردي يكسان نيست، و اين امر مشکل ميانکنشپذيري را به وجود ميآورد.
6. «مُدز»: مارک
ملايمتر و مهربانتر
فرمت مارک براي
کدگذاري اطلاعات کتابشناختي، ركورد بسيار پيچيدهاي است كه در جهان کتابداري
کاملاً شناخته شده و در سامانههاي كتابخانهاي ايالات متحده، کانادا، و ديگر
کشورها، خصوصاً در كشورهاي انگليسي زبان، از آن حمايت ميشود. در محيط شبکهاي که
ابرداده توصيفي را ميتوان در بين سيستمها انتقال داد و در/با ديگر انواع ابرداده
تلفيق كرد، استفاده از ركوردهاي مارک براي چنين هدفي ايدهآل بهنظر ميرسد. اما
مشکل مارک اين است که اين تلفيق و گنجاندن عموماً مستلزم استفاده از ساختار
دادهاي «اكسامال» است، در حالي كه مارک يک ركورد «اكسامال» نيست. کتابخانه
کنگره روشي براي تبديل ركورد مارک به «اكسامال» ايجاد نموده، اما اين روش
طرفداران چنداني پيدا نکرده و علتش هم شايد موجه باشد: ركورد مارک بزرگتر و
مفصلتر از چيزي است که اکثر سامانهها به آن نياز دارند و استفاده آن از برچسبهاي
عددي و کدهاي فيلد فرعي، فهم آن را بدون آموزش قابل توجه مشکل ميسازد. بنابراين،
نياز به نسخهاي ملايمتر و مهربانتر از مارک که بتواند عناصر دادهاي کليدي يك
ركورد مارک را بپذيرد و آنها را به قالبي آسان- فهم از «اكسامال» انتقال دهد
احساس ميشد. از اينرو« استاندارد ابردادهاي توصيف شيء»[19]
(«مُدز») متولد شد.در «مُدز» بهجاي
برچسبهاي سهرقمي و كدهاي فيلد فرعي مارك، از برچسبهاي انسان-فهم (يعني "title"
بهجاي"245"
)
استفاده ميشود. «مُدز» اكثر عناصر دادهاي فيلدهاي ثابت، به استثناي كدهاي قالب
فيزيكي (از 007)
و
بسياري از كدهاي نوع[20]
(از 008) را ناديده ميانگارد. همچنين
سودمنديها و نوآوريهاي جديدي نيز در خود دارد. «مُدز» ساختاري به اسم «نام» تعريف
مي كند كه نمايانگر فيلدها و فيلدهاي فرعي مربوط به نامهاي شخصي و تنالگاني و
مربوط به كنفرانسها است. اين ساختار ميتواند هر جا كه نامها ظاهر ميشوند، چه به
عنوان مدخلهاي اصلي، و چه شناسههاي افزوده، يا موضوعها مورد استفاده قرار گيرد.
بنابراين، با يك فيلد نام مثل:
<name
type=”personal”>
<namePart>Shakespear,
Williame</namePart>
<namePart
type=”date”>1564-1616</namePart>
</name>
ميتوان به عنوان يك فيلد مؤلف استفاده كرد، يا ميتواند بخشي از يك سرعنوان موضوعي باشد:
<subject authority=”lcsh”>
<name type=”personal”>
<namePart>Shakespeare, William</namePart>
<namePart type=”date”>1564-1616</namePart>
</name>
<topic>Bibliography</topic>
<topic>Periodicals</topic>
</subject>
«مُدز» گرچه از مارك 21 مشتق شده و بسيار مفصلتر از هسته دابلين است، اما قواعدش بهمراتب كمتر از مارك 21 ميباشد. در«مُدز» نيز مانند هسته دابلين هيچ فيلد لازمي وجود ندارد و همه فيلدها تكرارپذير هستند. «مُدز» حاوي بسياري از مزاياي مارك است، ولي تفاوتهاي اساسي نيز با مارك 21 دارد: اصلاً مفاهيم «شناسه اصلي» يا «شناسه افزوده» ندارد و همه مؤلفان فقط مؤلف هستند؛ و هر ركورد ممكن است داراي عناوين متعدد، و بدون يك «عنوان اصلي» باشد. هنگامي كه ركوردهاي مارك 21 به «مُدز» تبديل ميشوند، ركوردي در قالب «اكسامال» به دست ميآوريد كه نوعي “MARC-lite” ميباشد. ركوردهاي «مُدز» را ميتوان از ابردادههاي كتابشناختي كه در اصل بهعنوان فهرستنويسي كتابخانهاي توليد نشدهاند- از قبيل استنادات مقالهاي- نيز به وجود آورد؛ و غالباً در پايگاههاي اطلاعاتي كه داراي تركيبي از فهرستنويسي كتابخانهاي و ديگر دادههاي كتابشناختي هستند استفاده ميشود.
7. «مِتس»: ابرداده
به مثابه ساختار
نوعي ابرداده مدرك
وجود دارد كه هدف از آن، «توصيف»ـ به معنايي كه در فهرستنويسي داردـ نيست. فرمت
ابردادهاي كه بهوسيله كتابخانهها و آرشيوهاي رقومي استفاده ميشود و «استاندارد
ابردادهاي كدگذاري و ارسال»[21]
(مِتس) (8) نام دارد، مثالي از اين نوع ميباشد. «مِتس» به نقش اين استاندارد
بهعنوان «لفاف»[22]
اشاره
دارد و بهمنظور كنارهم نگهداشتن فايلهايي كه يك شيء رقومي را ميسازند بهوجود
آمده است. مدارك رقومي بر خلاف يك كتاب صحافيشده، غالباً از تعدادي فايلهاي مجزا
كه نشاندهنده صفحات يا ديگر واحدهاي آن مدرك هستند بهوجود ميآيند. و بر خلاف يك
كتاب فيزيكي، هيچ جلد يا صفحه عنوان مرئي ندارند، و كسي نميتواند صفحات را ورق
بزند تا به مكان مشخصي در كتاب برسد. به «مِتس» بهمثابه صحافي، جلد، و محمل گروهي
از فايلهاي رقومي بنگريد، كه شامل اطلاعات فني كه براي مديريت و فهم آن فايل مورد
نياز هستند- از قبيل قالبهاي فايل، فناوري مورد استفاده در اسكن (چنانچه منشأ آن
فايل از كاغذ آغاز شده باشد)، و استحالهها و فشردهسازيهاي رقومي كه بر روي
فايلها مورد استفاده قرار گرفتهاند نيز ميشود. چيزي كه در «مِتس» تعريف نشده،
ابرداده توصيفي است. در عوض، كساني كه ركوردهاي «مِتس» را ايجاد ميكنند اين امكان
را دارند كه هر نوع ابرداده توصيفي را كه براي استفاده با آن مواد ميپسندند، در
آن بگنجانند. اين نكته يكي از ويژگيهاي مهم جهان ابردادهاي را نشان ميدهد، كه در
مثال «كريتيو كامنز» نيز قابل مشاهده است: ابرداده بهجاي اينكه دوباره ابداع شود
ميتواند مورد بازاستفاده قرار گيرد. ركوردهاي «مِتس» معمولاً حامل ابردادههاي
توصيفي موجود در هسته دابلين يا «مُدز» هستند.
8. ابرداده و
فهرستنويسي كتابخانهاي
به طور كلي، اينها چه
ربطي به فهرستنويسي كتابخانهاي دارند و مهمتر از همه آيا ابرداده جاي
فهرستنويسي را خواهد گرفت؟ پيشتر گفته شد كه يكي از مهمترين مشكلات در ركوردهاي
هسته دابلين، نبود قواعد فهرستنويسي است و به همين دليل پيشبينيپذيري اندكي بين
جوامع يا پروژهها، از نظر محتواي فيلدها وجود دارد. چيزي كه فهرستنويسي و
فهرستهاي كتابخانهاي فراهم ميكنند، درجه بالاي مطابقت در دادههاي ضبطشده در
ركوردها است. اين انطباق، خدمتي براي كاربران است تا بتوانند به راحتي از
كتابخانهاي به كتابخانه ديگر بروند. اما مهمترين ارزش اين انطباق، ايجاد توانايي
فهرستنويسي تعاوني و تبادل ركوردهاي فهرستنويسي بين كتابخانهها و سامانههاي
كتابخانهاي است. همچنين به فروشندگان سامانههاي كتابخانهاي اين امكان را
ميدهد كه محصولي توليد كنند كه در هر كتابخانهاي قابل استفاده باشد، درست مثل
فهرستبرگه استاندارد كه براي هر كشوي فهرستبرگهاي، مناسب است.
كارآييهايي كه از اين
انطباق منتج ميشوند بسيار زيادند و جامعه كتابداري در فهرستنويسي مواد اوليهاش
به آنها چشم دارد. ولي همراه با حركت كتابخانهها به سمت سازماندهي مواد داراي
قالبهاي جديد، نه قواعد فهرستنويسي و نه سامانههاي كتابخانهاي نميتوانند
راهحلهاي عملي ارائه نمايند. فرض كنيد آرشيوي از عكسهاي شهرتان كه متعلق به
اوايل قرن 20 است در اختيار داريد و ميخواهيد آن را بر روي وب در دسترس همگان قرار
دهيد. و فرض كنيم كه تعداد آنها حدود هزار عدد است. شما هيچ گونه اطلاعاتي درباره
عكاس و تاريخ عكسبرداري اكثر آنها نداريد. فردي قبلاً با مداد بر پشت آنها چيزي
درباره تصوير نوشته است، مثلاً «خيابان اصلي، حدود 1910». فهرستنويسي و توليد
ركوردهاي مارك 21 از اين عكسها بسيار وقتگير، و ركوردهاي حاصله نيز حاوي اطلاعات
اندكي خواهد بود. در عوض ميتوانيد يك ركورد هسته دابلين ايجاد كنيد كه فقط داراي
اطلاعات زير است:
date=
حدود 1910
description=
خيابان اصلي
گرچه ركوردهايي نظير
ركورد مذكور ممكن است از اهداف فناوريهاي ابركاوش (كه به هر كاوش اجازه ميدهند در
پايگاههاي اطلاعاتي با فرمتهاي مختلف ابردادهاي مورد جستجو قرار گيرند) باشند،
ولي اين ركورد را نميتوانيد به فهرست پيوسته خود وارد كنيد. مهمترين مزيت در
اينجا اين است كه اين ركوردها را ميتوان با سرعت و راحتي هر چه تمامتر بهوسيله
كارمندان كتابخانه و با حداقل آموزش ايجاد نمود؛ و بنابراين برخي ابردادهها را
ميتوان براي منابعي ايجاد نمود كه در غير اينصورت، هيچ ميشدند.
ابردادهاي نظير هسته
دابلين فاقد سطحي مناسب از پيشبينيپذيري است تا امكان بازاستفاده وسيع و نظاممند
از ركوردها را فراهم نمايد. در واقع اين فرمتهاي ابردادهاي و ديگر فرمتهاي
دادهاي كه از آنها استفاده ميكنند، غالباً در سامانههايي تككاره و مستقل مورد
استفاده قرار ميگيرند. هنگامي كه اين سامانههاي تككاره شروع به تبادل دادهها
نمايند، درست مثل كتابخانهها كه اين كار را در اواخر قرن 19 آغاز كردند، سازندگان
ممكن است به اين نتيجه برسند كه: اين محتواي ركوردهاي ابردادهاي است كه باعث
تفاوت يك راهحل تكسامانهاي با يك جهان منسجم كتابشناختي ميشود، نه ساختار
ركوردي آنها. به عبارت ديگر ممكن است روزي شاهد باشيم كه ابرداده رشد كند و تبديل
به فهرستنويسي شود.
9. يادداشتها و
منابع
1)
اين كنايه را هم به «تام دلسي»[23]
كارشناس كتابخانه ملي كانادا («ابرداده: فهرستنويسي براي همه»، و هم به «مايكل
گورمن»[24]
(«...
ابرداده فهرستنويسي بهوسيله همه است») نسبت ميدهند.
2)
استانداردهاي «اكسامال» توسط كنسرسيوم وب جهانگستر (قابل دسترسي
در
www.w3.org/XML/)
تعيين شده است، اما بسياري از استانداردهاي برنامههاي كاربردي «اكسامال» نيز
توسط ساير گروهها نظير «گروه استانداردهاي تجارت الكترونيكي»
(OASIS)
به وجود آمده اند (http://www.oasis-open.org/).
3) http://www.w3.org/RDF/
4) http://www.w3.org/2001/sw/
5) پانزده عنصر دابلين كور عبارتاند از: همكار، دامنه پوشش، پديدآور، تاريخ، توصيف، قالب، شناساگر، زبان، ناشر، وابستگي، حقوق، منبع، موضوع، عنوان، و نوع رسانه. براي كسب اطلاعات بيشتر به http://dublincore.org مراجعه كنيد.
6) http://www.creativecommons.org
7) «لاورنس لسيگ»[25] مولف آثار زير مي باشد:
Code and other laws of cyberspace (New York: Basic Books, c1999); The future of ideas: the fate of the commons in a connected world (New York: Random House, 2001); Free culture: how big media uses technology and the law to lock down culture and control creativity (New York: Penguin Press, 2004).
8) http://www.loc.gov/standards/mets/
پينوشتها
[1]. Karen Coyle. 2005.
Understanding Metadata and Its Purpose. The Journal
of Academaic Librarianship 31(2): 160-63.
[2]. HTML (Hypertext Markup Language).
[3].constructed information
[4].surrogate
[5].XML (eXtensible Markup Language)
[6].RDF (Resource Description Framework)
[7].
MARC (Machine Readable Catalog)
[8].Creative
Commons
يك سازمان غيرانتفاعي كه متعهد به گسترش طيف آثار خلاقهاي است كه بهصورت قانوني در دسترس همگان هستند. اين سازمان چندين مجوز حق تكثير (كپيرايت) منتشر كرده كه Creative Commons Licenses نام دارند.
[9]. Dublin
Core
[10]. Metadataa
Object Description Standard (MODS)
[11].
Metadata Encoding and Transmission Standard (METS)
[12].
Jewett
[13].
Panizzi
[14].
OCLC
[15].
author
[16].
creator
[17].
Larry Lessig
[18].
Re-use
[19].
Metadata Object Description Standard
[20]. genre
[21].
Metadata Encoding and Transmission Standard
[22]. wrapper
[23]. Tom
Delsey
[24]. Michael
Gorman
[25] . Lawrence
Lessig