ارائه یک ماژول نرم‌افزاری در راستای ایجاد شبکه استنادی پارساهای موجود در پایگاه اطلاعات علمی ایران (گنج)

چکیده

پایگاه اطلاعات علمی ایران (گنج) از مهم‌ترین منابع علمی زبان فارسی بوده که توسط پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک) توسعه یافته و دربرگیرنده اغلب پارساهای خاتمه‌یافته پژوهشگران ایرانی است. با توجه به حجم این پایگاه و غیرممکن بودن ساخت سنتی (دستی) شبکه استنادی متناظر با آن، در این پژوهش یک ماژول نرم‌افزاری در راستای ایجاد خودکار شبکه استنادی منابع این پایگاه علمی ارائه می‌دهیم. مراحل در نظر گرفته شده در ماژول نرم‌افزاری موردنظر به شرح زیر است: در مرحله نخست، تمام‌متن پارساها، که می‌توانند در قالب فرمت‌های خروجی استاندارد word ،latex یا open office باشند، به عنوان ورودی دریافت می‌شود؛ در مرحله دوم، بخش مراجع تمام‌متن‌های دریافتی مشخص شده و جداسازی رشته‌های مرجع هر بخش انجام می‌شود؛ در مرحله سوم، نوع هر رشته مرجع (در زبان‌های فارسی یا انگلیسی) تعیین می‌شود؛ در مرحله چهارم، مولفه‌های سازنده هر رشته مرجع (در زبان‌های فارسی یا انگلیسی) استخراج می‌شود؛ در مرحله پنجم، با اتکا به فرایند‌هایی طراحی شده در این ماژول نرم‌افزاری جهت تشخیص هم‌سانی رشته‌های مرجع و مولفه‌های آن‌ها، شبکه استنادی منابع ورودی ایجاد می‌شود؛ در نهایت، در مرحله هفتم، شبکه ایجاد شده در قالب Json قرار گرفته و خروجی داده می‌شود. پس از پیاده‌سازی ماژول نرم‌افزاری موردنظر، کیفیت آن را با انجام مجموعه‌ای از آزمایش‌ها بر روی مجموعه داده‌ای طراحی شده با این هدف بررسی خواهیم کرد.

دسته‌بندی موضوعی: 
استناد: 

پاک‌نیت، نصراله، و جلال‌الدین نصیری. زودآیند. ارائه یک ماژول نرم‌افزاری در راستای ایجاد شبکه استنادی پارساهای موجود در پایگاه اطلاعات علمی ایران (گنج). تهران: پژوهشگاه علوم و فناوری اطلاعات ایران.

افزودن دیدگاه