طراحی سامانه نیمه خودکار ساخت هستی‌شناسی به کمک تحلیل هم‌رخدادی واژگان و روش C-value (مطالعه موردی: حوزه علم‌سنجی ایران)

چکیده

هستی‌شناسی‌ها ابزار بیان رسمی مفاهیم و روابط موجود در قلمرویی خاص هستند. در سال‌های اخیر تلاش‌های زیادی برای طراحی روش‌های یادگیری و خودکارسازی فرایند ساخت هستی‌شناسی انجام شده است. از آنجا که هستی‌شناسی را مجموعه مفاهیم و روابط آن می‌دانیم، استخراج مفاهیم و روابط معنایی میان این مفاهیم از اهمیت بسیاری برخودار است. ساخت انواع هستی‌شناسی برای انواع قلمروها و کاربردهای گوناگون، فرایندی پرهزینه و زمان‌بر بوده و خودکارسازی این فرایند، گام مهمی در رفع آن است. عدم وجود دانش پایه مانند اصطلاح‌نامه‌ها یا پایگاه‌های دانش حوزه‌ها، اکتساب دانش برای ساخت هستی‌شناسی آن حوزه‌ها مشکل خواهد بود. در پژوهش حاضر روشی نیمه خودکاری برای اکتساب دانش در حوزه علم‏‌سنجی ایران ارائه شده که قادر است اطلاعات این حوزه را استخراج کرده و در فرایندی، دانش موجود را برای ساخت هستی‌شناسی آن پردازش کند. بدین منظور ابتدا اسناد مرتبط با حوزه مورد نظر گردآوری شده و به روش متن‌کاوی، نمایه‌سازی خودکار گردید. سپس در مرحله بعدی با استفاده از روش C-value مفاهیم اصلی، استخراج شده است، آنگاه با استفاده از روش خوشه بندی k- means، اسناد مربوطه، خوشه‌‌بندی شدند و برای هر خوشه با محاسبه وزن مفاهیم، بر اساس روش TF-IDF، مفاهیم کلیدی مناسب استخراج گردید. در پایان با استفاده از روش تحلیل هم‌رخدادی واژگان، سلسله مراتب مفاهیم حوزه، استخراج شده و هستی‌شناسی مربوطه ساخته شده است. نتایج به دست آمده، نشان می‌دهند که این روش در مقایسه با روش‌های مشابه دقت بسیاری در یادگیری ساخت هستی‌شناسی داشته است.

استناد: 

احمدی، حمید، فریده عصاره، ملوک‌السادات حسینی بهشتی، غلام‌رضا حیدری. ۱۳۹۶. طراحی سامانه نیمه خودکار ساخت هستی‌شناسی به کمک تحلیل هم‌رخدادی واژگان و روش C-value (مطالعه موردی: حوزه علم‌سنجی ایران). پژوهشنامه پردازش و مدیریت اطلاعات ۳۳ (۱): ۱۸۷-۲۱۸.

مقاله ادواری علمی
دوره انتشار: 
وضعیت انتشار: 

افزودن دیدگاه