طراحی روشی هوشمند برای دسته‌بندی نوشتارهای علمی فارسی

چکیده

با توجه به حجم بالای متون علمی و سرعت پایین کنترل اقلام اطلاعاتی‏ در سامانه ثبت و در نتیجه عدم نمایش به روز درگنج، افزایش سرعت کنترل اقلام اطلاعاتی از موارد اولویت‌دار سامانه ثبت است. به عنوان مثال حدود ۱۴۰ هزار متون علمی همچنان نمایه نشده و با توجه به سیل پایان‌نامه‌های جدید، استفاده از روش‌هایی که می‌تواند کمکی به افزایش سرعت نمایه‌سازی کنند از اولویت‌های سامانه ثبت می‌باشد.

استخراج و تایید اقلام اطلاعاتی پایان نامه‌ها که به آن فراداده نیز گفته می‌شود از وظایف نمایه‌ساز می‌باشد. در صورتی­که بتوان کنترل، ورود یا تایید فراداده را بوسیله ماشین انجام داد سرعت کنترل اقلام اطلاعاتی بهتر خواهد گردید. پایان‌نامه و رساله‌هایی که در پایگاه داده ثبت پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک) ثبت می‌گردد دارای فراداده موضوع اصلی مانند علوم انسانی، فنی و مهندسی، علوم پایه، هنر ومعماری، علوم پزشکی و غیره می‌باشند. استخراج هوشمند حوزه پارساها بوسیله الگوریتم‌های یادگیری ماشین باعث افزایش سرعت فرایند نمایه‌سازی و افزایش کیفیت داده‌های پایگاه داده گنج شود.

در این طرح پژوهشی هدف دسته‌بندی هوشمند محتوایی متون به یکی از ۵ دسته موضوع اصلی علوم انسانی، فنی و مهندسی، علوم پایه، هنر ومعماری، علوم پزشکی می‌باشد. به عبارت دیگر افزایش سرعت نمایه‌سازی بوسیله خودکارسازی تایید یا عدم تایید موضوع اصلی ثبت شده از طرف پژوهشگر می‌باشد.

دسته‌بندی موضوعی: 
استناد: 

نصیری، جلال‌الدین، و نصراله پاک‌نیت. زودآیند. طراحی روشی هوشمند برای دسته‌بندی نوشتارهای علمی فارسی. تهران: پژوهشگاه علوم و فناوری اطلاعات ایران.

افزودن دیدگاه