بهبود برچسب‌گذاری اجزای کلام با استفاده از نرم‌افزار رفع ابهام‌کننده از برچسب هم‌نگاره‌های اسمی و صفتی مختوم به «-ی»

بهبود برچسب‌گذاری اجزای کلام با استفاده از نرم‌افزار رفع ابهام‌کننده از برچسب هم‌نگاره‌های اسمی و صفتی مختوم به «-ی»
شماره صفحه (از - تا): 
۲۰۹-۲۱۶
نخستین کنفرانس ملی پژوهش‌های کاربردی در زبان‌شناسی رایانشی (با محوریت خط و زبان فارسی)
شیراز
تاریخ کنفرانس: 
چهارشنبه - ۰۹ اسفند ۱۳۹۶ تا پنجشنبه - ۱۰ اسفند ۱۳۹۶
چکیده: 

در پژوهش حاضر به این مسئله پرداخته شد که آیا با رفع ابهام از برچسب نحوی هم‌نگاره‌های اسمی و صفتی مختوم به «-ی»، که فراوانی بالایی در پیکره‌های متنی فارسی دارند، کارایی یک سیستم برچسب‌زنی خودکار اجزای کلام، افزایش می‌یابد؟ سیستم برچسب‌زنی مورد مطالعه در پژوهش حاضر، ابزار «هضم» است. در پژوهش حاضر ابتدا فهرست مبسوطی از هم‌نگاره‌های اسمی و صفتی مختوم به «-ی» با تعریف تعداد ۱۰ پنجره، به عبارتی دیگر، ۱۰ کلمه قبل و بعد از هر هم‌نگاره مختوم به «ی»، در پیکره بی‌جن‌خان (که پیکره‌ای است با برچسب اجزای کلام) تهیه شد؛ پس از بررسی هم‌نگاره‌های اسمی و صفتی مختوم به «-ی» در بافت نحوی، الگوهای حساس به بافت نحوی جهت رفع ابهام از برچسب نحوی هم‌نگاره‌های مذکور، استخراج شد؛ سپس، نرم‌افزاری جهت رفع ابهام از برچسب نحوی این هم‌نگاره‌ها، تهیه شد. ارزیابی کلی نرم‌افزار تهیه شده جهت رفع ابهام از برچسب نحوی هم‌نگاره‌های اسمی و صفتی مختوم به «-ی» در فارسی، نشان می‌دهد اگر تنها الگوهای حساس به بافت نحوی که تأثیر مثبت در برچسب‌زنی داشته‌اند را به برچسب‌زن «هضم» اضافه کنیم، صحت (Accuracy) کلی برچسب‌زن ۹۵.۹۶۱ درصد می‌شود که ۱.۳۴ درصد نسبت به حالتی که از تمام الگوهای حساس به بافت نحوی استفاده ‌شود، بالاتر است. 

استناد: 

علایی ابوذر، الهام. ۱۳۹۶. بهبود برچسب‌گذاری اجزای کلام با استفاده از نرم‌افزار رفع ابهام‌کننده از برچسب هم‌نگاره‌های اسمی و صفتی مختوم به «-ی». مقاله ارائه شده در نخستین کنفرانس پژوهش‌های کاربردی در زبان‌شناسی رایانشی (با محوریت خط و زبان فارسی)، شیراز.

مقاله همایش علمی

افزودن دیدگاه