پیکره و برچسب‌گذاری آن با کمک رایانه: ویژگی‌ها، کاستی‌ها و چالش‌ها

سخنران: 
فایل پیوست: 
مکان: 
پژوهشگاه علوم و فناوری اطلاعات ایران، تالار سخن
محورهای سخنرانی: 
فرایند استفاده از رایانه به عنوان ابزار برچسب‏‌گذاری داده زبانی چیست؟
چگونه می‏‌توان با برچسب‌‏گذاری رایانشی داده، زمان و هزینه را کاهش داد؟
چه چالش‌هایی را به ‏هنگام تحلیل زبان‌‎شناختی داده فارسی مواجه می‌شویم؟
چکیده: 

امروزه پیکره زبانی جایگاه ویژه‎ای را میان زبان‌‎شناسان و افرادی که در حوزه زبان و رایانه فعالیت می‌کنند به خود اختصاص داده است. ازجمله ویژگی‌‏های پیکره این است که باید نماینده زبان باشد. برآورده‌سازی این ویژگی منجر به تهیه پیکره‎ای با حجم زیاد می‌شود. تحلیل زبان‎‌شناختی این حجم زیاد پیکره بسیار زمان‌بر و پرهزینه است؛ بنابراین استفاده از رایانه می‌تواند یک راه‏کار باشد. در این سخنرانی در مورد استفاده از رایانه به ‎عنوان ابزار کمکی در برچسب‌‌گذاری داده زبانی توضیح داده می‌شود و به بررسی ویژگی‌ها و کاستی‌‌های این روش می‌پردازد. از آنجا که خط فارسی داده ورودی به رایانه برای برچسب‌‌گذاری است، با چالش‌های فراوان مربوط به خط فارسی روبه‌رو می‌شویم که آگاهی از این چالش‌‌ها می‌تواند به کاهش کاستی‌های برچسب‌گذاری خودکار منجر شود.

تاریخ برگزاری: 
۲۵ دى ۱۳۹۸
پیکره و برچسب‌گذاری آن با کمک رایانه: ویژگی‌ها، کاستی‌ها و چالش‌ها

افزودن دیدگاه