سامانه‌ای برای استانداردسازی و خطایابی متون علمی فارسی

سامانه‌ای برای استانداردسازی و خطایابی متون علمی فارسی
چهارمین همایش ملی مدیران فناوری اطلاعات
فایل پیوست: 
چکیده: 

روزانه هزاران مستند متنی متنوع در حوزه‌های مختلف علمی بر روی وب جهان‌گستر قرار می‌گیرد. این مستندات می‌تواند شامل پایان‌نامه‌ها، مقاله‌ها، گزارش‌های علمی و مواردی از این قبیل باشد. نگارش متن این مستندات علمی جهت حفظ یکنواختی باید بر اساس اصول ثابت انجام‌ گیرد، اما همواره به ‌طور غیر عمدی دست‌خوش سلیقه‌های مختلفی در طول تاریخ ‌می‌شود. اگرچه این تغییرات ناشی از پویا بودن زبان و خلاقیت ذهن بشری است، اما این پویایی و خلاقیت پردازش ماشینی متن را با چالش‌های متعددی روبه‌رو ‌می‌کند و دقت پردازش داده‌ها را به میزان چشمگیری پایین می‌آورد. علاوه بر تنوع نگارشی، غلط‌های سهوی املایی نیز وجود دارد که فحوای گفتمانی متن را منحرف‌ کرده و درک آن را با مشکل مواجه ‌می‌کند. بنابراین، کلیه نویسه‌های متن باید به حالت استاندارد تبدیل شوند و عاری از هر گونه خطاهای املایی گردند. پژوهشگران مقاله حاضر سامانه‌‌ای برای استانداردسازی و خطایابی متون علمی فارسی طراحی‌کرده‌اند که این سامانه متون نوشتاری علمی و تخصصی فارسی را به ‌لحاظ صحت نگارشی و املایی بررسی می‌کند و متن را به ‌شکل استاندارد در می‌آورد. در این مقاله، به معرفی کاربردهای سامانه می‌پردازیم.

استناد: 
عبدی قویدل، هادی، و ملوک‌السادات حسینی بهشتی. ۱۳۹۵. سامانه‌ای برای استانداردسازی و خطایابی متون علمی فارسی. مقاله ارائه شده در چهارمین همایش ملی مدیران فناوری اطلاعات، تهران.

افزودن دیدگاه

پشتیبانی فنی