نظرکاوی خودکار نقد فیلم‌ها با رویکرد مقاوم‌سازی ماشین‌بردار پشتیبان

نظرکاوی خودکار نقد فیلم‌ها با رویکرد مقاوم‌سازی ماشین‌بردار پشتیبان
چهارمین همایش ملی زبان‌شناسی رایانشی
تهران
تاریخ کنفرانس: 
پنجشنبه - ۲۶ بهمن ۱۳۹۶
مؤسسه برگزارکننده: 
چکیده

امروزه مردم نظرات و عقاید خود را درباره کالاها، خدمات و رویدادهای اجتماعی و سیاسی در شبکه‌های اجتماعی به اشتراک می‌گذارند. نظرات و نقدهای زیادی درباره فیلم‌ها توسط کاربران در اینترنت منتشر شده است که خواندن تمام آن‌ها جهت تصمیم‌گیری در مورد تماشای یک فیلم، زمان زیادی از یک شخص می‌گیرد. تحقیقات پیشین این مسئله را با ارائه روش‌های خلاصه‌سازی حل کرده‌اند. در این مقاله، مسئله نظر کاوی خودکار نقد فیلم‌ها با رویکرد مقاوم‌سازی ماشین بردار پشتیبان در برابر داده‌های نویزی بررسی شده است. مجموعه داده از سایت IMDb جمع‌آوری شده و شامل ۲۰۰۰ نقد فیلم می‌باشد. ۲۵۰۰ کلمه که بیشترین فراوانی را در متن‌ها داشته اند، به عنوان ویژگی جهت دسته‌بندی نقدهای مثبت و منفی انتخاب شده است. وزن هر نمونه با روش نزدیک‌ترین همسایه جهت مقابله با داده‌های نویزی محاسبه شده و در فرمول دسته‌بند ماشین بردار پشتیبان دو قلو لحاظ شده است. نتایج نشان می‌دهد که روش پیشنهادی نسبت به پژوهش‌های پیشین و سایر روش‌های یادگیری دقت بهتری در تشخیص مثبت یا منفی بودن نقد فیلم‌ها دارد.

استناد: 

میر، امیرمحمود، و جلال‌الدین نصیری. ۱۳۹۷. نظرکاوی خودکار نقد فیلم‌ها با رویکرد مقاوم‌سازی ماشین‌بردار پشتیبان. مقاله ارائه شده در چهارمین همایش ملی زبان‌شناسی رایانشی، تهران.

مقاله همایش علمی

افزودن دیدگاه