تکنیک های خلاصه سازی چندسندی خودکار متون فارسی مبتنی بر الگوریتم های فرااکتشافی (مقاله علمی وزارت علوم)

درجه علمی: نشریه علمی (وزارت علوم)

درجه علمی در دسته‌بندی سابق وزارت علوم: علمی-پژوهشی

نویسندگان: فاطمه آهنگری سهیلا کرباسی مهدی یعقوبی

منبع: مطالعات ملی کتابداری و سازماندهی اطلاعات دوره 30 تابستان 1398 شماره 2 (پیاپی 118)

کلیدواژه‌ها: خلاصه سازی خودکار متن خلاصه استخراجی الگوریتم های فرااکتشافی الگوریتم ژنتیک الگوریتم جستجوی فاخته ابزار ارزیابی Rouge

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

doi: 10.30484/nastinfo.2019.2330

شماره صفحات: ۵۸ - ۸۰

دریافت مقاله تعداد دانلود : ۵۲۷

آرشیو

چکیده

هدف: ارائه الگوی خلاصه سازی استاندارد متون فارسی با رویکرد تبدیل مسئله خلاصه سازی به مسئله بهینه سازی توسط الگوریتم های فرااکتشافی سازگار. روش شناسی: در این پژوهش از اسناد استاندارد پیکره چندسندی «پاسخ» که شامل 50 موضوع مختلف از انواع گونه های خبری از خبرگزاری های پرببینده ایران، برای ارزیابی استفاده شده است. هر موضوع حاوی 20 سند و همچنین 5 خلاصه چکیده ای و 5 خلاصه استخراجی است. ابتدا عملیات پیش پردازش روی متون ورودی انجام و خلاصه های اولیه تولید شدند. این کار به کمک معیار TF-ISF، معیارهای خوانایی و انسجام جملات، ویژگی شباهت با عنوان، ویژگی موقعیت جمله در متن، و ویژگی طول جمله انجام شد. با توجه به هر یک از این معیارها، وزنی به هر یک از جملات خلاصه اختصاص داده و ماتریس شباهت ایجاد شد. سپس، خروجی سیستم استخراج توسط دو الگوریتم فرااکتشافی ژنتیک و جستجوی فاخته برای رسیدن به خلاصه نهایی پردازش شد. درنهایت، خروجی به دست آمده از مرحله قبل به کمک ابزار ارزیابی Rouge و مقایسه با خلاصه های انسانی تحلیل شدند. یافته ها: میانگین همه مقادیر به دست آمده از ابزار ارزیابی Rouge در محاسبه میزان هم پوشانی نمونه های مشترک خلاصه های انسانی و خلاصه ماشینی توسط الگوریتم جستجوی فاخته بیشتر از مقادیر به دست آمده توسط الگوریتم ژنتیک و همچنین سامانه خلاصه ساز برخط ایجاز بودند. از میان هشت معیار موجود در این ابزار، دو معیار ارزیابی طولانی ترین زیررشته مشترک با مقدار 0.33 و تعداد لغات مشابه در متن با مقدار 0.40 نتایج بهتری نسبت به بقیه معیارها داشتند. نتیجه گیری: نتایج حاصل از مقایسه دو الگوریتم به کاررفته، حاکی از عملکرد بهتر الگوریتم جستجوی فاخته در هر یک از معیارهای ابزار Rouge است. از طرفی مقایسه زمانی نتایج نشان می دهد که میانگین زمانی محاسبه شده برای خلاصه سازی توسط سیستم پیشنهادی با الگوریتم جستجوی فاخته کمتر است.

تکنیک های خلاصه سازی چندسندی خودکار متون فارسی مبتنی بر الگوریتم های فرااکتشافی (مقاله علمی وزارت علوم)

درجه علمی: نشریه علمی (وزارت علوم)

آرشیو

آرشیو شماره‌ها:
۱۱۸

سال ۱۴۰۳ (۴)

سال ۱۴۰۲ (۴)

سال ۱۴۰۱ (۴)

سال ۱۴۰۰ (۴)

سال ۱۳۹۹ (۴)

سال ۱۳۹۸ (۴)

سال ۱۳۹۷ (۴)

سال ۱۳۹۶ (۴)

سال ۱۳۹۵ (۴)

سال ۱۳۹۴ (۴)

سال ۱۳۹۳ (۴)

سال ۱۳۹۲ (۴)

سال ۱۳۹۱ (۴)

سال ۱۳۹۰ (۴)

سال ۱۳۸۹ (۴)

سال ۱۳۸۸ (۴)

سال ۱۳۸۷ (۴)

سال ۱۳۸۶ (۴)

سال ۱۳۸۵ (۴)

سال ۱۳۸۴ (۴)

سال ۱۳۸۳ (۱)

سال ۱۳۸۱ (۲)

سال ۱۳۸۰ (۴)

سال ۱۳۷۹ (۴)

سال ۱۳۷۸ (۴)

سال ۱۳۷۷ (۳)

سال ۱۳۷۶ (۳)

سال ۱۳۷۵ (۴)

سال ۱۳۷۴ (۳)

سال ۱۳۷۳ (۲)

سال ۱۳۷۲ (۴)

سال ۱۳۷۱ (۱)

سال ۱۳۷۰ (۱)

سال ۱۳۶۹ (۲)

چکیده

تبلیغات

تکنیک های خلاصه سازی چندسندی خودکار متون فارسی مبتنی بر الگوریتم های فرااکتشافی (مقاله علمی وزارت علوم)

درجه علمی: نشریه علمی (وزارت علوم)

آرشیو

آرشیو شماره‌ها: ۱۱۸

چکیده

تبلیغات

آرشیو شماره‌ها:
۱۱۸