مطالب مرتبط با کلیدواژه

پردازش متن


۱.

ارائه روشی برای برچسب زدن تصاویر موجود در متون علمی فارسی با استفاده از روش های پردازش متن(مقاله علمی وزارت علوم)

کلیدواژه‌ها: برچسب زدن تصویر نشانه گذاری تصویر بازیابی تصویر پردازش متن استخراج فراداده فناوری اطلاعات

حوزه‌های تخصصی:
تعداد بازدید : ۳۴۷ تعداد دانلود : ۱۵۷
در این مقاله یک روش جدید برای برچسب گذاری تصاویر موجود در متون علمی فارسی معرفی می شود. در اسناد و مقالات علمی، تصاویر حاوی اطلاعلات مهمی هستند و در بسیاری از موارد به تنهایی با بررسی آن ها می توان به ایده اصلی و یا نتایج مهم مقاله علمی پی برد، بدون اینکه لازم باشد کل مقاله را مطالعه کرد. به خاطر رشد روزافزون داده های تصویری، بازیابی تصاویر از اسناد علمی توجه زیادی را به خود جلب کرده و به یک موضوع روبه رشد در ادبیات تبدیل شده است. اولین قدم در بازیابی تصاویر تخصیص برچسب های توصیف کننده به هر تصویر است. در اینجا برای استخراج برچسب تصویر از متن سندی که تصویر به آن تعلق دارد، استفاده شده است. زیرنویس و قسمتی از متن سند که در آن به تصویر مورد نظر اشاره شده است، در نظر گرفته می شود. عبارات اسمی در متنِ همراه تصویر با استفاده از پنج روش متفاوتِ فراوانی عبارات در سند، معکوس فراوانی سند، فراوانی کلمه-معکوس فراوانی سند، شباهت کسینوسی عبارات با زیرنویس، و ترکیب روش فراوانی کلمه-معکوس فراوانی سند و شباهت کسینوسی با زیرنویس رتبه بندی می شوند. در هر روش، برچسب های انتخابی برای تصویر، عبارات اسمی با رتبه بالاتر در آن روش است. روش های معرفی شده با استفاده از داده آزمایشی از پایگاه اطلاعات علمی ایران (گنج) که منبع اصلی اسناد علمی فارسی است، ارزیابی می شوند. طبق نتایج به دست آمده در این تحقیق روش فراوانی کلمه-معکوس فراوانی سند بهترین روش برای برچسب زدن تصاویرموجود در اسناد علمی است.
۲.

شناسایی مؤلفه های هوش مصنوعی در پایگاه های اطلاعاتی ایرانی(مقاله پژوهشی دانشگاه آزاد)

تعداد بازدید : ۲۶۲ تعداد دانلود : ۲۰۶
هدف: هدف از انجام این پژوهش، شناسایی مؤلفه های هوش مصنوعی در پایگاه های اطلاعاتی ایرانی و میزان استفاده از آن ها در این پایگاه ها است.   روش پژوهش: این پژوهش از نوع کاربردی و با روش اسنادی و پیمایشی انجام شده است. جامعه ی آماری این پژوهش شامل 7 پایگاه اطلاعاتی ایرانی(نورمگز، نورلیب، مگ ایران، سیویلیکا، ایرانداک، آی اس سی و اس آی دی) است. ابزار گردآوری داده ها، یادداشت برداری و سیاهه ی وارسی محقق ساخته و مصاحبه با خبرگان است. تجزیه و تحلیل داده ها با استفاده از نرم افزارSPSS انجام شده است. یافته ها :یافته ها نشان داد که پایگاه اطلاعاتی ایرانداک بیشترین و پایگاه های سیویلیکا و مگ ایران کمترین استفاده را از مولفه های هوش مصنوعی داشتند. همچنین مولفه های "تشابه یابی معنایی" و" منابع مرتبط و عبارات پیشنهادی"  بیشترین استفاده را در پایگاه های اطلاعاتی ایرانی داشته و مولفه های "ابهام زدایی کلمات در متن"، "تشخیص و طبقه بندی اسامی"، "مترجم های تصویری"، "شرح تصویر"، "تبدیل گفتار به نوشتار"، "تبدیل نوشتار به گفتار"، "مترجم های صوتی" کمترین استفاده را در آن ها داشته اند. نتیجه گیری: نتایج نشان داد که استفاده از مؤلفه های هوش مصنوعی در پایگاه های اطلاعاتی ایرانی می تواند زمینه تسریع و تسهیل فرایندهای پردازش، ذخیره و بازیابی منابع را در پایگاه های اطلاعاتی ایرانی فراهم کند.    
۳.

دسته بندی نظرات خریداران بیمه زندگی بر اساس الگوریتم های متن کاوی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بیمه زندگی پردازش متن داده متنی کشف دانش یادگیری ماشین

حوزه‌های تخصصی:
تعداد بازدید : ۱۴۸ تعداد دانلود : ۱۲۰
پیشینه و اهداف: در سال های اخیر صنعت بیمه رشدی چشمگیر داشته است و شرکت های مختلف با خدمات گوناگون پا به عرصه گذاشته اند. بازاریابی موفق یکی از اهداف اصلی شرکت های بیمه است؛ پیداکردن افرادی که احتمال می رود از خدمات بیمه استفاده کنند، بسیار مهم است و منجر به مدیریت هرچه بهتر سرمایه و هزینه ها می شود. هدف اصلی این پژوهش، دسته بندی نظرات خریداران بیمه زندگی یک شرکت بیمه ای بر اساس الگوریتم های متن کاوی است تا بتوان از این دسته بندی به عنوان مبنایی برای پیش بینی مشتریان احتمالی آتی استفاده کنیم. با پیش بینی این دسته از مشتریان می توانیم استراتژی بازاریابی مناسبی برای فروش خدمات خود اتخاذ کنیم. روش شناسی: در این پژوهش به بررسی یک مجموعه داده متنی شامل نظرات خریداران بیمه زندگی پرداخته ایم، چرا که با وجود رشد روز افزون حجم این دسته از داده ها، وجود ابزارهایی جهت سازماندهی، بازیابی و کشف دانش مفید از آنها ضروری است. در همین راستا، تاکنون تحقیقات گسترده ای روی تکنیک های پردازش متن صورت گرفته است. این تکنیک ها، با استفاده از شناسایی و کشف الگوها، به دنبال استخراج اطلاعات مفید از داده های متنی بدون ساختار هستند. در این مقاله نظرات خریداران بیمه زندگی ، به صورت یک مساله مستقل مورد بررسی قرار گرفته است. هدف اصلی، دسته بندی این نظرات بر اساس الگوریتم های متن کاوی به دو دسته مثبت و منفی است. برای رسیدن به این هدف، برای اولین بار در صنعت بیمه از چهار الگوریتم مختلف یادگیری ماشین برای متن کاوی نظرات بیمه گذاران استفاده شده است. یافته ها : با توجه به نتایج حاصله از تکنیک های به کار رفته در این پژوهش می توان گفت که الگوریتم ماشین بردار پشتیبان با میزان 73 درصد، بیشترین میزان معیار دقت پیش بینی را در بین سایر الگوریتم های مورد استفاده در این پژوهش داشته است. در ضمن اکثریت بیمه گذاران نیز نظر مثبتی در ارتباط با خدمات دریافتی داشته اند و این بدان معناست که اکثر مشتریان استفاده کننده از خدمات، از شرکت راضی هستند. نتیجه گیری: اکثریت بیمه گذاران مایلند در آینده نیز این خدمت بیمه ای را در سبد خرید خود داشته باشند. لذا مسئولین شرکت می توانند، مشتریان احتمالی خود را از میان این افراد پیدا و برای فروش خدمات خود بر روی آنها سرمایه گذاری کنند. با این استراتژی بازاریابی، مدیران می توانند هزینه های شرکت را کاهش داده و با صرفه جویی در هزینه از این راه، قیمت خدمات خود را کاهش دهند. همه ما می دانیم که هدف هر شرکتی تعیین قیمت برای به حداکثررساندن سود است که به آن قیمت بهینه نیز گفته می شود. تعیین قیمت بهینه به درک هزینه ها، کشش قیمت، ترجیحات مصرف کننده و اقدامات استراتژیک بازاریابی ما بستگی دارد. با این نتایج می توانیم استراتژی بازاریابی مناسب خود را انتخاب کنیم. زیرا تعیین یک قیمت حق بیمه بهینه یک مزیت رقابتی برای شرکت ها ایجاد می کند. مانند هر صنعت دیگری، قیمت تابع قانون عرضه و تقاضا است. از آنجایی که دریافت بهترین قیمت جزو اولویت های اصلی مشتریان بیمه است، حتی درصد کمی تغییر در قیمت حق بیمه باعث می شود بسیاری از مشتریان بیمه گران خود را تغییر دهند. بنابراین، قیمت گذاری بهینه در بخش بیمه، حداکثر سود را ممکن می سازد.