مطالب مرتبط با کلیدواژه

متن کاوی


۱.

کاربرد ابزارهای تحلیلگر داده¬کاوی و متن¬کاوی در چابکی سازمانهای مراقبت بهداشتی و درمانی(مقاله پژوهشی وزارت بهداشت)

نویسنده:

کلیدواژه‌ها: داده کاوی دانش چابکی متن کاوی سازمان های مراقبت بهداشتی و درمانی

حوزه های تخصصی:
تعداد بازدید : ۲۶۴۳ تعداد دانلود : ۱۵۲۰
واژه چابک نشان دهنده سرعت و قدرت در پاسخگویی هنگام مواجه با رویدادهای داخلی و خارجی سازمان است. سازمان های مراقبت بهداشتی و درمانی هم باید مانند سایر سازمان ها برای تغییرات پرشتاب امروزی چابک باشند چون برای ادامه حیات و ماندن در دنیای پر رقابت امروزی چابکی یک مزیت رقابتی به شمار می آید. در این مقاله به توضیح چابکی سازمانی، فرایند داده کاوی و متن کاوی و نقشى که این ابزارها می توانند در تولید دانش و حرکت سازمانهای مراقبت بهداشتی و درمانی به سوی چابکی داشته باشند ارائه می شود. مروری بر مطالعات : متخصصان بیمارستان اختلالات نخاعی کالیفرنیای جنوبی در لوس آنجلس از داده کاوی برای کشف عوامل مختلفی که در موفقیت یا شکست عمل جراحی ستون فقرات مؤثر و باعث بهبودی در مراقبت می شود استفاده نمود ند و همچنین سازمان امور مالی مراقبت های بهداشتی آمریکا و سازمانهای مدیکیر و مدیکید از داده کاوی و متن کاوی برای کشف تقلب ها و سوءاستفاده های مربوط به بیمه و ارائه انواع خدمات مراقبتی استفاده می نماید بحث و نتیجه گیری: اطلاعات یکی ازحیاتی ترین ابزار مدیریتی به شمار می روند. تبدیل این اطلاعات به دانش، نقش محوری و راهبردی در حرکت سازمان به سوی چابکی می تواند داشته باشد. با استفاده از ابزارهای تحلیلگر در سازمان می توان علاوه بر کشف دانش جدید در حوزه پزشکی به اطلاعاتی در زمینه روندها، الگوها و نتایج درمانی برای ارتقاء کیفیت مراقبت دست یافت و با تغذیه اطلاعاتی مدیران در زمینه نقاط ضعف و قوت، تهدیدات و فرصت ها و تغییرات تکنولوژی، آنها را یاری نمود تا برای حرکت سازمان بسوی چابکی برنامه ریزی کنند. "
۲.

متن کاوی موضوعی رایانه ای قرآن کریم، برای کشف ارتباطات معنایی میان آیات، بر مبنای تفسیر المیزان(مقاله پژوهشی حوزه)

کلیدواژه‌ها: قرآن کریم داده کاوی متن کاوی تفسیر المیزان رده بندی موضوعی ارتباطات معنایی

حوزه های تخصصی:
  1. حوزه‌های تخصصی علوم اسلامی تفسیر و علوم قرآن تفسیر قرآن کلیات مفسران و تأویل گران شیعی
  2. حوزه‌های تخصصی علوم اسلامی تفسیر و علوم قرآن تفسیر قرآن معارف قرآن
تعداد بازدید : ۳۳۱۱ تعداد دانلود : ۱۳۱۵
متن کاوی موضوعی قرآن کریم، رویکردی جدید در «پردازش ارتباطات معنایی» میان آیات قرآن کریم است، که با استفاده از ابزارهای داده کاوی رایانه ای به این کاوش می پردازد. با استفاده از مبانی تفسیری علامه طباطبایی در نگاه موضوعی و نگاه غایت محور، یک پیکرة موضوعی از آیات قرآن تشکیل دادیم که شامل بخشی تفسیری (برای ارزیابی نتایج) و بخشی تشخیصی (با کدگذاری موضوعی آیات برای ورود به الگوریتم های رایانه ای) است. موضوعات این پیکره ، مبتنی بر بیان علامه در مقدمة المیزان، شامل هفت موضوع ذیل است که با نظمی توحیدی، نظام معنایی جامعی را تشکیل می دهند: ذات و اسماء الهی، وسایط الهی، افعال الهی، انسان قبل از دنیا، انسان در دنیا، انسان بعد از دنیا، هدایت انسان به سوی خدا (با ولایت توحیدی، اوصاف اخلاقی و احکام شرعی). برای اثبات معنادار بودن طرح متن کاوی موضوعی، آن را بر سورة «حج ر» (در مدل سوره)، و آیات تفسیری مرتبط با آیة 21 حجر (در مدل آیات مرتبط) اجرا نمودیم، و در ده آزمون داده کاوی برخی ارتباطات معنایی را کشف کردیم، که به دلیل محدودیت گنجایش مقاله، تنها نتیجة معنادار سه آزمون مطرح شده است.
۳.

تحلیل محتوایی مقالات علمی با استفاده از متن کاوی

کلیدواژه‌ها: متن کاوی مقالات علمی معیارهای کلی آنالیز و تحلیل مدل دسته بندی

حوزه های تخصصی:
تعداد بازدید : ۱۱۸۴ تعداد دانلود : ۶۱۰
در این تحقیق، از تکنیک متن کاوی به منظور آنالیز محتویات مقالات علمی و همچنین ارائه ی مدلی برای دسته بندی مقالات علمی (دسته ی اول، مقالاتی که معیارهای از پیش تعیین شده ای را رعایت کرده و دسته ی دوم، مقالاتی که آن معیارها را رعایت نکرده اند) استفاده شده است. در همین راستا، در تحقیق پیش رو، از نظر خبرگان به منظور استخراج معیارهایی کیفی بهره برده شده که درنهایت 15 معیار نهایی به دست آمده است، در مرحله ی بعد تعداد 18 مقاله ی علمی در زمینه مهندسی صنایع توسط اساتید دانشگاه و دانشجویان مقطع دکتری در این رشته (با توجه به 15 معیار استخراج شده) مورد بررسی قرار گرفته و بر اساس نظر این افراد نتایج سودمندی به دست آمده است، در نهایت از مدل های دسته بندی مختلفی برای طبقه بندی مقالات استفاده شده و با استفاده از تکنیک هایی مشخص، سعی شده که در این مدل ها بهبودی حاصل شود. هدف از این پژوهش، به دست آوردن معیارهایی کلی برای تحلیل محتوایی مقالات، ارائه ی مدل های مختلف دسته بندی برای طبقه بندی مقالات علمی بر اساس معیارهای از پیش تعیین شده و انتخاب بهترین مدل است. در نهایت، نتیجه ی این پژوهش به دست آوردن 15 معیار کلی برای تحلیل محتوایی مقالات و به دست آوردن مدل های دسته بندی مختلف با دقت قابل قبول است.
۴.

خوشه بندی و بررسی تطبیقی سند چشم انداز، مأموریت سازمانی، و اهداف شرکتهای بیمه بین المللی و داخلی با رویکرد متن کاوی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: خوشه بندی چشم انداز متن کاوی k- میانگین مأموریت سازمانی

حوزه های تخصصی:
تعداد بازدید : ۹۹۶ تعداد دانلود : ۳۷۲
چشم انداز سازمانی، مأموریت سازمانی و هدف سازمان، شاخصهای عمده جهت گیری سازمان محسوب می شوند. در این تحقیق با به کارگیری تکنیک نوین متن کاوی و ترکیب آن با روش خوشه بندی k - میانگین، متن سند چشم انداز، مأموریت سازمانی، و اهداف ۳۹ شرکت بیمه بین المللی موجود در لیست ۵۰۰ شرکت برتر دنیا و ۱۸ شرکت بیمه داخلی مورد تحلیل قرار گرفته است. نتایج تحقیق نشان می دهد که شرکتهای بین المللی با مفاهیمی چون امنیت مالی، ارزش، خدمات، محصول- خدمت، و کیفیت در قالب ۴ خوشه و شرکتهای داخلی با مفاهیمی چون حرفه ای، آرامش، سودآوری- مالی، و ارائه خدمات در قالب ۴ خوشه تقسیم بندی می شوند. درنهایت شرکتهای بین المللی در مواردی با شرکتهای داخلی هم راستا هستند و در موارد فراوانی نوع دیدگاه شرکتهای داخلی و بین المللی به این سندها و واژه های به کاررفته در آنها متفاوت است.
۵.

ارزیابی روند های توسعه و اجرای سیستم های اطلاعاتی در حوزه مدیریت منابع انسانی با استفاده از روش های متن کاوی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: خوشه بندی متن سیستم های اطلاعاتی مدیریت منابع انسانی متن کاوی همبستگی لغات

حوزه های تخصصی:
تعداد بازدید : ۷۵۰ تعداد دانلود : ۴۰۵
مدیریت منابع انسانی با ظهور سیستم های اطلاعاتی شاهد تغییرات بسیاری بوده و سیستم های اطلاعاتی توانسته است در جای جای این حوزه وارد شود. همچنین، کاربرد های گسترده سیستم های اطلاعاتی در مدیریت منابع انسانی بر کسی پوشیده نیست، اما اینکه این سیستم ها در کدام یک از حوزه های مدیریت منابع انسانی نقش پررنگ تری ایفا کرده و کاربرد بیشتری داشته است مسئله مهمی است که تاکنون به آن پرداخته نشده است. درنتیجه هدف از انجام این پژوهش یافتن ارتباط میان کلمات این حوزه، تشخیص پرکاربرد ترین کلمات، همچنین مطالعه روند کلی سیستم های اطلاعاتی در حوزه مدیریت منابع انسانی، با استفاده از روش های متن کاوی است. از میان روش های موجود متن کاوی، از وزن دهی به کلمات، همبستگی کلمات و الگوریتم خوشه بندی استفاده شده است. داده های این پژوهش از میان نشریات برتر بین المللی سیستم های اطلاعات از پایگاه داده اسکوپوس و بین سال های 2013 تا 2017 جمع آوری شده است. این مطالعه با استفاده از الگوریتم های متن کاوی روی تیتر، چکیده و کلمات کلیدی سعی در پیداکردن ارتباط میان این کلمات و روند کلی سیستم های اطلاعاتی در حوزه مدیریت منابع انسانی دارد. نتایج این تحقیق می تواند اطلاعات مفیدی را در اختیار محققان قرار دهد درخصوص اینکه چه موضوعاتی اهمیت و به تمرکز بیشتری نیاز دارند؟. از نتایج این تحقیق می توان به اهمیت موضوعات مدیریت دانش و خصوصاً فرایند تسهیم دانش، تیم های مجازی، استفاده از سیستم اطلاعات منابع انسانی و نقش پررنگ شبکه های اجتماعی در سازمان اشاره کرد.
۶.

ترسیم نقشه دانش حوزه کتابخانه های دیجیتالی در ایران: تحلیل هم رخدادی واژگان(مقاله علمی وزارت علوم)

کلیدواژه‌ها: کتابخانه های دیجیتالی هم رخدادی واژگان علم سنجی نقشه علمی متن کاوی

حوزه های تخصصی:
تعداد بازدید : ۱۰۸۶ تعداد دانلود : ۵۵۴
پژوهش حاضر با هدف ترسیم نقشه دانش تولیدات علمی ایران در حوزه کتابخانه های دیجیتالی انجام شد. رویکرد این پژوهش علم سنجی است، و از تحلیل هم رخدادی واژگان و شاخص های تحلیل شبکه های اجتماعی استفاده شد. تعداد 554 مدرک علمی شامل کتاب، مقاله تألیفی، مقاله همایش های داخلی و خارجی، و پایان نامه کارشناسی ارشد و دکتری داخل ایران در تمامی رشته های علمی که تا پایان سال 1392 به موضوع کتابخانه های دیجیتالی پرداخته بودند، مطالعه شد. از سیاهه موضوعی برای گردآوری داده ها و از نرم افزارهای گفی و وی.اُ.اِس.ویوور جهت مصورسازی و تحلیل شبکه های موضوعی استفاده شد. زمینه های تحقیق و توسعه در کتابخانه های دیجیتالی به 10 حوزه و 59 زیرحوزه دسته بندی شدند. گروه های موضوعی «ارزیابی کتابخانه های دیجیتالی؛ محتوا و مجموعه های دیجیتال؛ معماری، سیستم ها، ابزارها و فناوری ها و ...» حوزه های پربسامد و زیرحوزه های موضوعی «ارزیابی کتابخانه های دیجیتالی؛ فراداده؛ حفاظت و امنیت محتوا و ...» موضوعات مرکزی و هسته در شبکه موضوعی را شکل دادند؛ و زیرحوزه های موضوعی «استانداردهای نشر الکترونیکی؛ استفاده از تاکسونومی ها برای ایجاد دسترسی سازمان یافته به مخازن دیجیتالی متنوع؛ سیستم های حفاظت دیجیتالی؛ اشتراک دانش؛ و ...» جزو خلاءهای پژوهشی مطالعات کتابخانه های دیجیتالی در ایران هستند. نتایج پژوهش گویای این است که پژوهش های اندکی از منظر فنی و کاربردی به آن پرداخته اند. نتایج نشان دادند که ساختار هم رخدادی حوزه ها با طی حدود دو دهه از مطالعات این حوزه در ایران نسبت به پژوهش های بین المللی از بلوغ کافی برخوردار نبوده و همبستگی مفاهیم درون خوشه ها اندک و نامتوازن است.
۷.

بررسی پژوهش های بین المللی در حوزه ی رسانه های ورزشی به روش تحلیل شبکه و مصورسازی نرم افزاری(مقاله علمی وزارت علوم)

کلیدواژه‌ها: رسانه های ورزشی متن کاوی علم سنجی تحلیل شبکه

حوزه های تخصصی:
تعداد بازدید : ۶۶۹ تعداد دانلود : ۲۹۵
هدف پژوهش حاضر تحلیل و بررسی وضعیت مطالعات انجام گرفته در حوزه ی رسانه های ورزشی در عرصه ی بین المللی است. جامعه آماری پژوهش حاضر تمامی مقالات حوزه ی رسانه های ورزشی شامل 1360 مقاله است که از سال 1983 تا 2016 در پایگاه استنادی وب او ساینس (آی.اس.آی) نمایه شده است  که با بهره گیری از تکنیک های علم سنجی، متن کاوی، تحلیل شبکه ای و نرم افزاری مورد تحلیل و بررسی قرار گرفته است. تحلیل ها شامل شناسایی روند کمی پژوهش ها در طول زمان، مجلات برتر ازنظر تعداد مقاله، توزیع جغرافیایی پژوهش های مرتبط، شبکه همکاری کشورها و پربسامدترین واژه های به کاررفته در عنوان، چکیده و کلیدواژه است. نتایج نشان داد که از سال 1983 تا 2016 تعداد پژوهش های انجام شده در حوزه رسانه های ورزشی رشد نسبی داشته است و از نه مقاله در سال 1983 به 92 مقاله در سال 2016 رسیده است. بیشترین سهم چاپ مقاله در حوزه رسانه های ورزشی را مجلهMEDICINE AND SCIENCE IN SPORTS AND EXERCISE  با چاپ 133 مقاله داشته است. همچنین کشور ایالات متحده با چاپ 670 مقاله و مشارکت در 49 درصد مقالات چاپ شده، نسبت به سایر کشورها با اختلاف زیاد، بیشترین سهم تولید مقالات حوزه رسانه های ورزشی را دارد. واژه های «sport»، «medium» و «performance» به ترتیب با 138، 129 و 124 بیشترین تکرار در عنوان و چکیده مقالات منتشرشده را از آن خودکرده اند و کلیدواژه های rehabilitation، community و internet بیشترین تکرار را در کلیدواژه های مقالات داشته اند.
۸.

کشف دانش و کاربرد آن در اینترنت اشیاء

کلیدواژه‌ها: اینترنت اشیاء کشف دانش داده کاوی متن کاوی داده های حجیم

حوزه های تخصصی:
تعداد بازدید : ۶۹۹ تعداد دانلود : ۱۲۴۴
اینترنت اشیاء، به طور چشمگیری زندگی ما را در آینده ای نزدیک تغییر خواهد داد و بسیاری از ناممکن ها را ممکن خواهد ساخت. حجم عظیم داده ی تولید شده یا گرفته شده توسط تجهیزات اینترنت اشیاء ، حاوی اطلاعات ارزشمند و قابل استفاده است. با رواج دستگاه های توسعه یافته فناوری بی سیم مانند بلوتوث، شناسایی با فرکانس رادیویی (RFID)، Wi-Fi، و خدمات داده برروی تلفن و همچنین سنسور و محرک و نودهای تعبیه شده در وسایل، شبکه های حسگر بی سیم، اینترنت اشیاء مراحل ابتدایی خود را پشت سر گذاشته و در آستانه تبدیل اینترنت ایستای کنونی، به اینترنت کاملاً یکپارچه در آینده است. کشف دانش از طریق داده کاوی و متن کاوی نیز بدون شک نقش زیادی در زمینه هوشمندسازی سیستم ها و در نتیجه ارائه خدمات و محیط مناسب برای ارائه خدمات خواهد داشت. همچنین از روش های داده کاوی برای خوشه بندی تجهیزات در شبکه های حسگر بی سیم و تعیین سرخوشه استفاده بسیاری می شود. در این مقاله به معرفی اینترنت اشیاء، معماری، کشف دانش ، نقش وکاربرد داده کاوی و متن کاوی در این حوزه پرداخته شده است.
۹.

خوشه بندی مقالات علمی بر پایه الگوریتم k_means مطالعه موردی: پایگاه پژوهشگاه علوم و فناوری اطلاعات ایران(ایرانداک)(مقاله علمی وزارت علوم)

کلیدواژه‌ها: متن کاوی خوشه بندی الگوریتم k_means معیار تابع فاصله اقلیدسی پایگاه ایران داک

حوزه های تخصصی:
تعداد بازدید : ۴۵۳ تعداد دانلود : ۳۳۵
با رشد روز افزون منابع و مقالات در سطح وب، بکارگیری روش هایی سریع و ارزان برای دسترسی به متون مورد نظر از میان مجموعه وسیع این مستندات، اهمیت بیشتری می یابد. برای رسیدن به این هدف، به کارگیری تکنیک های متن کاوی، گامی ارزشمند در جهت کشف دانش از مستندات متنی به شمار می رود. هدف اصلی این پژوهش خوشه بندی پایگاه پژوهشگاه علوم و فناوری اطلاعات ایران(ایرانداک) براساس فنون متن کاوی می باشد. تا مقالات موجود به چند خوشه تقسیم شوند بطوریکه مقالات خوشه های مختلف حداکثر تفاوت ممکن و مقالات موجود در هر خوشه بیشترین شباهت را با هم داشته باشند . مقالات حوزه های مرتبط با فن آوری اطلاعات انتخاب شدند. بدین منظور ابتدا تمام کلید واژه های حوزه های فن آوری اطلاعات بر اساس دفعات بسامد آنها در مقالات پایگاه انتخاب و سپس مقالات هر کلیدواژه از پایگاه ایران داک استخراج گردید. سپس با استفاده از نرم افزار notepad++ مجموعه داده موردنظر ایجاد گردید. در این پژوهش برای انجام خوشه بندی از الگوریتم k_means و از معیار تابع فاصله اقلیدسی [1] برای اندازه گیری تشابه خوشه ها استفاده گردید . سپس نتایج حاصل از خوشه بندی مورد تجزیه و تحلیل قرار گرفت تا میزان شباهت و الگوی مناسب میان مقالات کشف شد. الگوی مورد نظر نشان داد که بیشترین میزان مشابهت میان مقالات دو خوشه داده کاوی و شبکه عصبی با فاصله اقلیدسی 365/1 وجود دارد و کمترین میزان شباهت میان مقالات دو خوشه بهینه سازی و پردازش تصویر با فاصله 387/1 گزارش شده است. دانش حاصل از پژوهش، خوشه بندی مقالات مرتبط با بیشترین وکمترین میزان مشابهت با یکدیگر، یافتن الگوی جدید جهت دسترسی سریع و آسان به مقالات مشابه و کشف ارتباط پنهان میان موضوعات مختلف می باشند.این دانش به پژوهشگران کمک می کند تا بتوانند مقالات موضوعی مرتبط با تخصص خود و مشابه با موضوع مورد مطالعه را به نحوی مطلوب تر شناسایی کنند. [1] -Euclidean distance
۱۰.

ارائه روش رده بندی تک رده ای برای شناسایی متون پژوهشی حوزه محیط زیست ایران با استفاده از ماشین بردار پشتیبان(مقاله علمی وزارت علوم)

کلیدواژه‌ها: محیط زیست رده بندی تک رده ای ماشین بردار پشتیبان متن کاوی وزن دهی NG-TF

حوزه های تخصصی:
تعداد بازدید : ۴۱۲ تعداد دانلود : ۴۰۲
رده بندی متون پژوهشی به منظور شناسایی و تحلیل عرضه و تقاضای پژوهشی در حوزه های مختلف علوم اهمیت ویژه ای دارد. در این میان رده بندی پژوهش های حوزه محیط زیست به دلیل اهمیت فراوان آن در کشور و نیز میان رشته ای بودن آن ضروری است. این پژوهش روش رده بندی تک رده ای متون پژوهشی این حوزه را با استفاده از ماشین بردار پشتیبان ارائه می دهد و به ارزیابی پارامترهای مهم تأثیرگذار در کیفیت این رده بندی می پردازد. نتایج نشان می دهد که استفاده از مجموعه داده هسته توصیفی در یادگیری مدل، کارایی بهتری نسبت به هسته محتوایی دارد. همچنین، استفاده از هسته چندجمله ای و وزن دهی دودویی واژه ها در ماتریس بردار ویژگی ها نتایج بهتری نسبت به حالت های معمول دیگر ارائه می کند. در این مطالعه، روش جدید وزن دهی با نام NG-TF معرفی و ارائه شده است که نتایج ارزیابی آن نسبت به روش های دیگر، به ویژه در معیار دقت، برتری قابل توجهی دارد. از این رو، می توان از این روش وزن دهی برای تعیین واژگان نماینده یک حوزه پژوهشی استفاده کرد.
۱۱.

بررسی تطبیقی متن شعارهای تبلیغاتی فروشگاه های اینترنتی صنایع غذایی داخلی و خارجی با استفاده از تکنیک متن کاوی و خوشه بندی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: شعارهای تبلیغاتی فروشگاه های اینترنتی متن کاوی خوشه بندی میانگین k

حوزه های تخصصی:
تعداد بازدید : ۴۷۷ تعداد دانلود : ۳۰۷
از آنجایی که امروزه اکثر کسب و کارها، برای مدیریت کارآمدتر و ساده تر مشتریانشان از فروشگاه اینترنتی برای عرضه محصولات خوداستفاده می کنند، تحلیل متن شعارهای تبلیغاتی آنها که به نوعی تجلی بیانیه مأموریتشان نیز هست، اهمیت بسزایی دارد. در این پژوهش، متن شعارهای تبلیغاتی شرکت برتر ایرانی و خارجی، شامل 29 شعار جذاب فروشگاه اینترنتی داخلی و 24 شعار جذاب فروشگاه اینترنتی خارجی مورد بررسی قرار گرفتند. جهت پیش پردازش متون و ترکیب آن با روش خوشه بندی و الگوریتم میانگین    K- means   از روش متن کاوی استفاده شده، همچنین برای قرارگیری در خوشه جدا و تشخیص مهم ترین ریشه ها در هر خوشه، تکنیک تصمیم گیری چند شاخصه MADM به کار گرفته شده است؛ تا علاوه بر مشخص کردن محتوای شعارها، تفاوت ها و شباهت بین این دو جهت گیری نیز آشکار شود. با تطبیق خوشه داخلی و خارجی معلوم شد که توجه شرکت داخلی بیشتر بر مفاهیمی چون  “محصول ”  و “کلی گویی” است، اما  شرکت خارجی بر مفاهیمی  “همچون توجه به مشتری” متمرکزند.
۱۲.

ارائه مدلی جهت دسته بندی حساسات خریداران کتاب با استفاده از رویکرد ترکیبی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: متن کاوی تحلیل احساسات عقیده کاوی مدل ترکیبی

حوزه های تخصصی:
تعداد بازدید : ۵۱۵ تعداد دانلود : ۴۰۶
  در سال های اخیر رشد شبکه های اجتماعی و به تبع آن افزایش فزاینده محتوای این شبکه ها باعث شده است تا افراد برای خرید و استفاده از محصولات، خدمات و یا حتی انتخاب های سیاسی خود از نظرات سایر افراد برای تصمیم گیری استفاده نمایند. با توجه به آنکه نظرات کاربران به صورت متنی است و خواندن و جمع بندی آن ها زمان بر و مشکل است، خودکارسازی استخراج عقاید و احساسات نظرات کاربران یکی از راهکارهای پیشنهادی برای سایت های فروش آنلاین جهت ارائه خدمات کاراتر به مشتریان جهت تصمیم گیری آگاهانه تر است. تحلیل احساسات یا عقیده کاوی فرآیندی است که نظرات، احساسات و نگرش افراد در ارتباط با موضوعی خاص استخراج می شود و به عنوان شاخه ای از متن کاوی شناخته می شود. نتایج حاصل از تحلیل احساسات می تواند در سیستم های پیشنهاددهنده جهت ارائه پیشنهاد های کاراتر برای خرید مورد استفاده قرار گیرد. اطلاعات حاصل از عقیده کاوی می تواند در زمینه های مختلف ازجمله کتابخانه ها در انتخاب بهتر و خرید مبتنی بر نظرات واقعی کاربران کاربرد داشته باشد. در این پژوهش سیستمی جهت دسته بندی خودکار احساسات بیان شده در نظرات مربوط به خریداران کتاب سایت آمازون ارائه شده است. سیستم با استفاده از مدل های ترکیبی برای تحلیل احساسات نظرات کاربران سایت آمازون طراحی شده است. جهت کلیه تحلیل ها از پکیج های متن کاوی پایتون استفاده است. نتایج نشان می دهند سیستم پیشنهادی می تواند به صورت خودکار نظرات مثبت و منفی را با دقت بالای 80% دسته بندی نماید.
۱۳.

جایگاه کتاب و کتابخوانی در سایت تبیان با رویکرد متن کاوی و تحلیل شبکه های اجتماعی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: تحلیل داده های عظیم خواندن داده های جستجویی متن کاوی خوشه بندی موضوعی

حوزه های تخصصی:
تعداد بازدید : ۶۰۷ تعداد دانلود : ۳۲۳
  در این پژوهش با تمرکز بر روی مقوله مطالعه، سایت موسسه فرهنگی و اطلاع رسانی تبیان با استفاده از خوشه بندی موضوعی مورد متن کاوی دقیق قرار گرفته است. با استفاده از روش خوشه بندی موضوعی و متن کاوی، ضمن مشخص نمودن خوشه های موضوعی برجسته و کم اهمیت به بررسی اهمیت این موضوع در میان کاربران شبکه تبیان پرداخته شده است. با توجه به ماهیت فرهنگی تبیان و امر خواندن و مطالعه، جستجوی عبارات کلیدی مرتبط بیشترین نتایج را در طبقه موضوعی فرهنگ به ترتیب با 26 و 18 درصد در اختیار خواهد گذاشت. با توجه به ماهیت مجازی و الکترونیکی بودن سایت تبیان، لازم است بخش آموزش های الکترونیکی این سایت با تولید محتوای آموزشی بیشتر این کمبود را پوشش دهد. باوجود بالا بودن تعداد نتایج حاصل در طبقه موضوعی جامعه، نتایج در کل شبکه برای مقوله کتاب خوانی بسیار اندک به نظر می رسد (تنها به ترتیب 952 و 1199 نتیجه در جستجوی عبارت کلیدی خواندن و مطالعه) و این امر لزوم فعالیت بیشتر تبیان در راستای اعتلای این فرهنگ مغفول مانده در کشور را نمایان می سازد. جامعه جهانی هرروز در پرتو تحولات جدید، فنّاوری مدرن را به جامعه ارائه می دهد و در این میان اگر کسی از دانش روز عقب بماند هیچ فرصت جبرانی برای مهروموم های ازدست رفته ندارد؛ بنابراین، باید برای اهمیت و ارزش دادن افراد به خواندن و مطالعه و ترویج این امر حتی در شبکه های اجتماعی عمیقاً در اندیشه بود و به طور وسیعی برنامه ریزی کرد.  
۱۴.

جستاری بر فرایند سازماندهی و بازیابی متون وبی مبتنی بر تجمیع مفاهیم معنایی در راستای سازماندهی دانش(مقاله علمی وزارت علوم)

کلیدواژه‌ها: متن کاوی طبقه بندی متن الگوسازی عنوان بازیابی سازماندهی دانش هستی شناسی

حوزه های تخصصی:
تعداد بازدید : ۴۵۲ تعداد دانلود : ۴۰۲
سازماندهی و بازیابی دانش منتشر شده در محیط وب بعنوان یکی از مهمترین کاربردهای متن کاوی مطرح شده است. از جمله چالش های سازماندهی مجموعه عظیمی از متون در قالب یک پیکره متنی، ابعاد زیاد ویژگی ها و خلوت بودن ماتریس ویژگی ها است. نحوه ی انتخاب ویژگی ها و نحوه ی کاهش ویژگی ها در این مسئله تاثیر بسزایی در بالاتر رفتن دقت سازماندهی و بازیابی متون دارد. در بسیاری از پژوهش ها به بررسی منفک این دو چالش پرداخته شده است. این پژوهش با رویکرد توجه همزمان به این دو چالش شرح یافته است. پس از تعیین متون مرتبط با 20 گروه خبری وبی و پس از فاز پیش پردازش متون با استفاده از الگوریتم الگو سازی عنوان [1] ال دی ای [2] ، کیسه ای (تجمیعی) از مفاهیم معنایی برای پیکره ی متنی مورد نظر ساخته شد. به منظور بررسی میزان تاثیر واژه های پیکره متون در هر مفهوم پنهان، به بررسی نحوه ی وزن دهی واژگان یک پیکره، در مفاهیم استخراج شده توسط الگوریتم ال دی ای پرداخته شد. از این رو، برای هر متن یک توزیع احتمال رخداد حول هر عنوان استخراج گردید که برای سازماندهی و بازیابی دانش موجود در آن مورد استفاده قرار گرفت. برای سازماندهی آن از الگوریتم نزدیکترین K همسایه با معیار شباهت واگرای کولبک لیبلر که میزان فاصله دو توزیع احتمال را می سنجد؛ استفاده شد. نتایج آزمون ها نشان داد که میزان صحت سازماندهی روش پیشنهادی در صورتی که از معیار وزن دهی واکشی اطلاعات متقابل نقطه ای و الگوریتم KL-KNN استفاده شده باشد 5/82% است. نتایج تحلیل ها نشان داد که این روش دارای دقت مشابهی با روش هایی است که از فنون یادگیری عمیق استفاده می نمایند. افزون بر این، روش بکارگرفته در این پژوهش نشان دهنده پیچیدگی کمتری در فرایند سازماندهی و بازیابی متون مورد مطالعه پژوهش بود. 4. Topic modeling 5. Latent Dirichlet Allocation
۱۵.

ترسیم ساختار فکری حوزه علم اطلاعات و دانش شناسی ایران بر اساس تحلیل هم رخدادی واژگان(مقاله علمی وزارت علوم)

کلیدواژه‌ها: ترسیم ساختار علم نقشه علمی هم رخدادی واژگان تحلیل محتوا متن کاوی تحلیل خوشه ای.

حوزه های تخصصی:
تعداد بازدید : ۵۴۸ تعداد دانلود : ۴۷۴
پژوهش حاضر با هدف ترسیم ساختار حوزه علم اطلاعات و دانش شناسی ایران در پایگاه استنادی علوم جهان اسلام، در دو دوره زمانی پنج ساله طی سال های 1385 تا 1394 انجام شده است . این پژوهش از لحاظ هدف از نوع پژوهش های کاربردی علم سنجی بوده و با استفاده از روش تحلیل هم رخدادی واژگان انجام گرفته است . جامعه پژوهش را 2467 مقاله تشکیل می دهند که در مجله های علمی-پژوهشی حوزه علم اطلاعات و دانش شناسی ایران در پایگاه استنادی علوم جهان اسلام نمایه شده اند. برای تجزیه و تحلیل و آماده سازی داده ها و همچنین ترسیم نقشه ها، از نرم افزارهای اس.پی.اس.اس، بیب اکسل و یو سی آی نت استفاده شده است. یافته های پژوهش نشان داد که در بازه زمانی اول 7 خوشه و در بازه زمانی دوم 13 خوشه موضوعی تشکیل شده است که در هر دو دوره زمانی خوشه علم سنجی مهم ترین خوشه می باشد. با وجود همپوشانی نسبی بین موضوعات دو دوره، موضوعات در دوره دوم از تعداد و وسعت بالاتری برخوردار بودند. در هر دو دوره زمانی موردبررسی، کلیدواژه دانشگاه به ترتیب با فراوانی 82 و 149 پرتکرارترین کلیدواژه به شمار می آید. کلیدواژه های نشریات وکتابخانه های دانشگاهی با فراوانی 54 و 108 به ترتیب در دوره اول و در دوره دوم در جایگاه بعدی قرار دارند. از تفاوت های اصلی موضوعات دوره دوم نسبت به دوره اول حضور موضوعات مرتبط با فناوری اطلاعات بیش از گذشته، نظیر کتابخانه دیجیتال است.
۱۶.

کشف ساختار درونی مطالعات روانشناسی مثبت به روش متن کاوی

کلیدواژه‌ها: ساختار درونی علم روانشناسی مثبت متن کاوی خوشه بندی نمایه سالتون

حوزه های تخصصی:
تعداد بازدید : ۵۹۳ تعداد دانلود : ۳۶۲
این پژوهش با هدف کشف ساختار درونی مطالعات روانشناسی مثبت صورت گرفته است. رویکرد پژوهش پیش رو، در بخش ادبیات نظری و پیشینه های پژوهش، مطالعه ی کتابخانهای و از لحاظ ماهیت، کاربردی و در تجزیه و تحلیل یافته ها، تحلیلی است و از روش همرخدادی واژگان و نهایتاً خوشهبندی متن که از روشهای متنکاویاند برای کشف ساختار درونی و روابط موضوعی مطالعات روان شناسی مثبت استفاده شده است. جامعه این پژوهش، مقالات حوزه روان شناسی مثبت نمایه شده در پایگاه اسکوپوس است. تعداد کل این مقالات که محدود به بازه زمانی 2000 تا 2012 است برابر 1086 مقاله می باشد. پس از استخراج واژه های مرتبط موضوعی از ناحیه عنوان، چکیده و کلیدواژه های همه مقالات و اعمال روش های متن کاوی و ریشه یابی واژه ها، یک ماتریس هم رخدادی با ابعاد 43 × 43 ایجاد شد. برای تفسیر روابط موضوع های اصلی و جزئی ماتریس مذکور استاندارد شده و براساس شباهت وارد نرم افزار ایکس.ال.استد شد. مفاهیم در 7 خوشه بهینه قرارگرفت. برای گام های بعدی تجزیه و تحلیل داده ها از نرم افزار متلب و از نرم افزار پاژک برای نمایش شبکه هم رخدادی واژگان استفاده شده است. نتایج این پژوهش نشان می دهد که خوشه 2 با 10 واژه و خوشه 4 با 9 واژه، به عنوان خوشه های اصلی شناخته می شوند. خوشه 5 بیشترین تعداد موضوع های اصلی از بین مفاهیم منتخب را داراست و خوشه های 2 و 1 کمترین فاصله را دارند، که نشان می دهد ارتباط بین موضوع های اصلی و جزئی در این خوشه ها بیشتر است.
۱۷.

نمایه سازی ماشینی مدارک حوزه بازیابی اطلاعات با استفاده از متن کاوی در نرم افزار «رپیدماینر»(مقاله علمی وزارت علوم)

کلیدواژه‌ها: نمایه سازی ماشینی دسته بندی رپیدماینر متن کاوی بازیابی اطلاعات

حوزه های تخصصی:
تعداد بازدید : ۷۲۷ تعداد دانلود : ۸۲۵
سازگاری کدهای رده بندی و اصطلاحات نمایه سازی از یک اصطلاحنامه مدون با عبارات و کلماتی که به طور خودکار استخراج شده با استفاده از نمایه سازی ماشینی ایجاد می شود. در طراحی نظام نمایه سازی خودکار، کامپیوتر به طور کامل جایگزین انسان می شود. این پژوهش با هدف اس تخراج کلم ات کلی دی و شناسایی گرایش های موضوعی مقالات نمونه آماری در حوزه بازیابی اطلاعات و تخصص موضوعی نویسنده هر مقاله با روش متن کاوی و دسته بندی آنها با استفاده از هم رخدادی واژگان صورت گرفته است. روش این پژوهش از نوع کاربردی است و براساس مدل کریسپ [1] از مدل های فرآیند داده کاوی و الگوریتم های متن کاوی انجام گرفته است. جامعه پژوهش، 313 مقاله حوزه بازیابی اطلاعات نمایه شده در پایگاه نورمگز است. پس از نرمال سازی متن مقالات با نرم افزار ویراستیار، طی متن کاوی مقالات با نسخه 7.1 نرم افزار رپیدماینر، واژگان کلیدی از طریق محاسبه وزن آنها استخراج و داده ها با استفاده از دو الگوریتم کلاسیک دسته بندی یعنی ک.ان.ان. [2] و نایوبیز [3] تجزیه و تحلیل شدند. در پژوهش حاضر، کامپیوتر با کمک ابزارهای متن کاوی نرم افزار رپدماینر، متن ماشین خوان را با استفاده از بسامد واژه ها به طور خودکار نمایه سازی کرده است. بدین منظور با کمک عملگرهای ان-گرام [4] و محاسبه وزن کلمات براساس روش تی.اف ای.دی.اف . [5] ، اصطلاحات و مفاهیم کلیدی و تخصص موضوعی نویسنده هر مقاله در قالب 16 دسته بندی استخراج شده است. سرانجام برتری مدل ک.ان.ان. در دسته بندی موضوعات هسته مقالات این پژوهش با دقت 85 درصدی نسبت به مدل نایوبیز تایید شد . مشاهده نتایج محاسبه دقت های ماخوذه مدل ها، گواه کارایی قابل قبول نرم افزار رپیدماینر در نمایه سازی ماشینی متون است. نمایه سازی متون با استفاده از این روش، می تواند به بهبود نتایج بازیابی اطلاعات و جلوگیری از ریزش کاذب اطلاعات در پایگاه های اطلاعاتی کمک کند.
۱۸.

ارائه مدل دسته بندی موضوعی تولیدات علمی حوزه سلامت با استفاده از روش های متن کاوی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: تولیدات علمی دسته بندی متون سلامت متن کاوی مدل تخصیص پنهان دیریکله مدل موضوعی ماشین بردار پشتیبان یادگیری ماشینی

حوزه های تخصصی:
تعداد بازدید : ۷۱۴ تعداد دانلود : ۵۱۱
با گسترش اینترنت و رشد سریع و روزافزون مقالات الکترونیکی، دسته بندی متون به یکی از ابزارهای کلیدی و مهم برای سازماندهی و مدیریت داده تبدیل شده است. در دسته بندی متون، یک مجموعه دانش اولیه در اختیار سامانه قرار می گیرد تا با یادگیری از این مجموعه، اسناد جدید ورودی به یکی از گروه های موضوعی، ملحق گردد. در متون سلامت به علت تنوع زیاد موضوعات، آماده کردن چنین مجموعه آموزش اولیه عملی بسیار زمان بر و هزینه بر است. هدف از مقاله ارائه مدلی ترکیبی از یادگیری (با نظارت و بدون نظارت) برای دسته بندی موضوعی تولیدات علمی حوزه سلامت است که بدون نیاز به مجموعه برچسب خورده اولیه عمل دسته بندی را انجام دهد. برای استخراج مدل موضوعی متون تولیدات علمی سلامت طی سال های 2009 تا 2019 در پایگاه پابمد، با استفاده از روش آمیخته داده کاوی، شامل متن کاوی و یادگیری ماشینی انجام گرفت. بر اساس مدل موضوعی تخصیص پنهان دیریکله، دادها تحلیل و سپس برای دسته بندی متون، از مدل ماشین بردار پشتیبان استفاده شد. در یافته های این پژوهش، مدل دسته بندی متون سلامت در سه گام اصلی معرفی شد. در گام اول پیش پردازش های لازم بر روی مجموعه داده به دلیل حذف کلمات کم تکرار و غیرضروری از مجموعه داده و افزایش دقت مدل پیشنهادی انجام گرفت. در گام دوم موضوعات موجود در متون به کمک روش احتمالاتی تخصیص پنهان دیریکله استخراج و به عنوان یک مجموعه آموزش اولیه در گام سوم به الگوریتم دسته بندی ماشین بردار پشتیبان داده و عمل یادگیری دسته بند به کمک این موضوعات انجام گرفت. درنهایت به کمک دسته بند، موضوع هر سند مشخص گردید. نتایج نشان داد که مدل پیشنهادی می تواند، یک دسته بندی بهتر با استفاده از ترکیب کردن خواص بدون نظارت خوشه بندی و دانش پیشین نمونه ها بسازد. انجام دادن خوشه بندی روی نمونه های برچسب دار با یک معیار شباهت مشخص، متن های مرتبط را باهم ادغام و یک دانش پیشین ایجاد کرده، سپس الگوریتم یادگیری، دسته بندی را با روشی نظارتی آموزش می دهد. ترکیب دسته بندی و خوشه بندی می تواند دقت دسته بندی متون سلامت را افزایش دهد.
۱۹.

تاثیر قابلیت مقایسه و ثبات رویه حسابداری بر کیفیت سود : رویکرد متن کاوی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: قابلیت مقایسه حسابداری ثبات رویه کیفیت اقلام تعهدی متن کاوی کیفیت سود

حوزه های تخصصی:
تعداد بازدید : ۴۱۷ تعداد دانلود : ۳۰۲
پیدایش مبنای تعهدی در تهیه صورت های مالی و اندازه گیری سودحسابداری منجر به ایجاد پژوهش های کمی، تجربی واثباتی بسیاری در حوزه کیفیت سود گردید. علیرغم تحقیقات زیاد و متناقض صورت گرفته پیرامون کیفیت سود دربازار سرمایه، هنوز هم موضوع کیفیت سود به عنوان یکی از مهم ترین موضوعات مدنظر پژوهشگران حوزه بازارسرمایه می باشد. برخی از پژوهش های دهه اخیر کیفیت سود به سمت استفاده از رویکرد کیفی از قبیل متن کاوی به منظور ارایه یک معیار جدید کیفیت سود گرایش پیدا کرده اند. لذا هدف پژوهش حاضر بررسی تاثیر قابلیت مقایسه و ثبات رویه حسابداری بر کیفیت سود با تاکید بر رویکرد کیفی متن کاوی به منظور ارایه سنجه کیفی معتبر جهت ارزیابی کیفیت سود است. جامعه آماری پژوهش؛ شرکت های پذیرفته شده در بورس اوراق بهادار تهران می باشد. نمونه مورد مطالعه پژوهش شامل 90 شرکت در بازه زمانی 1391-1397 است. جهت آزمون فرضیه های پژوهش از رگرسیون چند متغیره از نوع داده های ترکیبی استفاده شده است. کیفیت سود در پژوهش حاضر بر اساس کیفیت اقلام تعهدی شرکت اندازه گیری شده است. همچنین جهت اندازه گیری ثبات رویه حسابداری از تکنیک متن کاوی(مدل فضای برداری) استفاده شده است. نتایج و یافته های پژوهش نشان می دهد که قابلیت مقایسه حسابداری بر کیفیت سود تاثیر مثبت دارد. همچنین نتایج و یافته های پژوهش موید این است که با افزایش ثبات رویه شرکت، کیفیت سود شرکت نیز افزایش می یابد.
۲۰.

طراحی و پیاده سازی سامانه خلاصه ساز خودکار و معنایی متون فارسی مبتنی بر رویکرد گراف وزن دار

تعداد بازدید : ۵۷۷ تعداد دانلود : ۴۵۲
خلاصه سازی متون یکی از روش های استخراج اطلاعات مفید و مهم از حجم عظیم داده های متنی است که در اهدافی چون تحلیل داده های متنی به کار بسته می شود. طی سالیان متمادی، تکنیک های خلاصه سازی متن بسیاری توسعه داده شده اند که برخی تنها به انتخاب جملات کوتاه و آوردن آن ها در خلاصه بسنده کرده و برخی دیگر بدون توجه به همبستگی معنایی جملات، آن ها را گزینش و در خلاصه می آورند. تحلیل معنایی متون نیازمند روش های استخراج خلاصه با رویکرد معنایی است. در این پژوهش، سامانه ی خلاصه ساز زبان فارسی با استفاده از توسعه و به کارگیری الگوریتم TextRank گوگل و با بهره گیری از مدل سازی سند متنی به صورت گرافی که در آن جملات به صورت گره و ارتباط جملات به صورت یال های گراف و میزان ارتباط معنایی میان جملات به صورت وزن هر یال مدل گردیده، توسعه داده شده است. نتایج پژوهش با بررسی 1146 مقاله فارسی خلاصه شده توسط این سامانه، نشان داد که سامانه توسعه داده شده با اختصاص رتبه ی بالاتر به جملات حامل معنای بیشتر و تهیه خلاصه نهایی از آن ها، عملکرد خوبی در استخراج خلاصه معنایی از متون الکترونیکی فارسی دارد.