آرشیو

آرشیو شماره ها:
۱۱۷

چکیده

شناسایی نویسنده یکی از مسایل مهم در دسته بندی متن و پردازش زبا نهای طبیعی به شمار می رود. این نوشتار دستآورد پژوهشی با هدف تعیین هوشمند نوشته های 50 نویسنده سایبری(50 نفر از مشتریان بالقوه ی وب سایت آمازون با توجه به پیام ها و مراجعاتی که به این وب سایت داشته اند انتخاب شده اند) به کمک روش های یادگیری ماشین است. برای سنجش کارایی روش پیشنهادی، دقت تصمیم گیری آزموده و نتایج آنها با بازدهی روش های یادگیری ماشین مقایسه شده است. همچنین در هنگام استخراج ویژگیهای گوناگون نوشته های نویسندگان برای ارزیابی توسط ماشین، کوشش شده تا حداکثر ویژگی های مورد نیاز برای تشخیص نویسنده شبیه سازی گردد و بدین منظور، نزدیک به10000 ویژگی گوناگون از نوشته های مختلف استخراج شده و در چهار دسته ی ویژگی های لغوی ، ویژگی های نحوی ، ویژگی های خاص و ویژگی های ساختاری قرار گرفته اند. در این پژوهش به طور میانگین دقت تعیین نویسنده به کمک روش پیشنهادی تا 98/78 درستی نیز رسیده است.

تبلیغات