موتورهای کاوش وب

۱.

موتورهای کاوش وب، و نمایه سازی و رتبه بندی اشیای محتوایی حاوی عناصر فراداده ای دسترس پذیر در محیط های اطلاعاتی پویا(مقاله علمی وزارت علوم)

نویسنده: فائزه السادات طباطبایی امیری سید مهدی طاهری عبدالحسین فرج پهلو فریده عصاره عبدالحمید معرف زاده

منبع: پژهشنامه پردازش و مدیریت اطلاعات (علوم و فناوری اطلاعات سابق) دوره ۲۷ تابستان ۱۳۹۱ شماره ۴ (پیاپی ۷۰)

کلیدواژه‌ها: رتبه بندی نتایج کاوش زبان نشانه گذاری گسترش پذیر (XML) طرح فراداده ای هسته دوبلین قالب فرا داده ای مارک 21 نمایه سازی عناصر فراداده ای محیط های اطلاعاتی پیوسته پویا موتورهای کاوش وب

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۳۱۰۱ تعداد دانلود : ۱۳۵۹

پژوهش حاضر با هدف تبیین نمایه سازی و رتبه بندی اشیای محتوایی5 حاوی عناصر فرا داده ای هسته دوبلین و مارک 21 مبتنی بر زبان نشانه گذاری گسترش پذیر (XML) در محیط های اطلاعاتی پیوسته پویا توسط موتورهای کاوش گوگل و یاهو و مقایسه آنها با یکدیگر با رویکرد تحلیلی-مقایسه ای انجام شد. جامعه پژوهش را 100 شیء محتوایی (کتاب الکترونیکی) مبتنی بر زبان نشانه گذاری گسترش پذیر (XML) در قالب دو گروه تشکیل می داد. گروه اول، حاوی عناصر فرا داده ای هسته دوبلین و گروه دوم، حاوی عناصر فرا داده ای مارک 21 که از اواخر مرداد 1388 تا خرداد 1389 روی وب سایت http://www.marcdcmi.ir انتشار یافته بودند. ابزار گردآوری داده ها سیاهه وارسی بود. وب سایت مورد مطالعه براساس پیشرفته ترین روش ها به موتورهای کاوش گوگل و یاهو معرفی شد. یافته های پژوهش نشان می دهند که موتور کاوش گوگل توانست عناصر فراداده ای مربوط به دو طرح فراداده ای هسته دوبلین و مارک 21 درج شده در اشیای محتوایی مورد مطالعه را به طور کامل نمایه سازی کند. ولی، موتور کاوش یاهو تا پایان مهلت انتشار (حدود 10 ماه) واکنش مثبتی نشان نداد و فاقد توانایی در نمایه سازی و به تبع آن رتبه بندی اشیای محتوایی مورد مطالعه بود. از دیدگاه مقایسه ای نیز تفاوتی میان نمایه سازی و رتبه بندی عناصر فراداده ای مربوط به دو استاندارد مورد مطالعه توسط موتور کاوش گوگل مشاهده نگردید. در مجموع، یافته ها حاکی از آن بود که هیچیک از دو طرح فرا داده ای هسته دوبلین و مارک 21 مبتنی بر XML منتشرشده در محیط های اطلاعاتی پیوسته پویا از لحاظ دسترس پذیری توسط موتورهای کاوش نسبت به یکدیگر برتری ندارند.

۲.

میانکنش پذیری نظام های فراداده ای و موتورهای کاوش وب: تحولات و رویکردهای جاری(مقاله علمی وزارت علوم)

نویسنده: نجلا حریری سید مهدی طاهری رحمت الله فتاحی فاطمه نوشین فرد

منبع: پژوهشنامه کتابداری و اطلاع رسانی سال سوم پاییز و زمستان ۱۳۹۲ شماره ۲ (پیاپی ۶)

کلیدواژه‌ها: موتورهای کاوش وب میانکنش پذیری نظام های فراداده ای بستر نحوی پیاده سازی

حوزه‌های تخصصی:

تعداد بازدید : ۱۴۵۷ تعداد دانلود : ۹۴۳

هدف: هدف از پژوهش حاضر تبیین مفاهیم، چالش ها، و رویکردهای جاری در حوزه میانکنش پذیری نظام های فراداده ای و موتورهای کاوش عمومی وب است. روش : پژوهش حاضر، پژوهشی مفهومی است که با رویکرد تحلیلی-انتقادی، و با تاکید بر پژوهش های انجام شده به عنوان شواهد مرتبط، در راستای تحقق هدف پژوهش گام بر می دارد. بدین منظور، ضمن تقسیم بندی رویکردهای حوزه مورد مطالعه به چهار بخش اصلی، در هر بخش ابتدا بحثی مفهومی بر رویکرد مرتبط و دلایل پیدایش آن ارائه شده است، و سپس مروری تحلیلی و هدفمند بر پژوهش های مرتبط با آن رویکرد انجام می گیرد. در پایان هر بخش با دیدگاه انتقادی، چالش ها و روندهای جاری مرتبط با رویکرد مورد بحث، بررسی می گردند. یافته ها: چهار رویکرد عمده در حوزه میانکنش پذیری نظام های فراداده ای و موتورهای کاوش عمومی وب شناسایی شدند. دلیل پیدایش این رویکردها، متاثر از کاربرد و آزمون اثر بخشی نظام های فراداده ای در افزایش سطح دسترس پذیری اشیای محتوایی وب از طریق موتورهای کاوش عمومی وب است. یافته ها حاکی از آن است که بستر نحوی پیاده سازی نظام های فراداده ای، بر کاربردپذیری آنها در بافت های اطلاعاتی مختلف، امکان پیاده سازی انواع طرح های فراداده ای متناسب با نیازهای جامعه فراهم کننده خدمات اطلاعاتی پیوسته، و افزایش نمایه پذیری، بازیابی پذیری، پیدانمایی، و رتبه بندی اشیای محتوایی وب در موتورهای کاوش عمومی وب بسیار تاثیر گذار است. موتورهای کاوش عمومی وب به دلایل مختلف، نسبت به برچسب ها و فرابرچسب های زبان نشانه گذاری فرامتن (HTML) واکنش نشان می دهند. با این وجود، محدودیت تعداد برچسب ها و فرابرچسب ها، و کارکرد صرفا نمایشی این زبان، کارایی این زبان را در سازماندهی اشیای محتوایی وب، و قابلیت پیاده سازی دیگر طرح های فراداده ای استاندارد را کاهش می دهد. اما زبان نشانه گذاری گسترش پذیر (XML) با ارائه بستری قابل توسعه، علاوه بر فراهم نمودن امکان پیاده سازی تمامی طرح های فراداده ای استاندارد، نمایه پذیری و بازیابی پذیری اشیای محتوایی وب را به سطح کامل می رساند. بنابراین نظام های فراداده ای مبتنی بر این زبان، کارآمدترین ابزار برای دسترس پذیر نمودن اشیای محتوایی وب بوسیله موتورهای کاوش عمومی هستند.

۳.

واکنش موتورهای کاوش وب به پیشینه های فرادا ده ای مبتنی برروش ترکیبی داده های خرد و روش داده های پیوندی(مقاله علمی وزارت علوم)

نویسنده: سید مهدی طاهری رضا نیکزاد بهله میترا صمیعی

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره ۳۳ زمستان ۱۳۹۶ شماره ۲ (پیاپی ۹۲) 658-639

کلیدواژه‌ها: پیشینه های فراداده ای نمایه پذیری پیدانمایی روش داده های خرد روش داده های پیوندی موتورهای کاوش وب

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۵۷۸ تعداد دانلود : ۵۰۹

پژوهش حاضر، با هدف تبیین واکنش موتورهای کاوش وب به پیشینه های فراداده ای مبتنی بر روش ترکیبی داده های خرد و روش داده های پیوندی با رویکرد تجربی انجام شد. جامعه پژوهش را 200 پیشینه فراداده ای در قالب دو گروه گواه و آزمون با تعداد پیشینه ی برابر تشکیل می دادند. پیشینه های یاد شده به روش نمونه گیری تصادفی، از میان پیشینه های فراداده ای دروازه اطلاعاتی کنسرسیوم محتوای ملی انتخاب شدند . در گروه آزمون، 100 پیشینه فراداده ای انتخاب شده با رویکرد ترکیبی بر مبنای دو روش داده های خرد، به عنوان بهترین روش تولید خرده های غنی، و داده های پیوندی ( قالب آردی اف / ایکس ام ال ) ایجاد، و در گروه گواه، 100 پیشینه بدون تغییر و با قالب اولیه آماده، و بر روی وب سایت http://ww.rnikzad.ir منتشر شدند. سپس وب سایت بیان شده به صورت مستقیم و بر اساس روش های توصیه شده، به موتورهای کاوش گوگل و بینگ معرفی شد . با استفاده از سیاهه وارسی، وضعیت نمایه پذیری و پیدانمایی پیشینه های فراداده ای هر دو گروه در محیط موتورهای کاوش انتخابی مورد بررسی قرار گرفت . یافته های پژوهش حاکی از آن است، موتورهای کاوش گوگل و بینگ ارزش های عناصر پیشینه های فراداده های گروه های گواه و آزمون را نمایه سازی کردند، و پیشینه های مرتبط را با جستجوی ارزش های عناصر فراداده ای در نتایج جستجو پدیدار می نمایند، اما نمایش آنها به شکل معنادار و همانند پیشینه های فراداده ای تولید شده فقط مبتنی بر روش های تولید خرده های غنی نبود. به عبارت دیگر، نرم افزارهای خزنده-نمایه ساز موتورهای کاوش وب توانایی شناسایی و تشخیص برچسب های (عناصر) توصیه شده براساس روش داده های خرد را که در قالب چارچوب توصیف منبع (آر دی اف)، به عنوان چهارچوب و بستر نحوی روش داده های پیوندی، پیاده سازی شده اند، ندارند، و به پیروی از آن، این پیشینه ها را در نتایج جستجو به صورت معنادار نمایش نمی دهند. بنابراین موتورهای کاوش وب با وجود تلاش برای ایجاد وب معنایی، سازگاری کامل با استانداردهای وب معنایی ندارند.

۴.

بررسی تأثیر بستر نحوی بر نمایه سازی و رتبه بندی پیشینه های فراداده ای توسط موتورهای کاوش وب: مقایسه پیشینه های فراداده ای مارک 21 و هسته دوبلین

نویسنده: فهیمه باب الحوائجی سید مهدی طاهری زهرا آقاعابدی

منبع: مطالعات دانش شناسی سال اول تابستان ۱۳۹۴ شماره ۳ 43 - 59

کلیدواژه‌ها: زبان نشانه گذاری گسترش پذیر مارک 21 موتورهای کاوش وب نمایه سازی و رتبه بندی هسته دوبلین

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۴۹۱ تعداد دانلود : ۵۵۸

هدف: پژوهش حاضر با هدف تبیین وضعیت نمایه سازی و رتبه بندی پیشینه های فرا داده ای هسته دوبلین و مارک 21 در بستر نحوی زبان نشانه گذاری گسترش پذیر (ایکس. ام. آل.) مبتنی بر رویکرد پیوند توسط موتورهای کاوش وب انجام شد. روش: روش پژوهش، رویکرد تحلیلی-مقایسه ای بود. جامعه پژوهش را یک صد پیشینه فراداده ای مبتنی بر ایکس. ام.آل. در قالب دو گروه تشکیل می دادند. گروه نخست، دارای عناصر فرا داده ای هسته دوبلین و گروه دیگر، دارای عناصر فرا داده ای مارک 21 بودند که بر روی وب سایت http://www.aghaabedi.com انتشار یافتند. وب سایت یادشده به صورت مستقیم به موتورهای کاوش انتخابی (گوگل و یاهو) معرفی شدند. ابزار گردآوری داده ها سیاهه وارسی بود. یافته ها: یافته ها حاکی از آن است که تمامی ارزش های عناصر پیشینه های فراداده ای هسته دوبلین و مارک 21 در بستر ایکس. ام.آل. توسط موتورهای کاوش گوگل و یاهو نمایه شدند و امکان بازیابی هر یک از پیشینه ها بر اساس ارزش عناصر آن ها در محیط موتورهای کاوش فراهم است. بر اساس نتایج آزمون آماری تفاوت معناداری میان نمایه سازی و رتبه بندی پیشینه های فراداده ای هسته دوبلین و مارک 21 مبتنی بر ایکس. ام.آل. توسط موتورهای کاوش گوگل و یاهو مشاهده نشد. نتیجه گیری: بستر نحوی پیشینه های فراداده ای موردمطالعه موجب افزایش دسترس پذیری آن ها از طریق موتورهای کاوش وب گردید. این امکان برای بستر نحوی پیشین (اچ.تی.ام.آل.) پیشینه های فراداده ای فراهم نبود. همچنین ساختار داده ای پیشینه ها بر اساس ایکس. ام.آل. تأثیری بر روی رتبه بندی آن ها نداشته و از این جنبه هیچ یک از طرح های هسته دوبلین و مارک 21 بر دیگری برتری نشان نداد.

۵.

مقایسه عملکرد موتورهای کاوش وب در نمایه سازی و پیدانمایی پیشینه های فراداده ای مبتنی بر روش داده های خرد

نویسنده: سید مهدی طاهری سارا ذوالقدر نجلا حریری

منبع: مطالعات دانش شناسی سال چهارم پاییز ۱۳۹۷ شماره ۱۶ 83 - 101

کلیدواژه‌ها: پیدانمایی پیشینه های فراداده ای روش داده های خرد موتورهای کاوش وب نمایه سازی

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۶۳۶ تعداد دانلود : ۶۲۴

پژوهش حاضر با هدف تبیین عملکرد موتورهای کاوش وب در نمایه سازی و پیدانمایی پیشینه های فراداده ای مبتنی بر روش داده های خرد به صورت تطبیقی و با روش تجربی انجام شد. جامعه پژوهش را 100 پیشینه فراداده ای (مربوط به کتاب های الکترونیکی) مبتنی بر زبان نشانه گذاری فرامتن (اچ تی ام-ال) در قالب یک گروه آزمون، دارای 50 پیشینه به زبان فارسی و 50 پیشینه به زبان انگلیسی که بر اساس روش داده های خرد ایجاد شده بودند، و یک گروه گواه، دارای یکصد پیشینه فارسی و انگلیسی با ساختار معمولی، تشکیل می دادند. این پیشینه ها با روش نمونه-گیری تصادفی از میان پیشینه های فراداده ای کتابخانه دیجیتالی دانشگاه علامه طباطبائی انتخاب گردیدند. پیشینه های فراداده ای مورد مطالعه بر روی یک وب سایت مستقل با نشانی http://www.szolghadr.ir منتشر، و بر اساس بهترین روش های معرفی شده به موتورهای کاوش گوگل، یاهو و بینگ معرفی شدند. سپس با استفاده از سیاهه وارسی، عملکرد موتورهای کاوش مورد مطالعه در نمایه سازی و پیدانمایی پیشینه های فراداده ای هر دو گروه مورد بررسی قرار گرفت. موتور کاوش گوگل پیشینه های فراداده ای هر دو گروه آزمون و گواه را نمایه سازی، و پیشینه های گروه آزمون را به صورت معنادار در نتایج جستجو پدیدار نمود. اما موتورهای کاوش یاهو و بینگ، پیشینه های هر دو گروه را فقط نمایه سازی نموده، و قادر به پیدانمایی معنادار پیشینه های گروه آزمون نبودند. بنابراین با وجود اعلام موتورهای کاوش معتبر وب، به عنوان طراحان فرانمای تولید داده های ساختارمند (schema.org)، مبنی بر نمایه سازی و نمایش معنادار پیشینه های فراداده ای مبتنی بر روش داده های خرد، تنها موتور کاوش گوگل پیدانمایی معنادار آنها (به صورت خرده های غنی) را پشتیبانی نمود.

۶.

طراحی صفات داده ای مستند مبتنی بر روش داده های خرد و بررسی واکنش موتورهای کاوش وب به پیشینه های مبتنی بر آن(مقاله علمی وزارت علوم)

نویسنده: سید مهدی طاهری سمیرا آقاده ده زاده محمدرضا تقوا منیره قاسمی نگین شکرزاده هشترودی

منبع: تحقیقات کتابداری و اطلاع رسانی دانشگاهی دوره ۵۶ زمستان ۱۴۰۱ شماره ۴ 69 - 88

کلیدواژه‌ها: گسترش داده های مستند پیشینه های فراداده ای فرانمای تولید داده های ساختارمند داده های خرد موتورهای کاوش وب

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۲۸۲ تعداد دانلود : ۳۱۲

هدف: پژوهش حاضر با هدف طراحی صفات داده های مستند مبتنی بر روش داده های خرد و تبیین واکنش موتورهای کاوش وب به پیشینه های مبتنی بر آن انجام شد. روش پژوهش: این پژوهش به روش تجربی انجام شد. جامعه پژوهش شامل 400 پیشینه فراداده ای مستند مبتنی بر روش داده های خرد و بستر نحوی جی سان-ال. دی. از کتابخانه دیجیتالی دانشگاه علامه طباطبائی بود. گروه گواه را 200 پیشینه، شامل 100 پیشینه مربوط به توصیف کتاب در قالب داده های خرد و 100 پیشینه مشابه دیگر در قالب جی سان-اِل. دی. تشکیل می دادند، و گروه آزمون را 200 پیشینه، دارای 100 پیشینه با گسترش های داده های مستند در قالب داده های خرد و 100 پیشینه مشابه دیگر در قالب جی سان-اِل .دی.، (که 50 نمونه برای مستند نام ها و 50 نمونه دیگر مستند موضوعات) بود. پیشینه های یاد شده بر روی وبگاهی مستقل به نشانی www.aghadeh.ir منتشر و به موتورهای کاوش طراح فرانمای تولید داده های ساختارمند (اسکیما.اُرگ) معرفی گردید. سپس از طریق جستجو در موتورهای کاوش یاد شده با استفاده از ابزار گردآوری داده ها یعنی سیاهه وارسی تهیه شده توسط پژوهشگران، چگونگی نمایه سازی و بازیافت پذیری پیشینه های فراداده ای گروه های گواه و آزمون در نتایج جستجوی موتورهای کاوش منتخب مورد ارزیابی قرار گرفت. یافته ها: یافته ها حاکی از آن است که موتورهای کاوش قادر به نمایه سازی و بازیافت پذیرسازی تمامی پیشینه های جامعه پژوهش و ارزش های گسترش های مرتبط با داده های مستند طراحی شده بودند. چنین امکانی برای پیشینه های داده های مستند نام و داده های مستند موضوعی وضعیت یکسانی داشت. نتیجه گیری: با ایجاد امکان نمایه پذیری و پدیدارنمایی معنایی هر یک از ارزش های صفات ناگزیده در پیشینه های گروه آزمون، افزون بر ارزش های مرجح نام و اصطلاحات موضوعی، جامعیت بازیابی در موتورهای کاوش افزایش، و کنترل مستندات در مهمترین ابزارهای کاوش وب بهبود خواهد یافت.

۷.

واکنش موتورهای کاوش وب به پیشینه های فراداده ای نشانه گذاری شده موجودیت شخص (چهارده معصوم(ع)) مبتنی بر فرانمای تولید داده های ساختارمند(مقاله علمی وزارت علوم)

نویسنده: رضا کریمی مرتضی محمدی استانی محمدرضا نصیری

منبع: علوم و فنون مدیریت اطلاعات دوره ۸ بهار ۱۴۰۱ شماره ۱ (پیاپی ۲۶) 97 - 116

کلیدواژه‌ها: فرانمای تولید داده های ساختارمند موجودیت شخص موتورهای کاوش وب نشانه گذاری معنایی چهارده معصوم (ع) داده های خرد جی. سان-ال. دی موتور کاوش گوگل موتور کاوش بینگ

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۵۰ تعداد دانلود : ۷۹

هدف: هدف این پژوهش بررسی واکنش موتورهای کاوش وب به پیشینه های فراداده ای نشانه گذاری شده موجودیت شخص (چهارده معصوم(ع)) مبتنی بر فرانمای تولید داده های ساختارمند در دو سطح نمایه پذیری و پیدانمایی معنایی است. روش : روش پژوهش حاضر از نوع تجربی می باشد. جامعه پژوهش مشتمل بر 42 پیشینه فراداده ای در قالب دو گروه آزمون (14 پیشینه در فرمت داده های خرد و 14 پیشینه در فرمت جی. سان- ال. دی.) و یک گروه گواه (14 پیشینه در فرمت اچ. تی .ام. ال.) هستند. جامعه آماری دیگر، موتورهای کاوش وب می باشند که با روش هدفمند، موتورهای کاوش گوگل و بینگ انتخاب شدند. این پیشینه ها در وب سایتی مستقل منتشر و به صورت مستقیم به موتورهای کاوش معرفی شدند. روش گردآوری داده ها، روش مشاهده ساختارمند و ابزار گردآوری داده ها، سیاهه وارسی محقق ساخته بود. نتایج: یافته ها نشان داد که موتورهای کاوش گوگل و بینگ، پیشینه های فراداده ای موجودیت شخص در دو گروه آزمون (داده های خرد و جی. سان- ال .دی.) را نمایه و همچنین به صورت معنادار پیدانمایی کردند. همچنین پیشینه های گروه گواه در موتورهای کاوش، نمایه شد، اما به سطح پیدانمایی معنایی نرسید. نتیجه گیری: استفاده از فرانمای تولید داده های ساختارمند و بستر نحوی آن برای نشانه گذاری جهت ایجاد خرده های غنی موجب بهبود نمایه پذیری و پیدانمایی معنایی آنها در موتورهای کاوش وب خواهند شد. ایجاد داده های ساختارمند در محیط وب، تحقق وب معنایی، و بازیابی دانش را به دنبال خواهد داشت.