RSS      English

رتبه بندی نتایج

رتبه بندی به دو دسته تقسیم می شود، رتبه بندی بر اساس پرسش و رتبه بندی مستقل از پرسش. رتبه بندی ارائه دهندگان دانش و منابع ،که مستقل از پرسش است، از قبل محاسبه می شود و در زمان رتبه بندی بر اساس پرسش از آنها استفاده می شود. رتبه بندی نتایج ، بر اساس پرسش ،در زمان انتظار کاربر صورت میگیرد بنابراین باید زمان اجرای الگوریتم آن کمینه باشد و محاسبات سنگین مورد نیاز آن قبلا انجام شده باشند، چون بطور مستقیم در رضایتمندی کاربر تاثیر گذار است. الگوریتم های رتبه بندی در موتورهای جستجو بر اساس فاکتور شهرت که با تحلیل ساختار لینکی مشخص می شود انجام میگیرد. برای این کار الگوریتم های زیادی ارائه شده اند که از آن میان pageRank و HITS وSALSA مشهورترند. ولی در موتورهای جستجوی معنایی باید فاکتور کیفیت نتایج نیز از روی provenance آنها استخراج شود و در رتبه بندی نتایج جستجو موثر باشد. در حال حاضر موتورهای جستجوی معنایی مشهور عبارتند از Swoogle و SWSE و Sindice . روشهای موجود برای رتبه بندی نتایج دقیقا قابل اعمال برای داده های ساخت یافته نیستند چون: 1) واحدهای نتایج اولیه ی جستجو به جای صفحات، اشیایی هستند که ممکن است با چندین منبع مرتبط باشند. 2) کاربران علاوه بر جستجوی کلمات کلیدی قادرند نیازهای اطلاعاتی خود را از طریق پرس و جو های دقیق بیان کنند. 3) لینکهای وب معنایی بر خلاف لینکهای وب اسناد، دارای نوع و منبع هستند و نوع لینک و منبعی که لینک را منتشر کرده است در میزان انتشار اعتماد از یک منبع به منبع دیگر تاثیر گذار است. بنابراین الگوریتم های تحلیل لینک وب اسناد و متریکهای انتشار اعتماد برای استفاده در رتبه بندی نتایج جستجوهای معنایی، باید بازبینی کلی شوند.

 

 

الگوریتم های رتبه بندی

یکی از مسائل اساسی در جستجوی اطلاعات، رتبه بندی نتایج بازگردانده شده است. چون پرسشهای کاربر کوتاه است(در حد 2-3 کلمه کلیدی) و او فقط 10 نتیجه اول را بررسی میکند. در روشهای سنتی بازیابی اطلاعات، نزدیکی نتایج، تنها با تحلیل انبار اطلاعاتی موجود (محتوی و ساختار لینک) بود و بنابراین مدل ضعیفی برای محاسبه نزدیکی نتایج با پرسش وجود داشت. در وب معنایی فرآیند پرس وجو توسط آنتولوژی پشتیبانی می شود بنابراین از منابع دیگری برای محاسبه نزدیکی نتایج میتوان استفاده کرد:
ساختار حوزه و ویژگیهای فرآیند جستجو.
برای جستجو باید از همه پتانسیل ساختار لینکی مفهومی بر اساس آنتولوژی و محتوی انبار اطلاعاتی و ویژگیهای استنتاج استفاده کرد.
لایه های وب معنایی طوری طراحی شده اند تا ماشین هم بتواند منابع اطلاعاتی را جستجو کند و لایه های بالاتر باید بتوانند فرآیند ایجاد یک قطعه اطلاعاتی را بیان کنند تا بتوان به اطلاعات اعتماد کرد.
2 تفاوت اساسی بین بازیابی اطلاعات در وب و جستجوی اطلاعات در وب معنایی وجود دارد.
1) به جای جستجو به دنبال اسناد وب، یک عامل وب معنایی به دنبال منابعی میگردد که یک سری شرایط تعریف شده فرمال را برآورده میکند. همه منابعی که بازیابی شده اند به پرسش نزدیک هستند. در نتیجه معیار precision و recall که برای تخمین کیفیت بازیابی اطلاعات در وب خیلی مناسب بود،برای بازیابی منابع در وب معنایی اهمیت چندانی ندارد.(مهم کیفیت اطلاعات است)
2) جستجو استنتاج بر اساس آنتولوژی است که بازیابی اطلاعاتی که صریحا در انبار اطلاعاتی ذخیره نشده اند را ممکن میسازد. با استفاده از دانشی که در آنتولوژی حوزه پنهان است، میتوان در حین فرآیند جستجو یک سری عبارات جدید بدست آورد. به این صورت اگرچه همه ی نتایج بازیابی شده با پرسش مرتبط هستند اما استنتاج آنها ممکن است متفاوت باشد و برای رتبه بندی نتایج از آن استفاده می شود.
هر دو تفاوت روی نقش رتبه بندی نتایج یک پرسش در وب تاکید دارند. فرآیند رتبه بندی باید از همه مزایای مدل مفهومی (آنتولوژی حوزه) در توصیف اطلاعات استفاده کند.قدرت آنتولوژی در تعیین فرمال و صریح خصیصه های محدودیتها بین موجودیتهای حوزه است. (یک موجودیت یک مفهوم یا رابطه است). یکی از مهمترین مکانیزم ها برای توصیف محدودیتها بین موجودیتها قوانین هستند.