RSS      English

موتورهای جستجوی معنایی و داده های عظیم

pdficon pdficon audioicon videoicon

ارائه دهنده: مریم خدابخش                     تاریخ ارائه:  16 اردیبهشت 1394

موتورهای جستجوی با کد باز

موتورهای جستجوی با کد باز

ارزیابی موتور جستجو

فاکتور های ارزیابی : 1) زمان ایندکس گذاری، 2)حجم ایندکس، 3) کارایی بهنگام رسانی افزایشی، 4)کارایی زمان پرس وجو(یک مجموعه پرسشهای استاندارد وجود دارد که به موتور جستجو داده می شود مقایسه زمان پاسخگویی موتور جستجو به این پرسشها تحلیلی از کارایی موتور جستجو را ارائه میکند.) 5) تزریق اسپم به دیتاست پویش شده و مشاهده رتبه اسپم ها در نتایج جستجو است.

ادامه مطلب: ارزیابی موتور جستجو

کشف اسپم و هویتهای جعلی بر اساس اعتماد

اسپم در داده های پیوندی
صفحات اسپم در وب از تکنیکهای مختلفی برای رسیدن به رتبه های بالا در نتایج جستجوی موتورهای جستجو و گمراه کردن آنها استفاده میکنند. انسانها برای شناسایی صفحات اسپم و با کیفیت پایین مشکلی ندارند اما استفاده از نیروی انسانی در وب امروز برای شناسایی اسپم ها خیلی وقت گیر و پرهزینه و غیرمعقول است. موتورهای جستجو باید ویژگیهای دوگانه ی کیفیت نتایج و مرتبط بودن را با هم لحاظ کنند تا بتوان از حجم زیاد اطلاعات روی وب استفاده کرد. در تکنیکهای بهینه سازی موتور جستجو و بازیابی رقابتی اطلاعات هدف یافتن تابع نمره دهی موتورجستجو و بالابردن مصنوعی رتبه ی یک صفحه در نتایج بازیابی شده است، تا بتوان از منافع تجاری صفحاتی که در رتبه های بالا ظاهر می شوند استفاده کرد. با توجه به غیر ممکن بودن استفاده از نیروی انسانی برای کشف صفحات اسپم، باید این فرآیند را خودکار کرد و چون اسپمرها متناوبا تکنیکهای خود را تغییر میدهند تا موتورهای جستجو را گمراه کنند، مقابله ی اتوماتیک با آنها خیلی دشوار است.

ادامه مطلب: کشف اسپم و هویتهای جعلی بر اساس اعتماد