RSS      English

روش های ارزیابی خلاصه سازها

يک مرحله تعيين کننده در هر سيستم ، روش ارزيابي و اعتبارسنجي ادعاي بيان شده است . سيستم ها ي پردازش زبان طبيعي نيز از اين قاعده مستثني نيستند. بلکه با توجه به بي قاعدگي هاي زبان انساني ، اثبات منطقي اين پيکره ي بي قاعده ، يک ريسک است. يک رويه متداول براي برقراري ارتباط با اين حقيقت ، استفاده از اعتبارسنجي به کمک استقرا است. بنابراين آزمايش با يک بدنه داده ، به صورت زيرمجموعه اي از يک مجموعه کامل تقريبا نامحدود از سخنان درنظر گرفته مي شود .در نتيجه نمود رويه اي خاص ، مي تواند در قالب يک آزمايش، اعتبارسنجي شود.

ادامه مطلب: روش های ارزیابی خلاصه سازها

کاربردهای خلاصه سازی خودکار متن

 

حوزه هاي کاربرد خلاصه سازي
زمينه هاي کاربردي خلاصه سازي خودکار متن گسترده است . با رشد قابل ملاحظه ميزان اطلاعات در اينترنت ، انتخاب اطلاعات مرتبط ، کار مشکلي است. اطلاعات بطور همزمان روي بسياري از کانالهاي رسانه اي با نسخه هاي مختلف منتشر مي شود . براي مثال يک صفحه روزنامه ، صفحه خبر در وب ، پيغامهاي SMS ، پخش اخبار راديو و روزنامه سخنگو براي کسانيکه مشکل بينايي دارند. تنظيم اطلاعات براي کانالها و فرمتهاي مختلف يک کار ويرايشي مهم است که خصوصا در خلاصه کردن متن اصلي نقش دارد.

ادامه مطلب: کاربردهای خلاصه سازی خودکار متن

خلاصه سازی متن

سيستم هاي خلاصه ساز معروف
در اين قسمت در نظر داريم تعدادي از سيستم هاي معروف خلاصه سازي را معرفي نماييم. ازآنجايي که تعداد اين سيستم ها زياد مي باشد ، فقط به بخشي آز آنها خواهيم پرداخت.

DMSumm
سيستم DMSumm يک رويکرد عميق در مسئله خلاصه سازي متن است که سه مرحله دارد : انتخاب محتوي ، طرح ريزي متن و ادراك زباني. پروسه انتخاب محتوا ، اطلاعاتي که در خلاصه بايد وارد شود را مشخص مي کند. طرح ريزي متن نگاشتي از روابط معنايي و مفهومي به روابط rhetorical انجام مي دهد که منجر به ساخت طرحهاي rhetorical از متن مي شود. ادراکات زباني بيان کننده طرحها در خلاصه هاي نوشته شده هستند. اين عمل بر پايه مدل سخني است که از سه منبع دانش مختلف (معنايي ، مفهومي و rhetorical) ساخته شده است. اين سيستم به چند محدوديت غلبه کرده است : تحقق هدف فصاحت ؛ و حفظ موضوع مرکزي.

ادامه مطلب: خلاصه سازی متن