RSS      English

خانه پروژه ها پروژه ها سامانه خلاصه ساز ایجاز

سامانه خلاصه ساز ایجاز

ijaz-logo
 معرفی پروژه
 

پروژه سامانه خلاصه ساز تک سندی و چندسندی ایجاز، به سفارش سازمان فناوری اطلاعات ایران و توسط آزمایشگاه فناوری وب دانشگاه فردوسی مشهد انجام شد. در این پروژه بزرگ، مجموعه ای از ابزارهای مورد نیاز برای تولید سامانه های خلاصه ساز تولید گردید. همچنین نسخه تحت وب خلاصه ساز تک سند و چند سندی نیز تولید گردید که در صفحه اصلی سایت قابل مشاهده می باشد. این سامانه قابلیت تولید خلاصه برای متون تک سندی و چند سندی فارسی و انگلیسی را دارد. برای تولید این سامانه از معیارهای گوناگونی استفاده شده است.

همچنین برای اولین بار در کشور، پیکره بزرگ خلاصه سازی فارسی برای ارزیابی سیستم های خلاصه ساز با استفاده از استانداردهای لازم و با صرف بیش از 2000 نفر-ساعت زمان تولید گردید. پیکره «پاسخ» (پیکره استاندارد سامانه های خلاصه ساز) در دو مدل تک سندی و چند سندی ارائه گردیده است. پیکره تک سندی شامل 100 موضوع مختلف از انواع گونه های خبری بوده که از خبرگزاری های پرببینده ایران انتخاب شده اند. هر کدام از این موضوعات دارای 5 خلاصه چکیده ای و استخراجی می باشند که توسط کارشناسان آموزش دیده تولید شده اند. پیکره چند سندی "پاسخ" نیز شامل 50 موضوع می‌باشد که هر موضوع حاوی 20 سند بوده و همچنین هر موضوع شامل 5 خلاصه انسانی و چکیده‌ای می باشد.

همچنین برای اولین بار در کشور ابزار ارزیابی سامانه‌های خلاصه‌ساز نیز تولید گردید. این ابزار قادر است تا با استفاده از معیارهای گوناگون و با بهره گیری از خلاصه های انسانی تولید شده در پیکره «پاسخ»، سامانه های خلاصه سازی را ارزیابی نماید. این ابزار در بخش "ابزارهای سایت" قابل دانلود می باشد. ابزارهای دیگری نیز جهت پیش پردازش زبان طبیعی تولید گردیده که قابل دانلود می باشد.

 
 لینک های پروژه

 

  • سامانه خلاصه ساز ایجاز

  •  

     اعضای پروژه

     

    پروژه ایجاز زیر نظر جناب آقای دکتر محسن کاهانی و با حضور بیش از 20 نفر از دانشجویان مقاطع دکتری، کارشناسی ارشد و کارشناسی از رشته های مهندسی کامپیوتر و زبانشناسی دانشگاه فردوسی و با همکاری سازمان فناوری اطلاعات ایران اجرا شد. لیست اعضای شرکت کننده در پروژه در بخش ذیل موجود می باشد.

  • تیم تحقیقاتی و اجرایی پروژه:

  • آصف پورمعصومی - احسان عسگریان - احمد طوسی - رضا سعیدی - احمد استیری - محسن حسینی - هادی قائمی - فاطمه پور غلامعلی

  • تیم تولید پیکره:
  •  بهداد بهمدی - محمد امین حسینی - امیر رضا بهرامی - سعید کرواشی - نیلوفر حسین زاده - مهدی جنتی - سیده فاطمه میر حسینی - افسانه چهکندی - فاطمه ارجمند - فاطمه حکیمی - نرگس شفازاده - آسیه علی رضایی - صفورا ابراهیمی 

     

       انتشارات  
  • آصف پورمعصومی حسن کیاده , محسن کاهانی , محسن کامیار , حسین کامیار , خلاصه‌سازی خودکار چند سندی مبتنی بر مفاهیم , شانزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران , 2011-03-08.

  • حسین کامیار , محسن کاهانی , محسن کامیار , آصف پورمعصومی حسن کیاده , روش جدید خلاصه‌سازی استخراجی تک سندی با استفاده از نظریه مرکزیت , شانزدهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران , 2011-03-08.

  • احمد استیری، محسن کاهانی، آصف پورمعصومی ، ارائه یک ابزار ارزیابی خودکار خلاصه‌سازهای چکیده‌ای فارسی با بهره‌گیری از شبکه واژگان، نخستین کنفرانس بین‌المللی پردازش خط و زبان فارسی، دانشکده مهندسی برق و کامپیوتر دانشگاه سمنان، شهریور 1391.

  • فاطمه پورغلامعلی، محسن کاهانی،آصف پورمعصومی، خلاصه سازی چکیده ای مبتنی بر مشابهت جملات، نخستین کنفرانس بین‌المللی پردازش خط و زبان فارسی، دانشکده مهندسی برق و کامپیوتر دانشگاه سمنان، شهریور 1391.

  • فاطمه پورغلامعلی، محسن کاهانی، آصف پورمعصومی، شباهت معنایی جملات مبتنی بر نقش های معنایی، 17 امین کنفرانس انجمن کامپیوتر ایران – دانشگاه صنعتی شریف، 1390

  • احمد استیری، محسن کاهانی، زهرا کیوانلو، آصف پورمعصومی، ابزار ارزیابی خودکار خلاصه سازهای ماشینی فارسی، چهارمین کنفرانس فناوری اطلاعات و دانش، دانشگاه صنعتی نوشیروانی بابل، خرداد 1391.

  • احمد استیری، محسن کاهانی، رضا سعیدی، احسان عسگریان، طراحی ابزار پارسر فارسی، نخستین کنفرانس بین‌المللی پردازش خط و زبان فارسی، دانشکده مهندسی برق و کامپیوتر دانشگاه سمنان، شهریور 1391.

  • احمد استیری، محسن کاهانی، فاطمه پورغلامعلی، دسته بندی روش های محاسبه میزان تشابه معنایی لغات و جملات با بهره گیری از شبکه واژگان، نخستین کنفرانس بین‌المللی پردازش خط و زبان فارسی، دانشکده مهندسی برق و کامپیوتر دانشگاه سمنان، شهریور 1391.

  • asef pourmasoumi , Mohsen Kahani , Saeed Varasteh Yazdi , hossein kamyar , Context-Based Persian Multi-Document Summarization (global view) , International Conference on Asian Language Processing 2011 , 2011-11-15.

  • hossein kamyar , Mohsen Kahani , Mohsen Kamyar , asef pourmasoumi , An Automatic Linguistics Approach for Persian Document Summarization , International Conference on Asian Language Processing 2011 , 2011-11-15.

  • Mohammad Hadi Zahedi , Mohsen Kahani , SREC: Discourse-level semantic relation extraction from text , Neural Computing & Applications , Volume ( 21 ) , 2012-9, Pages 1-1.

  • پایان نامه کارشناسی ارشد، خلاصه سازی خودکار چندی سندی مبتنی بر استخراج مفاهیم، آصف پورمعصومی 1390.

  • پایان نامه کارشناسی ارشد، ارائه یک روش جدید وزن دهی به کلمات با استفاده از تئوری مرکزیت ، حسین کامیار 1390.

  • پایان نامه کارشناسی ارشد، معنا گرایی در ارزیابی خودکار خلاصه سازهای ماشینی انگلیسی و فارسی با بهره گیری از شبکه واژگان ، احمد استیری 1391.

  • سمینار، ابزارهای پردازش زبان طبیعی، آصف پورمعصومی، حسین کامیار، 1390.

  • سمینار،Concept based Multi-Document Text Summarization ، آصف پورمعصومی، 1389.

  • سمینار،Text Summarization ، آصف پورمعصومی، 1388.

  • سمینار،User-Oriented Text Summarization ، آصف پورمعصومی، 1388.

  •  

    خانه پروژه ها پروژه ها سامانه خلاصه ساز ایجاز