پیکره قرآنی فرقان
- آخرین به روز رسانی پنج شنبه, 25 بهمن 1397 02:46
معرفی پروژه
امام علی (ع) میفرماید: "قرآن را زمانه تفسیر میکند."
در برداشت از چنین روایاتی است که علامه طباطبایی هر دهه را نیازمند تفسیری جدید از قرآن دانستهاند و بدیهی است این مهم مستلزم بهره مندی از فناوریهای معاصر است. با این نگرش و در پیروی از امر امام راحل (ره) به تلاش در تنقیب قرآن، "شبکه پژوهشی قرآن کاوی" (Quran Mining Research Network) در دهه اخیر شکل یافته است تا با بهره گیری از فناوریهای متن کاوی (Text Mining) ابزار پیشرفته هوش مصنوعی رایانه را در خدمت اکتشاف اطلاعات پنهان متن قرآن قرار دهد. محققین این شبکه تلاش دارند نه تنها بحثهای حل نشده و شبهههای ایجاد شده برای قرآن را مرتفع سازند، بلکه جنبههایی ناشناخته از این اصلی ترین منبع هدایت را به بشریت عرضه کنند. در همین راستا طراحي و پيادهسازي پيكره متني قرآن كريم در قالب RDF و به شكل محتواي الكترونيكي، حاوي اطلاعات صرفي و نحوي، امكان استفاده و كاوش را براي هر گونه پژوهش و پردازش هوشمند ايجاد خواهد کرد.
تبيين اعجاز زباني قرآن كريم، در دستيابي به لايههاي نامشهود زباني اين متن الهي میباشد. بدین ترتیب پس از فراهم شدن بستر مناسب جهت متن کاوی روی قرآن کریم میتوان با طراحی و بهره گیری از ابزارهای متن کاوی به اکتشاف کلامی و معنایی متن قرآن کریم پرداخت. دانش هوشمند متن كاوي (text mining) به عنوان جديد ترين وجه همكاري بين دانشهاي فناوري اطلاعات، زبانشناسي و ادبيات در كاوش رايانه اي متون بشري قصد حصول اين امر را دارد و چنين كاوشي مستلزم ايجاد پيكرههاي متني برچسب گذاري شده از آن متون است كه به شكل محتوايي الكترونيكي حاوي اطلاعات صرفي و نحوي متون مورد نظرند.
پیکره متنی و زیرساختی که تحت عنوان "پیکره فرقان" برای قرآن کریم تولید گردیده است، حاصل بهرهگیری از سامانه ای هوشمند است که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد، طراحی و پیاده سازی شده است. این پیکره با بیش از 587 مگابایت داده، حاوی کلیه ی اطلاعات قرآنی، آماری، متن و ترجمه فارسی و انگلیسی آیات و برچسب گذاری صرفی و نحوی متن عربی، فارسی و انگلیسی آیات، ریشه یابی کلمات آنها و بسیاری موارد دیگر در قالب RDF است و امکان استفاده و کاوش را برای هرگونه پژوهش و پردازش هوشمند ایجاد کرده است.
با اطلاعات تولید شده در قالب RDF برای سوره، آیه، صفحه، صرف و نحو آیات و حروف الفبایی، دامنهی وسیعی از اطلاعات مفید و سودمند برای انجام عملیات متن کاوی برای پژوهشگران و محققان قرآنی فراهم گردیده است. با بهره گیری از دانش هوشمند متن كاوی بر روی پیكره های متنی برچسب گذاری شده قرآن کریم و تهیه آنتولوژی یا هستان شناسی جامعی از مفاهیم موجود در قرآن کریم، در گام های آتی می توان در تبیین اعجاز زبانی قرآن كریم با دستیابی به لایه های نامشهود زبانی این متن الهی گام برداشت.
لازم به ذکر است که کلیه مفاهیم و موجودیت های موجود در پیکره ی جمع آوری شده، به آنتولوژی ها و مفاهیم مشابه با آنها در وب، لینک داده شده اند. به طوری که پیکره ی موجود در حال حاضر شامل بیش از 332.589 پیوند می باشد که تعداد 33.854 مورد از آنها منحصر بفرد می باشد. در کل پیکره ی تهیه شده با حجم داده ای نزدیک به 587 مگابایت، بیش از 13.298 RDF وجود دارد. همچنین 13.299 فایل HTML (صفحه وب) برای بازنمایی اطلاعات RDFها وجود دارد.
در حال حاضر ابزار پارس کردن اطلاعات صرف و نحوی آیات، طراحی گردیده است و کار برای طراحی ابزاری جهت SPARQL زدن بر روی داده های RDF قرآنی ادامه دارد. از جمله اقداماتی که می توان در گام های آتی جهت غنی تر شدن خروجی کار و همچنین تولید دانش از پیکره ی موجود به آنها پرداخت، می توان به موارد ذیل اشاره نمود:
- مشخص کردن موضوع و مفهوم غالب در هر سوره با بررسی و پردازش مفاهیم مندرج در آیات سوره. - پردازش متن و دسته بندی موضوعات سوره ها و آیات و مشخص کردن رابطه بین آنها.
- ساخت آنتولوژی موضوعات و مفاهیم قرآن.
- منتسب کردن آیات به مفاهیم. - به دنبال آن، تعیین ارتباط بین لغات، آیه ها، سوره ها، جزء ها و غیره با پیوند دادن آنها با اطلاعات موجود در وب. - تکمیل و گسترش آنتولوژی مفاهیم قرآنی با روند یادگیری ماشینی و ...
-پرسش و استنتاج بر روی پیکره ی تولید شده با SPARQL زدن بر روی داده های RDF و پارس کردن فایل XML حاوی اطلاعات صرف و نحو متن عربی آیات و تجزیه - تحلیل انسانی و یا هوشمند نتایج جهت کشف روابط کلامی و معنایی پنهان در متن قرآن کریم.
لینک های پروژه
پیکره قرآنی فرقان
توضیحات و مستندات
دانلود پیکره گردآوری شده
اعضای پروژه
زمینه پژوهشی
تاریخ اجرا
1391
پایان نامه ها
مقالات