20 تیر 1399

سودابه محمدی

مرتبه علمی:
نشانی:
تحصیلات: کارشناسی ارشد / مهندسی کامپیوتر
تلفن:
دانشکده: دانشکده فناوری اطلاعات

مشخصات پژوهش

عنوان
شناسایی گرامر زبان فارسی با استفاده از تجریه گر پیشگو
نوع پژوهش مقاله ارائه شده
کلیدواژه‌ها
ثبت نشده‌است!
پژوهشگران سودابه محمدی (نفر اول)

چکیده

تجزیه و ترکیب نحوی زبان های طبیعی یکی از چالش های پیش روی پژوهشگران حوزه پردازش زبان های طبیعی است که دارای دو بخش عمده می باشد. اول ارائه گرامری که بتواند با ترکیب واژگان یک زبان جملاتی با ترکیب نحوی درست بسازد و دوم طراحی تجزیه گری که با بکارگیری گرامر منجر به تجزیه ی جملات به ساختار های نحوی آنها شود. در این مقاله ابتدا یک گرامر مستقل از متن برای زبان فارسی ارائه شده که شامل مجموعه ای از 128 قانون گرامری می باشد. نمونه هایی از این قوانین در این مقاله آورده شده است. این گرامر تولید کننده ی جملات با ترتیب و فعل انتها در زبان فارسی است. سپس یک تجزیه گر پیشگو که مبتنی بر گرامر پیشنهادی می باشد ارائه شده است. همراه با تجزیه گر جدول تجزیه ای ساخته شده است که به تجزیه جملات زبان فارسی کمک می کند. با بکارگیری جدول تجزیه خطاهای نحوی جملات فارسی شناسایی می شوند رویکرد پیشنهادی مبتنی بر متدهای تجزیه بالا به پایین است و برای کاهش ابهام در تجزیه گر عمل فاکتورگیری بر روی گرامر اولیه صورت گرفته است. در ارزیابی این گرامر از جملات برچسب گذاری شده پیکره وابستگی زبان فارسی استفاده کرده ایم. تجزیه گر پیشنهادی با نرخ پذیرش 71.8 % موفق به تجزیه جملات فارسی شده است. که افزایش نرخ پدیرش با توسعه گرامر امکان پذیر است.