بررسی مشکلات جستوجو و بازیابی اطلاعات در پایگاههای اطلاعاتی از جنبه ویژگیهای نگارشی زبان فارسی
این پژوهش با هدف تشریح مشکلات عمده نوشتاری و معنایی زبان فارسی در استفاده از محیط های اطلاعاتی و تعیین میزان انطباق و توجه به این ویژگی ها هنگام جستوجو و بازیابی در پایگاه های اطلاعاتی فارسی و به روش پیمایشی-تحلیلی و با استفاده از شیوه مشاهده مستقیم انجام گرفت. پس از مرور پژوهش های مرتبط، کلیدواژه های کاوش در قالب یک سیاهه شکل گرفت. هر یک از این کلیدواژه ها در پایگاه های اطلاعاتی مورد مطالعه شامل «پژوهشگاه علوم و فناوری اطلاعات ایران»، «پایگاه استنادی علوم جهان اسلام»، «پایگاه مجلات تخصصی نور» و «پایگاه اطلاعات علمی جهاد دانشگاهی» جست وجو و تعداد نتایج بازیاب شده ثبت گردید. سپس، به بررسی میزان انطباق پایگاه های اطلاعاتی با این ویژگی ها پرداخته شد.
برخی ویژگی های نوشتاری و معنایی زبان فارسی سبب بروز مشکلاتی در بازیابی اطلاعات از پایگاه های اطلاعاتی منتخب میشوند. مواردی مانند پیوسته نویسی و جدانویسی واژگان مشتق، مرکب و مشتق- مرکب، گوناگونی جمع ها، واژگان دخیل و معادل آن ها در بخش نوشتاری و چند معنایی، هم نامی و ... در بخش معنایی از این دست ویژگی ها هستند. فقدان پوشش مناسب ویژگی های یادشده در مراحل ذخیره سازی و پردازش و عدم آگاه نمودن کاربر از آن جهت اصلاح فرایند کاوش در مرحله بازیابی اطلاعات در پایگاه های اطلاعاتی مورد پژوهش، اثرات نامطلوبی بر فرایند کاوش و بازیابی دارد.
یافته ها نشان داد که پایگاه های اطلاعاتی فارسی نسبت به ویژگی های نوشتاری و معنایی زبان فارسی توجه کافی نداشته و بسیاری از ویژگی های آن را در مراحل ذخیره سازی و پردازش اطلاعات نادیده میگیرند. با توجه به تأثیر این ویژگی ها در تعامل کاربران با پایگاه های اطلاعاتی، احتیاج کاربران فارسی زبان به ابزارهای کاوش بومی و پایگاه های اطلاعاتی که مبتنی بر ویژگی های زبانیِ خودشان طراحی شده باشد، بیش از پیش احساس میشود. پژوهش حاضر با بررسی میزان توانایی پایگاه های اطلاعاتی فارسی زبان در پوشش برخی ویژگی های این زبان که در فرایند جست وجو و بازیابی تأثیر قابل توجهی دارند، نقاط ضعف و قوت این پایگاه ها را مشخص نموده است. نتایج آن میتواند در جهت بهبود و اصلاح عملکرد پایگاه های مذکور مورد استفاده قرار گیرد.
نویسندگان: هدی هماوندی، یعقوب نوروزی، ملوک السادات حسینی بهشتی
