تحلیل همپوشانی عناصر واسط در بازنمایی اسناد متنی: مطالعهای به روش الگوریتم «RAKE»
هدف: پژوهش حاضر با هدف بررسی میزان همپوشانی کلیدواژه های استخراج شده از عناصر واسط در بازنمایی اسناد متنی با استفاده از الگوریتم «Rake» انجام شد.
.
روش: در این پژوهش، با استفاده از الگوریتم «Rake» کلیدواژههای مجموعه دادهای شامل 500 مقاله علمی در پنج گروه موضوعی مختلف استخراج شد. سپس همپوشانی بین کلیدواژه های عنوان، چکیده و کلیدواژه های نویسندگان موردبررسی قرار گرفت.
.
یافته ها: نتایج نشان داد که همپوشانی بین کلیدواژه های عنوان و کلیدواژه های نویسندگان حدود 45 درصد و همپوشانی بین کلیدواژه های چکیده و کلیدواژه های نویسندگان حدود 18 درصد بود. در ادامه مشاهده شد که کلیدواژههای عنوان دارای پوشش 22 درصدی کلیدواژههای چکیده بودند. نتایج همچنین نشان داد که همپوشانی و پراکندگی بین کلیدواژه های چکیده و کلیدواژه های نویسندگان و نیز بین کلیدواژه های چکیده و کلیدواژه های عنوان بهطور متوازن و تقریباً یکسان بود؛ اما مشاهده شد که کلیدواژه های عنوان و کلیدواژههای نویسندگان دارای پراکندگی بیشتری بودند؛ که نشاندهنده احتمال همپوشانی بیشتر بین کلیدواژه های عنوان و کلیدواژه های نویسنده یک مقاله در مقایسه با کلیدواژه های چکیده و کلیدواژه های نویسنده و همچنین کلیدواژه های چکیده و کلیدواژه های عنوان است. بعلاوه درک خوبی از مفاهیم و مباحث حوزۀ پژوهشی در رشتههای روانشناسی و مدیریت دولتی وجود داشت، درحالیکه در رشتههای فناوری اطلاعات و حقوق عمومی نیاز به بهبود و تقویت درک مفاهیم مشاهده شد. میزان همپوشانی بین کلیدواژه های چکیده و کلیدواژه های نویسندگان در پنج گروه موضوعی حدود 20 درصد بود.
.
نتیجه گیری: استفاده مناسب از کلیدواژه ها، نوشتن چکیده هایی با محتوای هماهنگ با موضوع موردنظر و انتخاب عناوین متناسب میتواند به بهبود فرایند استخراج مفاهیم، ذخیره سازی و بازیابی مقالات علمی کمک کند، ازجمله اینکه کلیدواژه ها، چکیده ها و عناوین میتوانند به عنوان ورودی برای الگوریتم های استخراج مفاهیم، همچنین بهعنوان بخش هایی از ساختار ذخیرهسازی اطلاعات در سرعت دسترسی کاربران به اطلاعات موردنیازشان و به عنوان ورودی برای الگوریتم های بازیابی اطلاعات برای دسترسی سریع به مقالات مرتبط کمک بسزایی داشته باشند.
نویسندگان:
الهام یلوه - یعقوب نوروزی - اشکان خطیر
