هدف: پژوهش حاضر با هدف بررسی میزان همپوشانی کلیدواژه ­های استخراج شده از عناصر واسط در بازنمایی اسناد متنی با استفاده از الگوریتم «Rake» انجام شد.

.
روش: در این پژوهش، با استفاده از الگوریتم «Rake» کلیدواژههای مجموعه دادهای شامل 500 مقاله علمی در پنج گروه موضوعی مختلف استخراج شد. سپس همپوشانی بین کلیدواژه های عنوان، چکیده و کلیدواژه های نویسندگان موردبررسی قرار گرفت.

.
یافته ها: نتایج نشان داد که همپوشانی بین کلیدواژه های عنوان و کلیدواژه های نویسندگان حدود 45 درصد و همپوشانی بین کلیدواژه های چکیده و کلیدواژه های نویسندگان حدود 18 درصد بود. در ادامه مشاهده شد که کلیدواژههای عنوان دارای پوشش 22 درصدی کلیدواژههای چکیده بودند. نتایج همچنین نشان داد که همپوشانی و پراکندگی بین کلیدواژه های چکیده و کلیدواژه های نویسندگان و نیز بین کلیدواژه های چکیده و کلیدواژه های عنوان بهطور متوازن و تقریباً یکسان بود؛ اما مشاهده شد که کلیدواژه های عنوان و کلیدواژههای نویسندگان دارای پراکندگی بیشتری بودند؛ که نشان­دهنده احتمال همپوشانی بیشتر بین کلیدواژه­ های عنوان و کلیدواژه­ های نویسنده یک مقاله در مقایسه با کلیدواژه­ های چکیده و کلیدواژه­ های نویسنده و همچنین کلیدواژه­ های چکیده و کلیدواژه­ های عنوان است. بعلاوه درک خوبی از مفاهیم و مباحث حوزۀ پژوهشی در رشتههای روانشناسی و مدیریت دولتی وجود داشت، درحالیکه در رشتههای فناوری اطلاعات و حقوق عمومی نیاز به بهبود و تقویت درک مفاهیم مشاهده شد. میزان همپوشانی بین کلیدواژه های چکیده و کلیدواژه های نویسندگان در پنج گروه موضوعی حدود 20 درصد بود.

.
نتیجه گیری: استفاده مناسب از کلیدواژه ها، نوشتن چکیده هایی با محتوای هماهنگ با موضوع موردنظر و انتخاب عناوین متناسب میتواند به بهبود فرایند استخراج مفاهیم، ذخیره سازی و بازیابی مقالات علمی کمک کند، ازجمله اینکه کلیدواژه ها، چکیده ها و عناوین میتوانند به عنوان ورودی برای الگوریتم های استخراج مفاهیم، همچنین بهعنوان بخش هایی از ساختار ذخیرهسازی اطلاعات در سرعت دسترسی کاربران به اطلاعات موردنیازشان و به عنوان ورودی برای الگوریتم های بازیابی اطلاعات برای دسترسی سریع به مقالات مرتبط کمک بسزایی داشته باشند.

نویسندگان:

الهام یلوه - یعقوب نوروزی - اشکان خطیر

دسترسی به لینک مقاله