ارائه الگویی برای سازماندهی اسناد متنی با استفاده از تکنیک خوشه بندی
هدف: پژوهش حاضر با هدف ارائه الگویی برای سازماندهی اسناد متنی با استفاده از تکنیک خوشه بندی انجام شده است.
روش/ رویکرد پژوهش: پژوهش حاضر از نوع کاربردی است. جامعه آماری مجموعه داده های مربوط به پایان نامه ها و رساله هاست که شامل 2943 تحقیق است. جمع آوری داده ها از مجموعه داده مربوط به تحقیقات علمی که شامل 5000 پژوهش در قالب فایل اکسل بود انجام شد. در این پژوهش پس از تبدیل داده هـا به قالب ساخت یافتـه با استفاده از اعمال پیش پردازش عملیات پردازش صورت گرفت. از انواع روش های موجودی که برای پردازش متن وجود دارد از تکنیک خوشه بندی جهت ارائه الگوریتم پیشنهادی بهره گرفته شد.
یافته ها: نتایج حاصل از ارزیابی نشان داد الگوریتم پیشنهادی بر اساس معیارهای خارجی نسبت به دو الگوریتم کا-میانه و کامیانه++ عملکرد مطلوبی در خوشه بندی اسناد دارد به طوری که قرارگیری تحقیقات هر رده تعیین شده در خوشه موضوعی مرتبط با آن دارای جای گیری مناسبی شد، و منجر به حصول هدف پژوهش حاضر شد. از آنجایی که در ماتریس رده/ خوشه حاصل از دو الگوریتم کا-میانه و کا-میانه++ شاهد توزیع نامناسب تحقیقات در خوشه ها بودیم می توان گفت هر چند که این دو الگوریتم در مقایسه با الگوریتم پیشنهادی بر اساس معیارهای داخلی نتایج مناسب تری داشتند، اما دارای نتایج مطلوبی نبودند. بنابراین می توان گفت ارزیابی بر اساس معیار های داخلی متأثر از تراکم متفاوت خوشه ها و شباهت بین خوشه ای است. با توجه به اینکه راهکار های پیشنهادی جهت کاهش چالش به وجود آمده در پژوهش حاضر در دیتاست موجود تأثیر مثبتی داشت، به نظر می رسد الگوریتم پیشنهادی برای ابعاد بالای ویژگی نیز مناسب عمل کند.
کارشناسی ارشد-1400
.
رشته:علم اطلاعات و دانش شناسی - مدیریت اطلاعات
.
پدیدآور: الهام یلوه
.
استاد راهنما: یعقوب نوروزی
.
استاد راهنما: اشکان خطیر
.
دانشگاه قم، دانشکده ادبیات و علوم انسانی