تعامل انسان و اطلاعات، جلد ۷، شماره ۱، صفحات ۱۵-۲۶

عنوان فارسی بررسی رویکردهای متن‌کاوی و عملکرد آن در کشف و استخراج موضوع
چکیده فارسی مقاله زمینه و هدف : در این پژوهش چهار روش متن‌کاوی بررسی میشود و بر درک و شناسایی خصوصیات و محدودیت‌های آن‌ها در کشف موضوع تمرکز میکند. این چهار روش عبارت‌اند از 1) تجزیه‌وتحلیل معنایی پنهان(LSA) 2) تحلیل معنایی پنهان احتمالاتی(PLSA)، 3) تخصیص دیریکله پنهان(LDA) و 4) مدل‌سازی موضوعی همبسته(CTM).
روش پژوهش: پژوهش حاضر از نوع کتابخانه‌ای است که در آن، ادبیات حوزه متن‌کاوی و مدل‌سازی موضوعی مرور و تحلیل شده است.
یافته‌ها: تجزیه‌وتحلیل معنایی پنهان می‌تواند برای تشخیص موضوعات خاص و منحصربه‌فرد در مدارکی که تنها به یک موضوع پرداخته‌اند استفاده شود. سه روش دیگر متن‌کاوی، بر موضوعات و گرایش کلی متن متمرکز هستند. تحلیل معنایی پنهان احتمالاتی  برای مدارکی که به یک موضوع پرداخته‌اند قابل‌استفاده است اما برخلاف تجزیه‌وتحلیل معنایی پنهان ، این روش در کشف موضوعات و مضامین کلی متن کاربرد دارد. درحالی‌که تخصیص دیریکله پنهان  در مورد مدارکی که به چندین موضوع پرداخته‌اند کاربرد بیشتری دارد. روش مدل‌سازی موضوعی همبسته  می‌تواند در تشخیص ارتباط بین دسته‌های موضوعی مختلف استفاده شود.
نتیجه‌گیری: رویکردهای متن‌کاوی به خاطر بهره‌گیری از تحلیل معنایی در کشف و استخراج موضوع متون مناسب است
کلیدواژه‌های فارسی مقاله متن‌کاوی، مدل‌سازی موضوعی، تحلیل معنایی، کشف موضوع

عنوان انگلیسی A review of text mining approaches and their function in discovering and extracting a topic
چکیده انگلیسی مقاله Background and aim: Four text mining methods are examined and focused on understanding and identifying their properties and limitations in subject discovery.
Methodology: The study is an analytical review of the literature of text mining and topic modeling. 
Findings: LSA could be used to classify specific and unique topics in documents that address only a single topic. The other three text mining methods focus on topics and general partiality of the text. PLSA is applicable to documents dealing with a topic, unlike the LSA, it is used to discover general themes and contexts. However, LDA is more applicable to documents that address several issues. The CTM, method can be used to identify relationship between different subject categories.
Conclusion: Text mining tactics are suitable for employing analysis in discovering and extracting the text subjects.
کلیدواژه‌های انگلیسی مقاله Text mining, Topic Modeling, Semantic Analysis, Topic Discovery

نویسندگان مقاله علی منصوری | Ali Mansouri
Isfahan University
دانشگاه اصفهان

فاطمه زرمهر | Fatemeh Zarmehr
Isfahan university
دانشگاه اصفهان

حسین کارشناس | Hossein Karshenas
Isfahan University
دانشگاه اصفهان


نشانی اینترنتی http://hii.khu.ac.ir/browse.php?a_code=A-10-240-1&slc_lang=fa&sid=1
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده تخصصی
نوع مقاله منتشر شده کاربردی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات