دانلود روشی سريع برای کاوش قوانين انجمنی (association rules) درمجموعه داده های حجيم

قوانين انجمنی یکی از قوانین مهم و کاربردی در زمینه داده کاوی بوده و به کشف الگوهای پنهان میان داده ها کمک می کند. با افزایش حجم داده ها یافتن الگوهای موجود میان داده ها دشوار می شود.
قیمت : رایگان
شناسه محصول : 2003566
نویسنده/ناشر/نام مجله :
سال انتشار:
تعداد صفحات فارسي : 32
نوع فایل های ضمیمه : Word
حجم فایل : 491 Kb
کلمه عبور همه فایلها : www.daneshgahi.com
عنوان فارسي : روشی سريع برای کاوش قوانين انجمنی (association rules) درمجموعه داده های حجيم

چکیده

روشی سريع برای کاوش قوانين انجمنی (association rules) درمجموعه داده های حجيم

قوانين انجمنی یکی از قوانین مهم و کاربردی در زمینه داده کاوی بوده و به کشف الگوهای پنهان میان داده ها کمک می کند. با افزایش حجم داده ها یافتن الگوهای موجود میان داده ها دشوار می شود. در این تحقیق آماده کامپیوتر روشی سریع برای کاوش قوانين انجمنی ارائه شده است. تحقیق آماده قوانين انجمنی در قالب فایل word و به صورت رایگان قابل دانلود است.

با توجه به کاربرد روزافزون بانکهای اطلاعاتی حجیم و انبارههای بزرگ تراکنش،اخیرا توجه بسیاری از محققان به سمت تولید روش های کارآمد جهت استخراج قوانین انجمنی معطوف گشته است.اغلب روشهای موجود در مرحله اول کار خود کلیه اقلام پر تکرار(ساده و ترکیبی)را از بین تمام اقلام موجود در داده ها جستجو می کند که این امر نیازمند به خواندن مکرر کل داده ها از دیسک است.اکثر روشهایی که جدیدا پیشنهاد شده اند سعی بر این دارند تا لااقل میزان رخداد و درجه  پشتیبانی  بعضی از اقلام را بتوان مستقیما و بدون پیمایش داده ها محاسبه کرد . اما به این مسئله کمتر توجه شده که چگونه به روش بهینه ای برای شمارش دفعات رخداد اقلام در مواقعی که راهی جزء شمارش وجود ندارد دست یابیم .

در این مقاله را ه حلی کارا برای این مسئله ارائه شده است . در روش پیشنهادی ما ، داده ها تنها یک بار از دیسک خوانده می شوند و بعد از آن به یک ساختار رمز شده و خلاصه تبدیل می گردند به طوری که اولا قابل نگهداری در حافظه می باشند  و ثانیا با توجه به ساختار خاصی که دارند ، عملیات شمارش به سریعترین نحوه ممکن انجام می گردد  و زمان شمارش دفعات تکرار اقلام در هر مرحله کمتر از مرحله قبل می شود . پس از ارائه الگوریتم ، کارائی آن را با استفاده از دو مجموعه از داده های ساختگی و واقعی ارزیابی کرده و با چند روش کارا که تا کنون ارائه شده اند. 

مقایسه می کنیم .فهرست مطالب تحقیق روشی سريع برای کاوش قوانين انجمنی به شرح زیر است

مقدمه

تحقیقات مرتبط 

 الگوريتم  FP-Growth    

 توزین بار به روش شماره گره

 هزینه ی کاوش درخت تراکنش ها

 روش شمارش گره

 نتایج شبیه سازی

 سر بار روش شمارش گره

الگوريتم پيشنهادی FastARM  

 مقدار مناسب k

 نتايج عملی مقايسه الگوريتم ها

 آزمايش  : داده های توليد شده تصادفی

 آزمايش  : مجموعه داده های واقعی

 نتيجه گيري

Keywords: قوانين انجمنی
این برای گرایش های: نرم افزار، کاربرد دارد. سایر ، را ببینید. [ برچسب: ]