پایان نامه مقدمه ای بر داده کاوی

دسته بندي : فنی و مهندسی » کامپیوتر و IT
مقدمه:
در دو دهه قبل توانايي های فنی بشر در برای توليد و جمع آوری داده‌ها به سرعت افزايش يافته است. عواملی نظير استفاده گسترده از بارکد برای توليدات تجاری، به خدمت گرفتن کامپيوتر در کسب و کار، علوم، خدمات دولتی و پيشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاوير تا سيستمهای سنجش از دور ماهواره ای، در اين تغييرات نقش مهمی دارند [‎1].
بطور کلی استفاده همگانی از وب و اينترنت به عنوان يک سيستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات می‌کند. اين رشد انفجاری در داده‌های ذخيره شده، نياز مبرم وجود تکنولوژی های جديد و ابزارهای خودکاری را ايجاد کرده که به صورت هوشمند به انسان ياری رسانند تا اين حجم زياد داده را به اطلاعات و دانش تبديل کند: داده کاوی به عنوان يک راه حل برای اين مسائل مطرح مي باشد. در يک تعريف غير رسمی داده کاوی فرآيندی است، خودکار برای استخراج الگوهايی که دانش را بازنمايی مي کنند، که اين دانش به صورت ضمنی در پايگاه داده های عظيم، انباره داده  و ديگر مخازن بزرگ اطلاعات، ذخيره شده است. داده کاوی بطور همزمان از چندين رشته علمی بهره مي برد نظير: تکنولوژی پايگاه داده، هوش مصنوعی، يادگيری ماشين، شبکه های عصبی، آمار، شناسايی الگو، سيستم های مبتنی بر دانش ، حصول دانش ، بازيابی اطلاعات ، محاسبات سرعت بالا  و بازنمايی بصری داده  . داده کاوی در اواخر دهه 1980 پديدار گشته، در دهه 1990 گامهای بلندی در اين شاخه از علم برداشته شده و انتظار می رود در اين قرن به رشد و پيشرفت خود ادامه دهد



فهرست:
1 مقدمه ای بر داده‌کاوی    
1-1 چه چيزی سبب پيدايش داده کاوی شده است؟    
1-2 مراحل کشف دانش    
1-3 جایگاه داده کاوی در میان علوم مختلف    
1-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟    
1-5 داده کاوی و انبار داده  ها      
1-6 داده کاوی و OLAP    
1-7 کاربرد یادگیری ماشین و آمار در داده کاوی    
2- توصیف داده ها در داده کاوی    
2-1 خلاصه سازی و به تصویر در آوردن داده ها    
2-2 خوشه بندی     
2-3 تحلیل لینک    
3- مدل های پیش بینی داده ها    
3-1 Classification    17
3-2 Regression    17
3-3 Time series    18
4 مدل ها و الگوریتم های داده کاوی    
4-1 شبکه های عصبی     
4-2 Decision trees    22
4-3 Multivariate Adaptive Regression Splines(MARS)    24
4-4 Rule induction    25
4-5 K-nearest neibour and memory-based reansoning(MBR)    26
4-6 رگرسیون منطقی    
4-7 تحلیل تفکیکی     
4-8 مدل افزودنی کلی (GAM)    
4-9 Boosting    28
5 سلسله مراتب انتخابها    


دسته بندی: فنی و مهندسی » کامپیوتر و IT

تعداد مشاهده: 1470 مشاهده

فرمت فایل دانلودی:.DOC

فرمت فایل اصلی: DOC

تعداد صفحات: 31

حجم فایل:398 کیلوبایت

 قیمت: 35,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • محتوای فایل دانلودی:
    در قالب word و قابل ویرایش