ترجمه مقاله طبقه بندی داده های بزرگ با استفاده از ماشین بردار پشتیبان

دسته بندي : فنی و مهندسی » کامپیوتر و IT

عنوان فارسی مقاله : طبقه بندی داده های بزرگ با استفاده از ماشین بردار پشتیبان با کلاسترهای سلسله مراتبی

عنوان لاتین مقاله : Classifying Large Data Sets Using SVMs with Hierarchical Clusters

سال انتشار : 2003 نشریه : ACM

نمونه متن انگلیسی :

ABSTRACT
Support vector machines (SVMs) have been promising methods for classification and regression analysis because of their solid mathematical foundations which convey several salient properties that other methods hardly provide. However, despite the prominent properties of SVMs, they are not as favored for large-scale data mining as for pattern recognition or machine learning because the training complexity of SVMs is highly dependent on the size of a data set. Many real-world data mining applications involve millions or billions of data records where even multiple scans of the entire data are too expensive to perform. This paper presents anew method, Clustering-Based SVM (CB-SVM), which is specifically designed for handling very large data sets. CB-SVM applies a hierarchical micro-clustering algorithm that scans the entire data set only once to provide an SVM with high quality samples that carry the statistical summaries of the data such that the summaries maximize the benefit of learning the SVM. CB-SVM tries to generate the best SVM boundary for very large data sets given limited amount of resources. Our experiments on synthetic and real data sets show that CB-SVM is highly scalable for very large data sets while also generating high classification accuracy

نمونه متن ترجمه :

چکیده
ماشین بردار پشتیبان برای آنالیز طبقه بندی و رگرسیون یک روش برجسته است . زیرا پایه محکم ریاضی، آنر از دیگر روشها متمایز کرده است. به هر حال، ماشین های بردار پشتیبان با وجود خواص برجسته ای که دارند برای داده های بزرگ داده کاوی مانند تشخیص الگو و یادگیری ماشین، مطلوب نمی باشند. زیرا پیچیدگی آموزش این ماشین ها بسیار وابسته به اندازه مجموعه داده ها است. در دنیای واقعی یکی از کاربردهای داده کاوی ثبت و اسکن میلیونها یا میلیاردها داده است که هزینه زیادی را دارد. این مقاله روش جدید ارائه داده است، ماشین بردار پشتیبان مبتنی بر خوشه بندی، که به طور خاص برای کار با مجموعه داده های بسیار بزرگ طراحی شده است. ماشین بردار پشتیبان مبتنی بر خوشه بندی شامل الگوریتم میکرو خوشه بندی سلسله مراتبی است که در آن اسکن تمام اطلاعات تنها یکبار انجام میگردد. تنظیم ماشین بردار پشتیبان ارائه شده، با کیفیت بالا برای نمونه هایی که خلاصه آماری داده ها را حمل میکنند، برای آموزش ماشین بردار پشتیبان بسیار مفید است. ماشین بردار پشتیبان مبتنی بر خوشه بندی سعی در تولید بهترین بردار پشتیبان مرزی برای مجموعه داده های بسیار بزرگ، با توجه به مقدار منابع محدود را دارد. آزمایش ما بر روی داده های واقعی و مصنوعی مجموعه نشان می دهد که بردار پشتیبان مبتنی بر خوشه بندی برای مجموعه داده های بسیار بزرگ، بسیار مقیاس پذیر است، و این در حالی است که همچنین دقت طبقه بندی بالایی دارد.

دسته بندی: فنی و مهندسی » کامپیوتر و IT

تعداد مشاهده: 33407 مشاهده

فرمت فایل دانلودی:.zip

فرمت فایل اصلی: PDF

تعداد صفحات: 26

حجم فایل:1,951 کیلوبایت

قیمت: 7,500 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود. پرداخت و دریافت فایل