دانلود مقاله ترجمه شده مسیریابی پایدار در برابر خطا، برای خطاهای دائم و غیر دائم در سیستم های HPC


چطور این مقاله مهندسی کامپیوتر و IT را دانلود کنم؟

فایل انگلیسی این مقاله با شناسه 2001409 رایگان است. ترجمه چکیده این مقاله مهندسی کامپیوتر و IT در همین صفحه قابل مشاهده است. شما می توانید پس از بررسی این دو مورد نسبت به خرید و دانلود مقاله ترجمه شده اقدام نمایید

قیمت :
765,000 ریال
شناسه محصول :
2001409
سال انتشار:
2010
حجم فایل انگلیسی :
251 Kb
حجم فایل فارسی :
192 کیلو بایت
نوع فایل های ضمیمه :
Pdf+Word
کلمه عبور همه فایلها :
www.daneshgahi.com

عنوان فارسي

مسیریابی پایدار در برابر خطا، برای خطاهای دائم و غیر دائم در سیستم های HPC

عنوان انگليسي

Fault-tolerant Routing for Multiple Permanent and Non-permanent Faults in HPC Systems

نویسنده/ناشر/نام مجله

International Conference on Parallel and Distributed Processing Techniques and Applications

این مقاله چند صفحه است؟

این مقاله ترجمه شده مهندسی کامپیوتر و IT شامل 7 صفحه انگلیسی به صورت پی دی اف و 15 صفحه متن فارسی به صورت ورد تایپ شده است

چکیده فارسی

چکیده

امروزه شبکه های بهم متصل ، واحد های پردازشی سیستم های محاسباتی با کارائی بالا را بهم متصل ساخته و با آنها محاوره دارند. در این زمینه، خطاهای شبکه دارای تأثیر قابل ملاحظه ای می­باشند زیرا بسیاری از الگوریتم های مسیریابی، برای پایداری در برابر خطاها طراحی نشده اند. از این رو، فقط یک خطای منفرد ممکن است  پیام های موجود در شبکه را دچار اشکال سازد و اتمام اپلیکیشن ها را با مشکل روبرو سازد، و یا حتی منجر به پیکربندی های بن بست گردد.

 در این مقاله، ما  یک متد مسیریابی مستعد در برابر خطا را معرفی کرده ایم تا بتوانیم خطاهای لینک دائم و غیر دائم که پویایی بالایی دارند را از بین ببریم. از آنجایی که این خطاها به صورت تصادفی در طول عملیات سیستم بروز میکند، متد ما مسیرهای گریز را برای پیام ها فراهم کرده و در عین حال، از بروز بن بست جلوگیری میکند.پیشنهاد ما از نواحی خطا دار و به وسیله ی روش های مسیریابی چند مسیره اجتناب میکند و از مزایای افزونگی مسیر ارتباطی بهره میبرد.

ارزیابی کارائی، شامل سناریوهای تست ترکیبی بوده که صحت را اثبات کرده و سناریوهایی را که بر مبنای موجودیت دنباله هایی از سیستم های با کارائی بالاست را تست میکند. آزمایشات نشان داده است که متد ما به اپلیکیشن ها اجازه داده تا اجرای خود را حتی در صورت بروز خطا کامل سازند و افت کارائی را به 30% کاهش دهند.

فهرست مطالب

1-مقدمه

2-متد مسیریابی پایدار در برابر خطا

1-2- پیکربندی مسیرهای جایگزین

2-2- رفتار متد

3- ارزیابی کارائی

1-3- نتایج الگوهای ارتباطی

2-3- نتایج سناریوهای مبتنی بر خطاهای واقعی

4- نتیجه گیری

1-مقدمه

در طی دهه های اخیر، تقاضا برای قدرت محاسباتی بیشتر، یک افزایش بدون توقفی را داشته است. این افزایش، ریشه ای در رشد تعداد کاربرد های محاسباتی پیچیده دارد. در ابتدا، قدرت محاسباتی فقط محدود به فیلد های پژوهشی علمی بود. اگرچه در طول چند سال اخیر، کاربرد های جدیدی نیز ایجاد شده اند که نیاز به قدرت محاسباتی بالایی داشته اند. این برنامه های جدید، شامل ایمن سازی DNA، پیش بینی آب و هوا، مطالعات زیستی و غیره بوده است.

در این لحظه، اهمیت سیستم های HPC غیرقابل انکار می­باشد، زیرا آنها گرایش جدیدی را به سمت مدل سازی رفتار روزانه و سبک زندگی جوامع مدرن باز کرده اند. این مورد در صورتی که ساده ترین جستجو در گوگل را  که بر مبنای سیستم های HPC نیز میباشد را در نظر بگیریم، بدیهی است[1]. در اصل، با توجه به اهمیت این سیستم ها، ضروری است تا از وقفه های سرویس اجتناب کنیم، که این مورد در سیستم های حساس مانند سیستم های مرتبط با عملیات بحرانی-مأموریتی، بانکداری و اپلیکیشن های محسوس به محاسبات ضرورت پیدا میکند[2].

اصولاٌ اهمیت چنین سیستم هایی مرتبط با قابلیت استفاده و قدرت مکانیسم های پایداری در برابر خطا می­باشد. متأسفانه، افزایش یکنواخت در پیچیدگی و تعداد مؤلفه های این سیستم ها، نرخ خطا را نیز به میزان قابل ملاحظه ای افزایش داده است. سؤال هایی از تحلیل این شرایط ایجاد میشود، مانند: این خطاها چطور بر روی سیستم های HPC تأثیر میگذارند؟ چه نوع خطاهایی در سیستم های واقعی روی میدهد؟آیا این سیستم ها میتوانند در صورت بروز خطا پایداری استاندارد خود را حفظ کنند؟ در صورتی که اینطور نباشد، راه حل چیست؟ بهترین گزینه ها برای رسیدن به یک پایداری در برابر خطا و پیوستگی سرویس سیستم چیست؟...

شبکه های بهم متصل پایداری در برابر خطا مسیریابی تطبیقی :کلمات کلیدی

چکیده انگلیسی

Abstract

The interconnection network communicates and links together the processing units of modern high performance computing systems. In this context, network faults have an extremely high impact since most routing algorithms were not designed to tolerate faults. Because of this, just a single fault may stall messages in the network, preventing the finalization of applications, or may lead to deadlocked configurations

In this paper we introduce a fault-tolerant routing method designed to solve a large number of dynamic permanent and non-permanent link faults. As failures appear randomly during system operation, our method provides escape paths for the stalled messages and, at the same time, avoids deadlock occurrences. Our proposal avoids faulty areas by means of multipath routing approaches, taking advantage of the communication path redundancy, as long as alternative paths are available

Performance evaluation consists of synthetic test scenarios for proving correctness, and test scenarios based on the availability traces of real high-performance systems. Experiments show that our method allows applications to successfully complete their executions even in the presence of a large number of faults, given performance degradations below 3% for a 1024-node system with up to 200 simultaneous link failures

Contents

1. Introduction

2. Fault-Tolerant Routing Method

2.1 Configuration of Alternative Paths

2.2 Detailed Method Behavior

3. Performance Evaluation

3.1 Results of Communication Patterns

3.2 Results of Scenarios Based on Real Faults

4. Conclusions

 
Keywords: Interconnection Networks Fault Tolerance Adaptive Routing
Skip Navigation Linksصفحه اصلی > دپارتمان ها > دپارتمان فنی و مهندسی > مهندسی کامپیوتر و IT > مقاله های مهندسی کامپیوتر و IT و ترجمه فارسی آنها > مسیریابی پایدار در برابر خطا، برای خطاهای دائم و غیر دائم در سیستم های HPC
کتابخانه الکترونیک
دانلود مقالات ترجمه شده
جستجوی مقالات
با انتخاب رشته مورد نظر خود می توانید مقالات ترجمه شده آن رو به صورت موضوع بندی شده مشاهده نمایید