ارتقاء عملکرد روش توماس شطرنجی با بهرهگیری از حافظه اشتراکی برای حل مسائل انتقال حرارت روی پردازنده گرافیکی | ||
مکانیک سازه ها و شاره ها | ||
مقاله 23، دوره 8، شماره 3، مهر 1397، صفحه 303-314 اصل مقاله (744.63 K) | ||
نوع مقاله: مقاله مستقل | ||
شناسه دیجیتال (DOI): 10.22044/jsfm.2018.5553.2361 | ||
نویسندگان | ||
سیدعلیرضا ذوالفقاری* 1؛ علی فوادالدینی2 | ||
1دانشیار، گروه مهندسی مکانیک و مدیر گروه پژوهشی انرژی در ساختمان و آسایش حرارتی، دانشگاه بیرجند، بیرجند | ||
2دانشجوی دکتری، مهندسی مکانیک، دانشگاه بیرجند، بیرجند | ||
چکیده | ||
پردازنده گرافیکی همه منظوره کاربر را قادر میسازد تا از پردازنده گرافیکی برای مقاصد محاسباتی عمومی بهره بگیرد. استفاده از این نوع پردازندهها موجب افزایش سرعت محاسبات در حل مسائل دینامیک سیالات محاسباتی میشود. تحقیقات متعددی جهت بررسی مزیت استفاده از پردازنده گرافیکی در محاسبات از جمله بکارگیری آن برای حل دستگاه معادلات سهقطری صورت گرفته است. در سال 2016 روش توماس شطرنجی برای حل دستگاه معادلات سهقطری در حلگر ADI ارائه شد. در این روش هر دستگاه معادلات به چندین دستگاه معادلات مستقل و با ابعاد کوچکتر تقسیم میشود. سپس هر یک از این دستگاهها به وسیله الگوریتم توماس به صورت شطرنجی حل میشوند. همچنین، در این روش علاوه بر مشارکت تعداد زیادی نخ محاسباتی در حل امکان ذخیره اطلاعات مربوط به هر دستگاه معادلات در حافظه اشتراکی میسر میگردد. در تحقیق حاضر با توجه ملاحظات مرتبط با استفاده از حافظه اشتراکی، راهبردی جهت بکارگیری این حافظه در روش توماس شطرنجی ارائه شده است. نتایج نشان میدهد که بکارگیری حافظه اشتراکی موجب افزایش سرعتی بین 1.2 تا 1.6 برابر نسبت به وضعیت بکارگیری حافظه سراسری شده است. همچنین مشخص شد که تداخل دسترسی به حافظه اشتراکی موجب کاهش سرعتی بین 10.9 تا 18.8 درصد در روش توماس شطرنجی میشود. | ||
کلیدواژهها | ||
روش توماس شطرنجی؛ پردازنده گرافیکی همه منظوره؛ حافظه اشتراکی؛ دستگاه معادلات سهقطری | ||
مراجع | ||
[1] Du P, Weber R, Luszczek P, Tomov S, Peterson G, Dongarra J (2012) From CUDA to OpenCL: Towards a performance-portable solution for multi-platform GPU programming. Parallel Comput 38(8): 391-407. [2] Sengupta S, Harris M, Zhang Y, Owens JD (2007) Scan primitives for GPU computing. Proceedings of the 22nd ACM SIGGRAPH/EUROGRAPHICS symposium on Graphics hardware, San Diego, California. [3] Sakharnykh N (2009) Tridiagonal solvers on the GPU and applications to fluid simulation. NVIDIA GPU Technology Conference, San Jose, California, USA. [4] Zhang Y, Cohen J, Owens JD (2010) Fast tridiagonal solvers on the GPU. ACM Sigplan Notices 45(5): 127-136. [5] Göddeke D, Strzodka R (2011) Cyclic reduction tridiagonal solvers on GPUs applied to mixed-precision multigrid. IEEE T Parall Distr 22(1): 22-32. [6] Davidson A, Owens JD (2011) Register packing for cyclic reduction: a case study, Proceedings of the fourth workshop on general purpose processing on graphics processing units, Newport Beach, California, USA. [7] Sakharnykh N (2010) Efficient tridiagonal solvers for ADI methods and fluid simulation. NVIDIA GPU Technology Conference, San Jose, California, USA. [8] Egloff D (2011) Pricing financial derivatives with high performance finite difference solvers on GPUs, Wen-mei W. Hwu (Eds.), GPU Computing Gems Jade Edition, pp. 23.309-23.322, Burlington: Morgan Kaufmann. [9] Zhang Y, Cohen J, Davidson AA, Owens JD (2011) A Hybrid Method for Solving Tridiagonal Systems on the GPU, Wen-mei W. Hwu (Eds.), GPU Computing Gems Jade Edition, pp. 11.117-11.132, Burlington: Morgan Kaufmann. [10] Wei Z, Jang B, Zhang Y, Jia Y (2013) Parallelizing alternating direction implicit solver on GPUs, Procedia Computer Science. 18: 389-398. [11] Kim HS, Wu S, Chang LW, Hwu WMW (2011) A scalable tridiagonal solver for gpus. International Conference on Parallel Processing (ICPP), Taipei, Taiwan. [12] Esfahanian V, Darian HM, Gohari SI (2013) Assessment of WENO schemes for numerical simulation of some hyperbolic equations using GPU. Comput Fluids 80: 260-268. [13] Esfahanian V, Baghapour B, Torabzadeh M, Chizari H (2014) An efficient GPU implementation of cyclic reduction solver for high-order compressible viscous flow simulations. Comput Fluids 92: 160-171. [14] Darian HM, Esfahanian V (2014) Assessment of WENO schemes for multi‐dimensional Euler equations using GPU. Int J Numer Meth Fl 76(12): 961-981. [15] Zolfaghari A, Foadaddini A (2016) Developing new Checkerboard Thomas algorithm for solving tridiagonal set of equations on GPU. Modares Mechanical Engineering 16(2): 309-318. (in Persian) [16] Beck JV, Wright N, Haji-Sheikh A, Cole KD, Amos D (2008) Conduction in rectangular plates with boundary temperatures specified. Heat Mass Transfer 51: 4676-4690. | ||
آمار تعداد مشاهده مقاله: 1,557 تعداد دریافت فایل اصل مقاله: 1,206 |