آیا مشخصات سیستم من برای اجرای روان انسیس مناسب است؟
انتخاب سختافزار مناسب برای کاربران نرمافزار Ansys یک تصمیم حیاتی است که میتواند به طور مستقیم بر بهرهوری، اندازه مدلهای قابل حل و تجربه کلی کاربری تأثیر بگذارد. یک سیستم بهینه، زمان حل را کاهش میدهد، امکان تحلیل مدلهای پیچیدهتر را فراهم میکند و تعامل روان با نرمافزار در مراحل پیشپردازش و پسپردازش را تضمین میکند. بنابراین، سرمایهگذاری در یک سیستم مورد نیاز انسیس که به درستی پیکربندی شده باشد، یک گام اساسی برای هر مهندس تحلیلگر است. در این راهنما، ما به بررسی دقیق هر یک از اجزای سختافزاری، از حافظه اصلی (RAM) گرفته تا پردازندههای گرافیکی (GPU)، میپردازیم. سپس توصیههایی عملی برای پیکربندی سیستمهای مختلف، از لپتاپهای مهندسی تا سرورهای محاسباتی قدرتمند، ارائه خواهیم داد و در نهایت، گزینههای جایگزین مانند محاسبات ابری را معرفی میکنیم.
آنچه در این مقاله میخوانید
اصول کلیدی در انتخاب سختافزار برای Ansys
پیش از پرداختن به جزئیات هر قطعه، درک چند اصل کلی برای بهینهسازی عملکرد حلگرهای Ansys (بهویژه در حوزه دینامیک سیالات محاسباتی یا CFD) ضروری است. این اصول به شما کمک میکنند تا یک سیستم متعادل و کارآمد طراحی کنید که در آن هیچ قطعهای به گلوگاه (Bottleneck) برای قطعات دیگر تبدیل نشود و حداکثر بازدهی از سرمایهگذاری شما حاصل گردد.
اهمیت پهنای باند حافظه (Memory Bandwidth):
در اکثر سناریوهای شبیهسازی، پهنای باند حافظه مهمترین مشخصه برای عملکرد سیستم است. این پارامتر تعیین میکند که دادهها با چه سرعتی بین حافظه RAM و پردازنده منتقل میشوند.
نسبت تعداد هستهها به کانالهای حافظه:
برای عملکرد بهینه، باید تمام کانالهای حافظه موجود روی مادربرد را با ماژولهای RAM پر کرد. همچنین، نسبت تعداد هستههای پردازنده به هر کانال حافظه نباید از ۴:۱ تجاوز کند. برای دستیابی به حداکثر کارایی و مقیاسپذیری خطی، نسبت ایدهآل ۲:۱ است.
حافظه نهان (Cache) پردازنده:
پردازندههایی با حافظه کش بزرگتر (مانند سری 3D V-Cache از AMD) میتوانند پهنای باند مؤثر حافظه را افزایش دهند. این امر با ذخیره بخشی از دادههای شبیهسازی در حافظه فوقسریع کش، نیاز به دسترسی به RAM را کاهش داده و عملکرد را به طور قابل توجهی بهبود میبخشد.
سرعت کلاک پایه (Base Clock Speed) پردازنده:
سرعت کلاک پایه بالا در CPU اهمیت زیادی دارد. باید از خرید پردازندههای کممصرف (low wattage) که تعداد هستههای بالایی دارند اما فرکانس پایه آنها پایین است، پرهیز کرد، زیرا این پردازندهها تحت بار سنگین محاسباتی، فرکانس خود را به شدت کاهش میدهند.
استفاده از هستههای فیزیکی:
حلگرهای Ansys باید روی هستههای فیزیکی (Physical Cores) اجرا شوند، نه رشتههای مجازی (Threads). به همین دلیل، اغلب توصیه میشود که قابلیت چندرشتهای (Multi-threading یا Hyper-threading) در ورکاستیشنهای اختصاصی شبیهسازی غیرفعال شود.
فضای ذخیرهسازی پرسرعت:
دایرکتوریهای کاری و فضای موقت (scratch) نرمافزار باید روی حافظههای پرسرعت NVMe تنظیم شوند. این امر بهویژه برای تحلیلهایی که به شدت به ورودی/خروجی (I/O-bound) وابسته هستند، حیاتی است.
با در نظر گرفتن این اصول، اکنون میتوانیم نقش و اهمیت هر یک از قطعات سختافزاری را به صورت دقیقتر بررسی کنیم.
بررسی عمیق اجزای سختافزاری
در این بخش، هر یک از اجزای اصلی سختافزار به ترتیب اولویت و تأثیرگذاری بر عملکرد Ansys بررسی خواهند شد. درک نقش هر قطعه به شما کمک میکند تا بودجه خود را به بهترین شکل ممکن سرمایهگذاری کرده و سیستمی متناسب با نیازهای تحلیلی خود بسازید.
حافظه اصلی (RAM)
تحلیل نقش RAM: حافظه اصلی (RAM) به طور مستقیم حداکثر اندازه مدل (از نظر تعداد درجات آزادی یا Degrees of Freedom) که میتوانید حل کنید را تعیین میکند. کمبود RAM به معنای عدم توانایی در حل مدلهای بزرگ است.
تشریح اهمیت حیاتی RAM: شما یا به اندازه کافی RAM دارید یا ندارید؛ حالت میانهای وجود ندارد. اگر سیستم عامل با کمبود حافظه مواجه شود، به استفاده از هارد دیسک به عنوان «حافظه مجازی» (Virtual Memory) روی میآورد. این اتفاق تأثیری فاجعهبار بر عملکرد سیستم دارد. برای درک بهتر این موضوع، میتوان سرعت دسترسی به سطوح مختلف حافظه را اینگونه مقایسه کرد:
دسترسی به L1 Cache پردازنده: مانند برداشتن یک کاغذ از روی میزتان (۳ ثانیه).
دسترسی به حافظه اصلی (RAM): مانند پیادهروی در راهرو برای خرید یک شکلات (۴ دقیقه).
دسترسی به هارد دیسک (حافظه مجازی): مانند ترک کردن ساختمان و گشتن به دور زمین برای ۱ سال و ۳ ماه. بنابراین، صرفهجویی در هزینه RAM هرگز توصیه نمیشود.
ارائه توصیههای کمی: حداقل 16GB رم توصیه میشود. با این حال، تجربه نشان میدهد که 64GB برای ۹۰٪ پروژههای FEA و CFD کافی است. برای تحلیلهای حوزه الکترومغناطیس (EMAG) که معمولاً به حافظه بیشتری نیاز دارند، بیش از 100GB پیشنهاد میشود.
ارائه جدول تخمین حافظه: لازم به ذکر است که جدول زیر یک راهنمای تخمینی برای محاسبه حافظه ویدیویی (VRAM) مورد نیاز GPU است و مشخصاً برای اجرای شبیهسازیها با حلگر GPU در Ansys Fluent کاربرد دارد؛ این مقادیر را نباید با نیازمندیهای حافظه اصلی سیستم (System RAM) اشتباه گرفت. این جدول میتواند به عنوان یک راهنمای تقریبی برای تخمین حافظه مورد نیاز GPU (بر حسب گیگابایت به ازای هر یک میلیون سلول) عمل کند. توجه داشته باشید که این مقادیر تقریبی هستند و به فیزیک مسئله نیز بستگی دارند.
نوع مش (Mesh Type) | Single Precision, Segregated | Single Precision, Coupled | Double Precision, Segregated | Double Precision, Coupled |
Tetrahedral | 1.0 GB | 1.8 GB | 1.6 GB | 3.0 GB |
Hexahedral | 1.2 GB | 2.2 GB | 1.9 GB | 3.6 GB |
Polyhedral | 1.8 GB | 3.4 GB | 2.8 GB | 5.6 GB |
پردازنده مرکزی (CPU)
تحلیل نقش CPU: تعداد هستهها و سرعت کلاک پردازنده، سرعت حل یک مدل را تعیین میکند. یک معیار خوب برای مقایسه گزینههای مختلف CPU، استفاده از فرمول ساده (سرعت کلاک × تعداد هستهها / هزینه) است. این معیار به شما کمک میکند تا بهترین عملکرد را به ازای هزینه پرداختی دریافت کنید.
مقایسه AMD در مقابل Intel: بنچمارکهای اخیر نشان میدهند که پردازندههای جدید AMD EPYC 9474F (Genoa) در تعداد هستههای بالا عملکرد بهتری نسبت به پردازندههای Intel Xeon Platinum 8480+ (Sapphire Rapids) از خود نشان دادهاند. دلیل اصلی این برتری، توانایی پردازندههای AMD در حفظ سرعت کلاک بالا حتی تحت بار کامل است؛ به طوری که پردازنده Genoa فرکانس ۴ گیگاهرتز را تحت بار کامل حفظ میکند، در حالی که فرکانس Sapphire Rapids به ۲.۱ گیگاهرتز کاهش مییابد. همچنین، از نسخه 2022 R1 به بعد، نرمافزار Ansys به طور خودکار از کتابخانههای ریاضی بهینهسازی شده AMD (AOCL/BLIS) هنگام اجرا روی پردازندههای این شرکت استفاده میکند که به بهبود بیشتر عملکرد کمک میکند.
تشریح اهمیت معماری و کلاک: همواره سعی کنید جدیدترین معماری CPU موجود در بازار را انتخاب کنید. پردازندههای امروزی با کلاک یکسان، به دلیل بهبودهای معماری، تقریباً دو برابر سریعتر از پردازندههای ۳ سال پیش هستند. علاوه بر این، برای کارهایی که به خوبی موازیسازی نمیشوند (مانند برخی از سابروتینهای USERMAT در Ansys Mechanical APDL)، داشتن فرکانس پایه (Base Frequency) بالا اهمیت بیشتری نسبت به تعداد هستهها پیدا میکند.
فضای ذخیرهسازی (Storage)
تحلیل نقش Storage: حافظه ذخیرهسازی، ظرفیت نگهداری دادههای پروژه و مهمتر از آن، سرعت خواندن و نوشتن فایلهای حل را مشخص میکند. سرعت پایین ذخیرهسازی میتواند به یک گلوگاه جدی در فرآیند تحلیل تبدیل شود.
ارائه رویکرد بهینه: یک رویکرد کارآمد و متداول، استفاده از یک درایو کوچک و بسیار سریع (مانند NVMe) برای نصب نرمافزار و اجرای حل (Solving) و یک درایو بزرگتر و کندتر (مانند SSD یا HDD) برای ذخیرهسازی بلندمدت پروژهها (Storage) است. در Ansys Mechanical، شما میتوانید یک مسیر مجزا برای فایلهای موقت حلگر (Solver Scratch Directory) تعیین کنید تا محاسبات روی درایو پرسرعت انجام شود.
شناسایی تحلیلهای I/O-Bound: در تحلیلهای زیر، سرعت ورودی/خروجی (I/O) یک گلوگاه (bottleneck) اصلی محسوب میشود و استفاده از حافظههای پرسرعت در آنها ضروری است:
- حلگر اسپارس Out-of-core در Mechanical
- حلهای موازی با حافظه توزیع شده (DMP)، زیرا هر هسته مجموعه فایلهای خود را ایجاد میکند.
- تحلیلهای گذرا (Transient) در FEA یا CFD که در آنها نتایج زیادی در بازههای زمانی متعدد روی دیسک نوشته میشود.
مقایسه فناوریهای ذخیرهسازی:
- NVMe: سریعترین و بهترین گزینه موجود برای درایو حل است و به شدت توصیه میشود.
- SSD: به طور قابل توجهی سریعتر از هارد دیسکهای مکانیکی (HDD) هستند و گزینه مناسبی برای درایو ذخیرهسازی یا حتی درایو حل در سیستمهای با بودجه محدودتر محسوب میشوند.
- RAID0: ترکیبی از چند درایو برای افزایش سرعت است. این روش سرعت را به قیمت از دست رفتن افزونگی (redundancy) افزایش میدهد (اگر یک درایو از کار بیفتد، کل دادهها از بین میرود) و تنها برای درایوهای scratch که نیاز به حداکثر سرعت دارند، باید در نظر گرفته شود.
کارت گرافیک (Graphics) و پردازنده گرافیکی (GPU)
- کارت گرافیک برای پیش/پسپردازش: برای تعامل روان با مدلهای پیچیده و بزرگ و جلوگیری از تأخیر در نمایش (display latency)، استفاده از یک کارت گرافیک ورکاستیشن مجزا (discrete workstation graphics card) مانند سری NVIDIA Quadro یا RTX Ada به شدت توصیه میشود. برخی نرمافزارها مانند Ansys AIM و SpaceClaim بدون کارت گرافیک مجزا کار نمیکنند.
- GPU برای محاسبات (GPU Computing):
تشریح مفهوم: برخی از محصولات Ansys (مانند Fluent و Mechanical) میتوانند محاسبات کلیدی حلگر را به پردازنده گرافیکی (GPU) منتقل کرده و سرعت حل را به طور چشمگیری افزایش دهند. این قابلیت به خصوص در حلگر Fluent بسیار توسعه یافته و میتواند عملکردی معادل صدها هسته CPU را ارائه دهد.
تفاوت هستههای GPU: هستههای GPU به دو دسته اصلی تقسیم میشوند: هستههای FP32 برای محاسبات با دقت یگانه (single-precision) و هستههای FP64 برای محاسبات با دقت مضاعف (double-precision). کارتهای گرافیک ارزانتر و مصرفی فاقد هستههای FP64 اختصاصی هستند و محاسبات double-precision را با شبیهسازی از طریق هستههای FP32 انجام میدهند. این شبیهسازی منجر به یک افت عملکرد قابل توجه میشود و سرعت حل را تقریباً به نصف کاهش میدهد. در مقابل، کارتهای سرور ردهبالا مانند NVIDIA H100 دارای هستههای FP64 اختصاصی هستند و این محاسبات را با حداکثر سرعت اجرا میکنند.
نیازمندیهای لایسنس: استفاده از GPU برای محاسبات نیازمند لایسنسهای HPC است. در Ansys Fluent، مدل لایسنسینگ بر اساس تعداد «چندهستهایهای جریانی» (Streaming Multiprocessors یا SMs) در کارتهای NVIDIA یا «واحدهای محاسباتی» (Compute Units یا CUs) در کارتهای AMD است. لایسنس پایه CFD Enterprise شامل ۴۰ واحد SM/CU میشود و برای استفاده از تعداد بیشتر، به لایسنسهای اضافی Ansys HPC نیاز است.
اکنون که با نقش هر قطعه آشنا شدیم، به ارائه چند پیکربندی نمونه برای سیستمهای کامل در مقیاسهای مختلف میپردازیم.
توصیههای پیکربندی بر اساس مقیاس و بودجه
در این بخش، بر اساس اصول و جزئیات ذکر شده، چند نمونه پیکربندی پیشنهادی برای نیازها و بودجههای مختلف، از یک لپتاپ مهندسی تا یک سرور قدرتمند، ارائه میشود تا به شما در انتخاب یک سیستم متناسب کمک کند.
سیستمهای کوچک (لپتاپ یا کامپیوتر رومیزی برای ۴ هسته)
این سیستمها برای دانشجویان، تحلیلهای اولیه و مدلهای کوچک مناسب هستند.
- الزامات کلیدی:
شاسی: برای لپتاپ، شاسی با سیستم خنککنندگی مناسب انتخاب شود (از مدلهای نازک و سبک پرهیز کنید).
پردازنده: در لپتاپها، پردازندههایی با پسوند “H” که توان بالاتری دارند، ترجیح داده میشوند. پردازنده باید حداقل ۴ هسته عملکردی (Performance Cores) داشته باشد (در پردازندههای با معماری هیبریدی که دارای هستههای عملکردی و بهینه هستند، شبیهسازی باید روی هستههای عملکردی اجرا شود).
حافظه RAM: حداقل 32GB توصیه میشود، اما 64GB برای کار با مدلهای بزرگتر ایدهآل است.
فضای ذخیرهسازی: حتماً از حافظه NVMe با ظرفیت حداقل 1TB استفاده شود.
کارت گرافیک: وجود کارت گرافیک مجزا (Discrete GPU) برای تجربه روان در پیش و پسپردازش ضروری است.
سیستمهای متوسط (ورکاستیشن برای ۱۲ تا ۳۶ هسته)
این سیستمها ستون فقرات بسیاری از تیمهای مهندسی هستند و برای حل اکثر مدلهای صنعتی مناسباند.
- الزامات کلیدی:
پردازنده و حافظه: در این سطح، پهنای باند حافظه اهمیت حیاتی پیدا میکند. برای حدود ۱۲ هسته، از پردازندههای کلاس ورکاستیشن مانند AMD Threadripper (نسخه غیر Pro) که از ۴ کانال حافظه پشتیبانی میکنند، استفاده کنید. برای حدود ۳۶ هسته، پردازندههایی مانند AMD Threadripper Pro یا سری Intel Xeon-W (Sapphire Rapids) ضروری هستند، زیرا از ۸ کانال حافظه پشتیبانی میکنند. باید تمام کانالهای حافظه را با ماژول RAM پر کرد تا از حداکثر پهنای باند حافظه که برای عملکرد حلگر حیاتی است، اطمینان حاصل شود.
فضای ذخیرهسازی: یک درایو NVMe برای حل و یک درایو SSD یا HDD بزرگ برای آرشیو دادهها توصیه میشود.
کارت گرافیک: یک کارت گرافیک ورکاستیشن حرفهای مانند سری NVIDIA RTX Ada برای مدیریت مدلهای بزرگ ضروری است.
سیستمهای بزرگ (سرور یا کلاستر برای بیش از ۱۲۸ هسته)
این سیستمها برای حل بزرگترین و پیچیدهترین مسائل، مانند شبیهسازیهای بسیار بزرگ CFD یا تحلیلهای دینامیکی پیچیده، طراحی شدهاند.
- الزامات کلیدی:
پردازنده: نیازمند قطعات کلاس سرور مانند پردازندههای AMD Epyc و Intel Xeon 6 است که از تعداد زیادی هسته و کانالهای حافظه متعدد (۸ تا ۱۲ کانال به ازای هر CPU) پشتیبانی میکنند.
حافظه: باید تمام کانالهای حافظه موجود در سیستم پر شوند تا از حداکثر پهنای باند حافظه که برای عملکرد حلگر حیاتی است، بهرهبرداری شود.
اتصالات: در حالت چند-نودی (کلاستر)، استفاده از اتصالات پرسرعت مانند InfiniBand برای ارتباط بین نودها ضروری است تا از ایجاد گلوگاه در شبکه جلوگیری شود.
پس از انتخاب سختافزار، باید سیستم عامل مناسب را انتخاب کرد. همچنین یک جایگزین قدرتمند برای خرید سختافزار داخلی وجود دارد: محاسبات ابری.
سیستم عامل و گزینه جایگزین: محاسبات ابری
سیستم عامل (Operating System)
- توصیههای کلی: اکثر کاربران از
Windows 10یاWindows 11بر روی ورکاستیشنهای خود با موفقیت استفاده میکنند. - شرایط نیاز به سیستم عامل سرور: در شرایط زیر، استفاده از یک سیستم عامل سرور (مانند Windows Server یا توزیعهای لینوکس مانند Red Hat/SUSE) ضروری است:
سیستم دارای بیش از ۲ سوکت فیزیکی CPU باشد.
چندین ماشین به صورت یک کلاستر با هم کار کنند.
چندین کاربر به طور همزمان از یک سیستم (به صورت محلی یا از راه دور) استفاده کنند.
جایگزین سختافزار داخلی: محاسبات ابری (Cloud Computing)
- معرفی مفهوم: به جای خرید، پیکربندی و نگهداری سختافزار گرانقیمت داخلی، میتوانید از سرویسهای ابری مانند
Ansys Cloudاستفاده کنید. این سرویسها دسترسی بر اساس تقاضا به منابع محاسباتی قدرتمند را از طریق اینترنت فراهم میکنند. - تحلیل مزایا: مزایای کلیدی محاسبات ابری عبارتند از:
حذف هزینه خرید سختافزار: نیازی به سرمایهگذاری اولیه سنگین برای خرید سرور یا ورکاستیشن نیست.
دسترسی به آخرین فناوریها: همیشه به جدیدترین و قدرتمندترین پردازندهها و GPU ها دسترسی دارید.
حذف هزینههای نگهداری: هزینههای مربوط به برق، خنککننده، فضا و مدیریت IT حذف میشود.
افزایش بهرهوری مهندسان: مهندسان دیگر در صف انتظار برای آزاد شدن منابع محاسباتی نمیمانند و میتوانند تحلیلهای خود را به سرعت اجرا کنند.
- معرفی سرویسها: Ansys گزینههای مختلفی برای محاسبات ابری ارائه میدهد، از جمله
Ansys Access on Microsoft AzureوAnsys Gateway powered by AWSکه امکان اجرای روان کل مجموعه نرمافزاری Ansys را بر روی زیرساختهای ابری پیشرو فراهم میکنند.
جمعبندی و نتیجهگیری
- مرور نکات کلیدی: انتخاب سختافزار مناسب یک فرآیند متعادلسازی بین هزینه و عملکرد است. همانطور که دیدیم، یک سیستم مورد نیاز انسیس کارآمد، سیستمی است که در آن اجزا به صورت هماهنگ با یکدیگر کار میکنند. مهمترین عوامل تأثیرگذار عبارتند از: پهنای باند حافظه، رعایت نسبت صحیح بین تعداد هستهها و کانالهای حافظه، انتخاب پردازندهای با سرعت کلاک پایه بالا و معماری جدید، و استفاده از فضای ذخیرهسازی پرسرعت NVMe برای فایلهای حل.
- توصیه نهایی: بهترین راه برای اطمینان از انتخاب درست، آزمودن است. به عنوان توصیه نهایی، به کاربران پیشنهاد میشود که در صورت امکان، قبل از خرید نهایی، مدلهای کاری نمونه خود را روی سختافزارهای مختلف بنچمارک کنند. استفاده از سرویسهای ابری برای انجام این بنچمارکها میتواند یک راهکار عالی و کمهزینه برای ارزیابی عملکرد گزینههای مختلف سختافزاری باشد و به شما کمک کند تا با اطمینان کامل، بهترین سیستم را برای نیازهای خود انتخاب کنید.