لطفا صبر کنید...
منوی دسته بندی

آیا مشخصات سیستم من برای اجرای روان انسیس مناسب است؟

مورد نیاز

انتخاب سخت‌افزار مناسب برای کاربران نرم‌افزار Ansys یک تصمیم حیاتی است که می‌تواند به طور مستقیم بر بهره‌وری، اندازه مدل‌های قابل حل و تجربه کلی کاربری تأثیر بگذارد. یک سیستم بهینه، زمان حل را کاهش می‌دهد، امکان تحلیل مدل‌های پیچیده‌تر را فراهم می‌کند و تعامل روان با نرم‌افزار در مراحل پیش‌پردازش و پس‌پردازش را تضمین می‌کند. بنابراین، سرمایه‌گذاری در یک سیستم مورد نیاز انسیس که به درستی پیکربندی شده باشد، یک گام اساسی برای هر مهندس تحلیلگر است. در این راهنما، ما به بررسی دقیق هر یک از اجزای سخت‌افزاری، از حافظه اصلی (RAM) گرفته تا پردازنده‌های گرافیکی (GPU)، می‌پردازیم. سپس توصیه‌هایی عملی برای پیکربندی سیستم‌های مختلف، از لپ‌تاپ‌های مهندسی تا سرورهای محاسباتی قدرتمند، ارائه خواهیم داد و در نهایت، گزینه‌های جایگزین مانند محاسبات ابری را معرفی می‌کنیم.

اصول کلیدی در انتخاب سخت‌افزار برای Ansys

پیش از پرداختن به جزئیات هر قطعه، درک چند اصل کلی برای بهینه‌سازی عملکرد حلگرهای Ansys (به‌ویژه در حوزه دینامیک سیالات محاسباتی یا CFD) ضروری است. این اصول به شما کمک می‌کنند تا یک سیستم متعادل و کارآمد طراحی کنید که در آن هیچ قطعه‌ای به گلوگاه (Bottleneck) برای قطعات دیگر تبدیل نشود و حداکثر بازدهی از سرمایه‌گذاری شما حاصل گردد.

اهمیت پهنای باند حافظه (Memory Bandwidth):

در اکثر سناریوهای شبیه‌سازی، پهنای باند حافظه مهم‌ترین مشخصه برای عملکرد سیستم است. این پارامتر تعیین می‌کند که داده‌ها با چه سرعتی بین حافظه RAM و پردازنده منتقل می‌شوند.

نسبت تعداد هسته‌ها به کانال‌های حافظه:

برای عملکرد بهینه، باید تمام کانال‌های حافظه موجود روی مادربرد را با ماژول‌های RAM پر کرد. همچنین، نسبت تعداد هسته‌های پردازنده به هر کانال حافظه نباید از ۴:۱ تجاوز کند. برای دستیابی به حداکثر کارایی و مقیاس‌پذیری خطی، نسبت ایده‌آل ۲:۱ است.

حافظه نهان (Cache) پردازنده:

پردازنده‌هایی با حافظه کش بزرگتر (مانند سری 3D V-Cache از AMD) می‌توانند پهنای باند مؤثر حافظه را افزایش دهند. این امر با ذخیره بخشی از داده‌های شبیه‌سازی در حافظه فوق‌سریع کش، نیاز به دسترسی به RAM را کاهش داده و عملکرد را به طور قابل توجهی بهبود می‌بخشد.

سرعت کلاک پایه (Base Clock Speed) پردازنده:

سرعت کلاک پایه بالا در CPU اهمیت زیادی دارد. باید از خرید پردازنده‌های کم‌مصرف (low wattage) که تعداد هسته‌های بالایی دارند اما فرکانس پایه آن‌ها پایین است، پرهیز کرد، زیرا این پردازنده‌ها تحت بار سنگین محاسباتی، فرکانس خود را به شدت کاهش می‌دهند.

استفاده از هسته‌های فیزیکی:

حلگرهای Ansys باید روی هسته‌های فیزیکی (Physical Cores) اجرا شوند، نه رشته‌های مجازی (Threads). به همین دلیل، اغلب توصیه می‌شود که قابلیت چندرشته‌ای (Multi-threading یا Hyper-threading) در ورک‌استیشن‌های اختصاصی شبیه‌سازی غیرفعال شود.

فضای ذخیره‌سازی پرسرعت:

دایرکتوری‌های کاری و فضای موقت (scratch) نرم‌افزار باید روی حافظه‌های پرسرعت NVMe تنظیم شوند. این امر به‌ویژه برای تحلیل‌هایی که به شدت به ورودی/خروجی (I/O-bound) وابسته هستند، حیاتی است.

با در نظر گرفتن این اصول، اکنون می‌توانیم نقش و اهمیت هر یک از قطعات سخت‌افزاری را به صورت دقیق‌تر بررسی کنیم.

بررسی عمیق اجزای سخت‌افزاری

در این بخش، هر یک از اجزای اصلی سخت‌افزار به ترتیب اولویت و تأثیرگذاری بر عملکرد Ansys بررسی خواهند شد. درک نقش هر قطعه به شما کمک می‌کند تا بودجه خود را به بهترین شکل ممکن سرمایه‌گذاری کرده و سیستمی متناسب با نیازهای تحلیلی خود بسازید.

حافظه اصلی (RAM)

تحلیل نقش RAM: حافظه اصلی (RAM) به طور مستقیم حداکثر اندازه مدل (از نظر تعداد درجات آزادی یا Degrees of Freedom) که می‌توانید حل کنید را تعیین می‌کند. کمبود RAM به معنای عدم توانایی در حل مدل‌های بزرگ است.

تشریح اهمیت حیاتی RAM: شما یا به اندازه کافی RAM دارید یا ندارید؛ حالت میانه‌ای وجود ندارد. اگر سیستم عامل با کمبود حافظه مواجه شود، به استفاده از هارد دیسک به عنوان «حافظه مجازی» (Virtual Memory) روی می‌آورد. این اتفاق تأثیری فاجعه‌بار بر عملکرد سیستم دارد. برای درک بهتر این موضوع، می‌توان سرعت دسترسی به سطوح مختلف حافظه را این‌گونه مقایسه کرد:

دسترسی به L1 Cache پردازنده: مانند برداشتن یک کاغذ از روی میزتان (۳ ثانیه).

دسترسی به حافظه اصلی (RAM): مانند پیاده‌روی در راهرو برای خرید یک شکلات (۴ دقیقه).

دسترسی به هارد دیسک (حافظه مجازی): مانند ترک کردن ساختمان و گشتن به دور زمین برای ۱ سال و ۳ ماه. بنابراین، صرفه‌جویی در هزینه RAM هرگز توصیه نمی‌شود.

ارائه توصیه‌های کمی: حداقل 16GB رم توصیه می‌شود. با این حال، تجربه نشان می‌دهد که 64GB برای ۹۰٪ پروژه‌های FEA و CFD کافی است. برای تحلیل‌های حوزه الکترومغناطیس (EMAG) که معمولاً به حافظه بیشتری نیاز دارند، بیش از 100GB پیشنهاد می‌شود.

ارائه جدول تخمین حافظه: لازم به ذکر است که جدول زیر یک راهنمای تخمینی برای محاسبه حافظه ویدیویی (VRAM) مورد نیاز GPU است و مشخصاً برای اجرای شبیه‌سازی‌ها با حلگر GPU در Ansys Fluent کاربرد دارد؛ این مقادیر را نباید با نیازمندی‌های حافظه اصلی سیستم (System RAM) اشتباه گرفت. این جدول می‌تواند به عنوان یک راهنمای تقریبی برای تخمین حافظه مورد نیاز GPU (بر حسب گیگابایت به ازای هر یک میلیون سلول) عمل کند. توجه داشته باشید که این مقادیر تقریبی هستند و به فیزیک مسئله نیز بستگی دارند.

نوع مش (Mesh Type)

Single Precision, Segregated

Single Precision, Coupled

Double Precision, Segregated

Double Precision, Coupled

Tetrahedral

1.0 GB

1.8 GB

1.6 GB

3.0 GB

Hexahedral

1.2 GB

2.2 GB

1.9 GB

3.6 GB

Polyhedral

1.8 GB

3.4 GB

2.8 GB

5.6 GB

پردازنده مرکزی (CPU)

تحلیل نقش CPU: تعداد هسته‌ها و سرعت کلاک پردازنده، سرعت حل یک مدل را تعیین می‌کند. یک معیار خوب برای مقایسه گزینه‌های مختلف CPU، استفاده از فرمول ساده (سرعت کلاک × تعداد هسته‌ها / هزینه) است. این معیار به شما کمک می‌کند تا بهترین عملکرد را به ازای هزینه پرداختی دریافت کنید.

مقایسه AMD در مقابل Intel: بنچمارک‌های اخیر نشان می‌دهند که پردازنده‌های جدید AMD EPYC 9474F (Genoa) در تعداد هسته‌های بالا عملکرد بهتری نسبت به پردازنده‌های Intel Xeon Platinum 8480+ (Sapphire Rapids) از خود نشان داده‌اند. دلیل اصلی این برتری، توانایی پردازنده‌های AMD در حفظ سرعت کلاک بالا حتی تحت بار کامل است؛ به طوری که پردازنده Genoa فرکانس ۴ گیگاهرتز را تحت بار کامل حفظ می‌کند، در حالی که فرکانس Sapphire Rapids به ۲.۱ گیگاهرتز کاهش می‌یابد. همچنین، از نسخه 2022 R1 به بعد، نرم‌افزار Ansys به طور خودکار از کتابخانه‌های ریاضی بهینه‌سازی شده AMD (AOCL/BLIS) هنگام اجرا روی پردازنده‌های این شرکت استفاده می‌کند که به بهبود بیشتر عملکرد کمک می‌کند.

تشریح اهمیت معماری و کلاک: همواره سعی کنید جدیدترین معماری CPU موجود در بازار را انتخاب کنید. پردازنده‌های امروزی با کلاک یکسان، به دلیل بهبودهای معماری، تقریباً دو برابر سریع‌تر از پردازنده‌های ۳ سال پیش هستند. علاوه بر این، برای کارهایی که به خوبی موازی‌سازی نمی‌شوند (مانند برخی از ساب‌روتین‌های USERMAT در Ansys Mechanical APDL)، داشتن فرکانس پایه (Base Frequency) بالا اهمیت بیشتری نسبت به تعداد هسته‌ها پیدا می‌کند.

فضای ذخیره‌سازی (Storage)

تحلیل نقش Storage: حافظه ذخیره‌سازی، ظرفیت نگهداری داده‌های پروژه و مهم‌تر از آن، سرعت خواندن و نوشتن فایل‌های حل را مشخص می‌کند. سرعت پایین ذخیره‌سازی می‌تواند به یک گلوگاه جدی در فرآیند تحلیل تبدیل شود.

ارائه رویکرد بهینه: یک رویکرد کارآمد و متداول، استفاده از یک درایو کوچک و بسیار سریع (مانند NVMe) برای نصب نرم‌افزار و اجرای حل (Solving) و یک درایو بزرگتر و کندتر (مانند SSD یا HDD) برای ذخیره‌سازی بلندمدت پروژه‌ها (Storage) است. در Ansys Mechanical، شما می‌توانید یک مسیر مجزا برای فایل‌های موقت حلگر (Solver Scratch Directory) تعیین کنید تا محاسبات روی درایو پرسرعت انجام شود.

شناسایی تحلیل‌های I/O-Bound: در تحلیل‌های زیر، سرعت ورودی/خروجی (I/O) یک گلوگاه (bottleneck) اصلی محسوب می‌شود و استفاده از حافظه‌های پرسرعت در آن‌ها ضروری است:

    • حلگر اسپارس Out-of-core در Mechanical
    • حل‌های موازی با حافظه توزیع شده (DMP)، زیرا هر هسته مجموعه فایل‌های خود را ایجاد می‌کند.
    • تحلیل‌های گذرا (Transient) در FEA یا CFD که در آن‌ها نتایج زیادی در بازه‌های زمانی متعدد روی دیسک نوشته می‌شود.

مقایسه فناوری‌های ذخیره‌سازی:

    • NVMe: سریع‌ترین و بهترین گزینه موجود برای درایو حل است و به شدت توصیه می‌شود.
    • SSD: به طور قابل توجهی سریع‌تر از هارد دیسک‌های مکانیکی (HDD) هستند و گزینه مناسبی برای درایو ذخیره‌سازی یا حتی درایو حل در سیستم‌های با بودجه محدودتر محسوب می‌شوند.
    • RAID0: ترکیبی از چند درایو برای افزایش سرعت است. این روش سرعت را به قیمت از دست رفتن افزونگی (redundancy) افزایش می‌دهد (اگر یک درایو از کار بیفتد، کل داده‌ها از بین می‌رود) و تنها برای درایوهای scratch که نیاز به حداکثر سرعت دارند، باید در نظر گرفته شود.

کارت گرافیک (Graphics) و پردازنده گرافیکی (GPU)

  • کارت گرافیک برای پیش/پس‌پردازش: برای تعامل روان با مدل‌های پیچیده و بزرگ و جلوگیری از تأخیر در نمایش (display latency)، استفاده از یک کارت گرافیک ورک‌استیشن مجزا (discrete workstation graphics card) مانند سری NVIDIA Quadro یا RTX Ada به شدت توصیه می‌شود. برخی نرم‌افزارها مانند Ansys AIM و SpaceClaim بدون کارت گرافیک مجزا کار نمی‌کنند.
  • GPU برای محاسبات (GPU Computing):

تشریح مفهوم: برخی از محصولات Ansys (مانند Fluent و Mechanical) می‌توانند محاسبات کلیدی حلگر را به پردازنده گرافیکی (GPU) منتقل کرده و سرعت حل را به طور چشمگیری افزایش دهند. این قابلیت به خصوص در حلگر Fluent بسیار توسعه یافته و می‌تواند عملکردی معادل صدها هسته CPU را ارائه دهد.

تفاوت هسته‌های GPU: هسته‌های GPU به دو دسته اصلی تقسیم می‌شوند: هسته‌های FP32 برای محاسبات با دقت یگانه (single-precision) و هسته‌های FP64 برای محاسبات با دقت مضاعف (double-precision). کارت‌های گرافیک ارزان‌تر و مصرفی فاقد هسته‌های FP64 اختصاصی هستند و محاسبات double-precision را با شبیه‌سازی از طریق هسته‌های FP32 انجام می‌دهند. این شبیه‌سازی منجر به یک افت عملکرد قابل توجه می‌شود و سرعت حل را تقریباً به نصف کاهش می‌دهد. در مقابل، کارت‌های سرور رده‌بالا مانند NVIDIA H100 دارای هسته‌های FP64 اختصاصی هستند و این محاسبات را با حداکثر سرعت اجرا می‌کنند.

نیازمندی‌های لایسنس: استفاده از GPU برای محاسبات نیازمند لایسنس‌های HPC است. در Ansys Fluent، مدل لایسنسینگ بر اساس تعداد «چندهسته‌ای‌های جریانی» (Streaming Multiprocessors یا SMs) در کارت‌های NVIDIA یا «واحدهای محاسباتی» (Compute Units یا CUs) در کارت‌های AMD است. لایسنس پایه CFD Enterprise شامل ۴۰ واحد SM/CU می‌شود و برای استفاده از تعداد بیشتر، به لایسنس‌های اضافی Ansys HPC نیاز است.

اکنون که با نقش هر قطعه آشنا شدیم، به ارائه چند پیکربندی نمونه برای سیستم‌های کامل در مقیاس‌های مختلف می‌پردازیم.

توصیه‌های پیکربندی بر اساس مقیاس و بودجه

در این بخش، بر اساس اصول و جزئیات ذکر شده، چند نمونه پیکربندی پیشنهادی برای نیازها و بودجه‌های مختلف، از یک لپ‌تاپ مهندسی تا یک سرور قدرتمند، ارائه می‌شود تا به شما در انتخاب یک سیستم متناسب کمک کند.

سیستم‌های کوچک (لپ‌تاپ یا کامپیوتر رومیزی برای ۴ هسته)

این سیستم‌ها برای دانشجویان، تحلیل‌های اولیه و مدل‌های کوچک مناسب هستند.

  • الزامات کلیدی:

شاسی: برای لپ‌تاپ، شاسی با سیستم خنک‌کنندگی مناسب انتخاب شود (از مدل‌های نازک و سبک پرهیز کنید).

پردازنده: در لپ‌تاپ‌ها، پردازنده‌هایی با پسوند “H” که توان بالاتری دارند، ترجیح داده می‌شوند. پردازنده باید حداقل ۴ هسته عملکردی (Performance Cores) داشته باشد (در پردازنده‌های با معماری هیبریدی که دارای هسته‌های عملکردی و بهینه هستند، شبیه‌سازی باید روی هسته‌های عملکردی اجرا شود).

حافظه RAM: حداقل 32GB توصیه می‌شود، اما 64GB برای کار با مدل‌های بزرگتر ایده‌آل است.

فضای ذخیره‌سازی: حتماً از حافظه NVMe با ظرفیت حداقل 1TB استفاده شود.

کارت گرافیک: وجود کارت گرافیک مجزا (Discrete GPU) برای تجربه روان در پیش و پس‌پردازش ضروری است.

سیستم‌های متوسط (ورک‌استیشن برای ۱۲ تا ۳۶ هسته)

این سیستم‌ها ستون فقرات بسیاری از تیم‌های مهندسی هستند و برای حل اکثر مدل‌های صنعتی مناسب‌اند.

  • الزامات کلیدی:

پردازنده و حافظه: در این سطح، پهنای باند حافظه اهمیت حیاتی پیدا می‌کند. برای حدود ۱۲ هسته، از پردازنده‌های کلاس ورک‌استیشن مانند AMD Threadripper (نسخه غیر Pro) که از ۴ کانال حافظه پشتیبانی می‌کنند، استفاده کنید. برای حدود ۳۶ هسته، پردازنده‌هایی مانند AMD Threadripper Pro یا سری Intel Xeon-W (Sapphire Rapids) ضروری هستند، زیرا از ۸ کانال حافظه پشتیبانی می‌کنند. باید تمام کانال‌های حافظه را با ماژول RAM پر کرد تا از حداکثر پهنای باند حافظه که برای عملکرد حلگر حیاتی است، اطمینان حاصل شود.

فضای ذخیره‌سازی: یک درایو NVMe برای حل و یک درایو SSD یا HDD بزرگ برای آرشیو داده‌ها توصیه می‌شود.

کارت گرافیک: یک کارت گرافیک ورک‌استیشن حرفه‌ای مانند سری NVIDIA RTX Ada برای مدیریت مدل‌های بزرگ ضروری است.

 سیستم‌های بزرگ (سرور یا کلاستر برای بیش از ۱۲۸ هسته)

این سیستم‌ها برای حل بزرگترین و پیچیده‌ترین مسائل، مانند شبیه‌سازی‌های بسیار بزرگ CFD یا تحلیل‌های دینامیکی پیچیده، طراحی شده‌اند.

  • الزامات کلیدی:

پردازنده: نیازمند قطعات کلاس سرور مانند پردازنده‌های AMD Epyc و Intel Xeon 6 است که از تعداد زیادی هسته و کانال‌های حافظه متعدد (۸ تا ۱۲ کانال به ازای هر CPU) پشتیبانی می‌کنند.

حافظه: باید تمام کانال‌های حافظه موجود در سیستم پر شوند تا از حداکثر پهنای باند حافظه که برای عملکرد حلگر حیاتی است، بهره‌برداری شود.

اتصالات: در حالت چند-نودی (کلاستر)، استفاده از اتصالات پرسرعت مانند InfiniBand برای ارتباط بین نودها ضروری است تا از ایجاد گلوگاه در شبکه جلوگیری شود.

پس از انتخاب سخت‌افزار، باید سیستم عامل مناسب را انتخاب کرد. همچنین یک جایگزین قدرتمند برای خرید سخت‌افزار داخلی وجود دارد: محاسبات ابری.

سیستم عامل و گزینه جایگزین: محاسبات ابری

سیستم عامل (Operating System)

  • توصیه‌های کلی: اکثر کاربران از Windows 10 یا Windows 11 بر روی ورک‌استیشن‌های خود با موفقیت استفاده می‌کنند.
  • شرایط نیاز به سیستم عامل سرور: در شرایط زیر، استفاده از یک سیستم عامل سرور (مانند Windows Server یا توزیع‌های لینوکس مانند Red Hat/SUSE) ضروری است:

سیستم دارای بیش از ۲ سوکت فیزیکی CPU باشد.

چندین ماشین به صورت یک کلاستر با هم کار کنند.

چندین کاربر به طور همزمان از یک سیستم (به صورت محلی یا از راه دور) استفاده کنند.

جایگزین سخت‌افزار داخلی: محاسبات ابری (Cloud Computing)

  • معرفی مفهوم: به جای خرید، پیکربندی و نگهداری سخت‌افزار گران‌قیمت داخلی، می‌توانید از سرویس‌های ابری مانند Ansys Cloud استفاده کنید. این سرویس‌ها دسترسی بر اساس تقاضا به منابع محاسباتی قدرتمند را از طریق اینترنت فراهم می‌کنند.
  • تحلیل مزایا: مزایای کلیدی محاسبات ابری عبارتند از:

حذف هزینه خرید سخت‌افزار: نیازی به سرمایه‌گذاری اولیه سنگین برای خرید سرور یا ورک‌استیشن نیست.

دسترسی به آخرین فناوری‌ها: همیشه به جدیدترین و قدرتمندترین پردازنده‌ها و GPU ها دسترسی دارید.

حذف هزینه‌های نگهداری: هزینه‌های مربوط به برق، خنک‌کننده، فضا و مدیریت IT حذف می‌شود.

افزایش بهره‌وری مهندسان: مهندسان دیگر در صف انتظار برای آزاد شدن منابع محاسباتی نمی‌مانند و می‌توانند تحلیل‌های خود را به سرعت اجرا کنند.

  • معرفی سرویس‌ها: Ansys گزینه‌های مختلفی برای محاسبات ابری ارائه می‌دهد، از جمله Ansys Access on Microsoft Azure و Ansys Gateway powered by AWS که امکان اجرای روان کل مجموعه نرم‌افزاری Ansys را بر روی زیرساخت‌های ابری پیشرو فراهم می‌کنند.

 جمع‌بندی و نتیجه‌گیری

  • مرور نکات کلیدی: انتخاب سخت‌افزار مناسب یک فرآیند متعادل‌سازی بین هزینه و عملکرد است. همانطور که دیدیم، یک سیستم مورد نیاز انسیس کارآمد، سیستمی است که در آن اجزا به صورت هماهنگ با یکدیگر کار می‌کنند. مهم‌ترین عوامل تأثیرگذار عبارتند از: پهنای باند حافظه، رعایت نسبت صحیح بین تعداد هسته‌ها و کانال‌های حافظه، انتخاب پردازنده‌ای با سرعت کلاک پایه بالا و معماری جدید، و استفاده از فضای ذخیره‌سازی پرسرعت NVMe برای فایل‌های حل.
  • توصیه نهایی: بهترین راه برای اطمینان از انتخاب درست، آزمودن است. به عنوان توصیه نهایی، به کاربران پیشنهاد می‌شود که در صورت امکان، قبل از خرید نهایی، مدل‌های کاری نمونه خود را روی سخت‌افزارهای مختلف بنچمارک کنند. استفاده از سرویس‌های ابری برای انجام این بنچمارک‌ها می‌تواند یک راهکار عالی و کم‌هزینه برای ارزیابی عملکرد گزینه‌های مختلف سخت‌افزاری باشد و به شما کمک کند تا با اطمینان کامل، بهترین سیستم را برای نیازهای خود انتخاب کنید.

نظرات بسته شده است.