এআই মডেল প্রশিক্ষণের জন্য চেকপয়েন্টিং অপরিহার্য, কারণ এটি স্থিতিস্থাপকতা, কার্যকারিতা এবং সংরক্ষিত অবস্থা থেকে প্রশিক্ষণ পুনরায় শুরু বা ফাইন-টিউন করার ক্ষমতা নিশ্চিত করে। তবে, আধুনিক এআই ওয়ার্কলোডের চাহিদা—যা ক্রমবর্ধমান জটিল মডেল এবং বিশাল প্রশিক্ষণ ডেটাসেট দ্বারা চিহ্নিত—স্টোরেজ সিস্টেমকে তাদের সর্বোচ্চ সীমায় ঠেলে দিচ্ছে।
এআই ওয়ার্কফ্লোতে চেকপয়েন্টিংয়ের ভূমিকা
এআই প্রশিক্ষণে চেকপয়েন্টিং একটি গুরুত্বপূর্ণ প্রক্রিয়া যা পর্যায়ক্রমে মডেলের সম্পূর্ণ অবস্থা সংরক্ষণ করে। এই অবস্থায় মডেলের ওজন এবং প্যারামিটার, অপ্টিমাইজার স্টেট, লার্নিং রেট শিডিউল এবং প্রশিক্ষণের মেটাডেটা অন্তর্ভুক্ত থাকে। নির্দিষ্ট বিরতিতে প্রশিক্ষণের একটি ব্যাপক স্ন্যাপশট তৈরি করে, চেকপয়েন্টিং প্রশিক্ষণের ধারাবাহিকতা নিশ্চিত করে এবং বাধাগুলির ক্ষেত্রে পুনরুদ্ধারের অনুমতি দেয়।
চেকপয়েন্টগুলি সাধারণত পুনরাবৃত্তি-ভিত্তিক বিরতিতে (যেমন, প্রতি হাজার প্রশিক্ষণ ধাপে) ক্যাপচার করা হয়। আধুনিক বৃহৎ ভাষা মডেল (LLM) প্রশিক্ষণ—যা সপ্তাহ বা এমনকি মাস ধরে চলতে পারে এবং বিশাল কম্পিউটিং সংস্থান ব্যবহার করে—সম্ভাব্য ব্যর্থতার বিরুদ্ধে একটি সুরক্ষা জাল হিসাবে এই চেকপয়েন্টগুলির উপর ব্যাপকভাবে নির্ভর করে। উদাহরণস্বরূপ, একটি GPT-4-শ্রেণীর মডেল প্রশিক্ষণ মডেলের আকার এবং প্রশিক্ষণ কনফিগারেশনের উপর নির্ভর করে কয়েকশ গিগাবাইট থেকে কয়েক টেরাবাইট পর্যন্ত চেকপয়েন্ট তৈরি করতে পারে।
DALL-E দ্বারা তৈরি প্রশিক্ষণ প্রক্রিয়া
চেকপয়েন্টিংয়ের প্রাথমিক উদ্দেশ্য কেবল ব্যাকআপ কার্যকারিতার বাইরেও বিস্তৃত। এটি প্রশিক্ষণের স্থিতিস্থাপকতার জন্য একটি গুরুত্বপূর্ণ প্রক্রিয়া হিসাবে কাজ করে, যা সিস্টেমের ব্যর্থতা, বিদ্যুৎ বিভ্রাট বা হার্ডওয়্যার সমস্যার ক্ষেত্রে স্ক্র্যাচ থেকে পুনরায় শুরু করার পরিবর্তে শেষ সংরক্ষিত অবস্থা থেকে প্রশিক্ষণ পুনরায় শুরু করার অনুমতি দেয়। উপরন্তু, মডেল বিশ্লেষণের জন্য চেকপয়েন্টগুলি অমূল্য: তারা গবেষকদের বিভিন্ন প্রশিক্ষণ পর্যায়ে মডেলের বিবর্তন পরীক্ষা করতে এবং কর্মক্ষমতা হ্রাস সনাক্ত করা হলে পূর্ববর্তী অবস্থায় ফিরে যেতে সক্ষম করে।
স্টোরেজের দৃষ্টিকোণ থেকে, চেকপয়েন্টিংয়ের সময় লেখার ধরণগুলি বিশেষভাবে উল্লেখযোগ্য। যখন একটি চেকপয়েন্ট ট্রিগার হয়, তখন সিস্টেমকে একটি বার্স্ট প্যাটার্নে বিশাল পরিমাণে ডেটা লিখতে হয়। এটি একটি স্বতন্ত্র I/O প্রোফাইল তৈরি করে: প্রশিক্ষণের গণনার সময় তুলনামূলকভাবে কম স্টোরেজ কার্যকলাপের সময়কাল, তারপরে চেকপয়েন্টিংয়ের সময় তীব্র, উচ্চ-ব্যান্ডউইথ লেখার অপারেশন। এই লেখার অপারেশনগুলি সাধারণত অনুক্রমিক হয় এবং উচ্চ-ব্যান্ডউইথ অনুক্রমিক লেখার জন্য অপ্টিমাইজ করা স্টোরেজ সিস্টেম থেকে উল্লেখযোগ্যভাবে উপকৃত হতে পারে।
ডিস্ট্রিবিউটেড প্রশিক্ষণে বিভিন্ন প্যারালালিজম কৌশল চেকপয়েন্টিং আচরণের উপর একটি উল্লেখযোগ্য প্রভাব ফেলতে পারে। এই কৌশলগুলি কখন প্রশিক্ষণের সময় চেকপয়েন্টিং ঘটে এবং মডেলের কোন অংশ সংরক্ষিত হয় তা প্রভাবিত করে। আধুনিক ডিস্ট্রিবিউটেড প্রশিক্ষণ সেটআপে, একাধিক জিপিইউ একই স্তরের বিভিন্ন অংশ একই সাথে লিখতে পারে, জটিল I/O প্যাটার্ন তৈরি করে। এই সমান্তরাল লেখার ক্ষমতা দক্ষতার জন্য মূল চাবিকাঠি কিন্তু ডেটা সামঞ্জস্য বজায় রাখার সময় সমবর্তী লেখার অপারেশনগুলি পরিচালনা করতে পারে এমন সতর্ক সমন্বয় এবং শক্তিশালী স্টোরেজ সিস্টেমের প্রয়োজন। এই প্রক্রিয়ার যেকোনো বাধা ব্যাপক প্রশিক্ষণ বিলম্বের কারণ হতে পারে।
ধীর চেকপয়েন্টিং উল্লেখযোগ্য প্রশিক্ষণ বাধা তৈরি করতে পারে, কারণ চেকপয়েন্টটি স্টোরেজে লেখার সময় পুরো প্রশিক্ষণ প্রক্রিয়াটি থামাতে হয়। উদাহরণস্বরূপ, একটি বৃহৎ-স্কেল প্রশিক্ষণ সেটআপে, যদি চেকপয়েন্টিং প্রতি কয়েক ঘন্টায় ৩০ মিনিট সময় নেয়, তবে এটি পুরো প্রশিক্ষণ সময়কালে কয়েক ঘন্টা ডাউনটাইম জমা হতে পারে। এটি সরাসরি প্রশিক্ষণের দক্ষতাকে প্রভাবিত করে এবং অপারেশনাল খরচ বাড়ায়—বিশেষ করে ক্লাউড পরিবেশে যেখানে কম্পিউটিং সংস্থানগুলি প্রতি ঘন্টায় বিল করা হয়।
দ্রুত চেকপয়েন্টিং দলগুলিকে আরও ঘন ঘন চেকপয়েন্ট তৈরি করতে দেয়, ব্যর্থতার ক্ষেত্রে সম্ভাব্য ডেটা ক্ষতির পরিমাণ হ্রাস করে। এটি আরও আক্রমণাত্মক প্রশিক্ষণ পদ্ধতি এবং উন্নত পরীক্ষামূলক পুনরাবৃত্তি চক্রের অনুমতি দেয়। উপরন্তু, দ্রুত চেকপয়েন্ট লোডিং সময় দ্রুত পরীক্ষা-নিরীক্ষার সুবিধা দেয় বিভিন্ন প্রশিক্ষণ কনফিগারেশন এবং মডেল আর্কিটেকচারের সাথে, কারণ গবেষকরা বিকল্প পদ্ধতি পরীক্ষা করার জন্য পূর্ববর্তী অবস্থা থেকে সহজেই পুনরুদ্ধার করতে পারেন।
এই চেকপয়েন্ট অপারেশনগুলি দক্ষতার সাথে পরিচালনা করার জন্য স্টোরেজ সিস্টেমের ক্ষমতা সামগ্রিক প্রশিক্ষণ অবকাঠামোতে একটি গুরুত্বপূর্ণ কারণ হয়ে ওঠে। উচ্চ-কার্যকারিতা স্টোরেজ সমাধান যা চেকপয়েন্টিংয়ের বার্স্ট রাইট প্যাটার্ন এবং প্রশিক্ষণের টেকসই রিড/রাইট অপারেশন উভয়ই পরিচালনা করতে পারে তা বৃহৎ ভাষা মডেল প্রশিক্ষণের মোট সময় এবং খরচ উল্লেখযোগ্যভাবে কমাতে পারে। সুতরাং, স্টোরেজ সাবসিস্টেমের কর্মক্ষমতা বৈশিষ্ট্য—বিশেষ করে বড় অনুক্রমিক লেখাগুলি পরিচালনা করার এবং সামঞ্জস্যপূর্ণ উচ্চ ব্যান্ডউইথ বজায় রাখার ক্ষমতা—LLM প্রশিক্ষণ অবকাঠামো ডিজাইন করার সময় গুরুত্বপূর্ণ বিবেচনা।
এই প্রতিবেদনের জন্য, আমরা এআই চেকপয়েন্টিংয়ের জন্য এসএসডি কর্মক্ষমতা মূল্যায়ন করতে চেয়েছিলাম, সর্বশেষ জেন ৫ এসএসডিগুলির সুবিধাগুলি মূল্যায়ন করে যখন চেকপয়েন্ট গতি গুরুত্বপূর্ণ, বাজারের বৃহত্তম কিউএলসি এসএসডিগুলির তুলনায়—যা মডেল প্রশিক্ষণের জন্য আরও উপকারী হলে বিশাল সংখ্যক চেকপয়েন্ট সংরক্ষণ করতে পারে।
চেকপয়েন্ট কর্মক্ষমতা – ডিএলআইও সহ বেঞ্চমার্কিং
এআই প্রশিক্ষণ পরিবেশে সলিডিগম এসএসডি-র বাস্তব-বিশ্বের কর্মক্ষমতা মূল্যায়ন করতে, আমরা ডেটা এবং লার্নিং ইনপুট/আউটপুট (ডিএলআইও) বেঞ্চমার্ক টুল ব্যবহার করেছি। আর্গন ন্যাশনাল ল্যাবরেটরি দ্বারা উন্নত, ডিএলআইও বিশেষভাবে ডিপ লার্নিং ওয়ার্কলোডগুলিতে I/O প্যাটার্ন পরীক্ষা করার জন্য ডিজাইন করা হয়েছে, যা স্টোরেজ সিস্টেমগুলি চেকপয়েন্টিং, ডেটা ইনজেশন এবং মডেল প্রশিক্ষণ চ্যালেঞ্জগুলি কীভাবে পরিচালনা করে সে সম্পর্কে অন্তর্দৃষ্টি প্রদান করে।

ডিএলআইও ব্যবহার করে, আমরা তীব্র চেকপয়েন্টিং পরিস্থিতিতে ড্রাইভের থ্রুপুট, লেটেন্সি এবং নির্ভরযোগ্যতা পরিমাপ করার লক্ষ্য নিয়েছিলাম। যদিও এই পরীক্ষাটি ৬১.৪ টিবি ডি৫-পি৫৩৩৬-এ পরিচালিত হয়েছিল, প্রাথমিক কর্মক্ষমতা ডেটা নির্দেশ করে যে সলিডিগম ডি৫-পি৫৩৩৬ ১২২ টিবি সংস্করণ অনুরূপ কর্মক্ষমতা প্রোফাইল সরবরাহ করে। আমরা টিএলসি-ভিত্তিক ডি৭-পিএস১০১০ থেকে ফলাফলও অন্তর্ভুক্ত করেছি এই পরীক্ষায় পিসিআইই জেন ৫ এর সুবিধাগুলি প্রদর্শন করতে। আমরা চেকপয়েন্টগুলির উভয় দৃষ্টিকোণ তুলে ধরার জন্য এই দুটি ড্রাইভ নির্বাচন করেছি: একটি দ্রুততম সম্ভাব্য চেকপয়েন্ট সময়ের উপর দৃষ্টি নিবদ্ধ করে, এবং অন্যটি একটি একক এসএসডি-তে সর্বাধিক সংখ্যক চেকপয়েন্ট সংরক্ষণ করার উপর।
এই কাজের জন্য নির্বাচিত প্ল্যাটফর্ম ছিল আমাদের ডেল পাওয়ারএজ আর৭৬০ যা উবুন্টু ২২.০৪.০২ এলটিএস চালাচ্ছে। আমরা আগস্ট ১৩, ২০২৪ রিলিজ থেকে ডিএলআইও বেঞ্চমার্ক সংস্করণ ২.০ ব্যবহার করেছি। আমাদের সিস্টেম কনফিগারেশন নিচে রূপরেখা দেওয়া হল:
- ২ x ইন্টেল জিয়ন গোল্ড ৬৪৩০ (৩২-কোর, ২.১ গিগাহার্টজ)
- ১৬ x ৬৪ জিবি ডিডিআর৫-৪৪০০
- ৪৮০ জিবি ডেল বস এসএসডি
- সিরিয়াল কেবল জেন ৫ জেবিওএফ
- ৭.৬৮ টিবি সলিডিগম ডি৭-পিএস১০১০
- ৬১.৪৪ টিবি সলিডিগম ডি৫-পি৫৩৩৬
আমাদের বেঞ্চমার্কিং বাস্তব-বিশ্বের পরিস্থিতি প্রতিফলিত করে তা নিশ্চিত করতে, আমরা এলএলএএমএ ৩.১ ৪০৫ বি মডেল আর্কিটেকচারের উপর ভিত্তি করে আমাদের পরীক্ষাগুলি তৈরি করেছি, মডেল প্যারামিটার, অপ্টিমাইজার স্টেট এবং লেয়ার স্টেট ক্যাপচার করার জন্য torch.save() এর মাধ্যমে চেকপয়েন্টিং প্রয়োগ করেছি। আমাদের সেটআপ একটি ৮-জিপিইউ সিস্টেম অনুকরণ করেছে, আটটি জিপিইউ জুড়ে বিতরণ করা ৪-ওয়ে টেনসর প্যারালাল এবং ২-ওয়ে পাইপলাইন প্যারালাল প্রক্রিয়াকরণের সাথে একটি হাইব্রিড প্যারালালিজম কৌশল প্রয়োগ করেছে। এই কনফিগারেশনের ফলে ১,৬৩৬ জিবি চেকপয়েন্ট আকার হয়েছে, যা আধুনিক বৃহৎ ভাষা মডেল প্রশিক্ষণের প্রয়োজনীয়তাগুলির প্রতিনিধিত্ব করে।
ডিএলআইও চেকপয়েন্ট ওয়ার্কলোডের জন্য আমাদের পরীক্ষার প্রক্রিয়া প্রতিটি ড্রাইভকে অনুরূপ ব্যবহার স্তরে পূরণ করার জন্য গঠিত। ৬১.৪ টিবি সলিডিগম ডি৫-পি৫৩৩৬-এর জন্য, প্রতিটি পাসে ৩৩টি চেকপয়েন্ট বিরতি অন্তর্ভুক্ত ছিল, মোট ৫৪ টিবি। ছোট ৭.৬৮ টিবি ডি৭-পিএস১০১০ সহজেই তিনটি চেকপয়েন্ট বিরতি ফিট করেছে, যার মোট ফুটপ্রিন্ট ৪.৯ টিবি। একটি অতিরিক্ত চেকপয়েন্ট ডি৭-পিএস১০১০-এ ফিট করতে পারত, যদিও এটি তার ব্যবহার কিছুটা বেশি বাড়িয়ে দিয়েছিল যা আমরা চেয়েছিলাম।
ডিএলআইও চেকপয়েন্ট ওয়ার্কলোড আকর্ষণীয় ফলাফল দিয়েছে যখন আমরা জেন ৪ কিউএলসি-ভিত্তিক ৬১.৪ টিবি ডি৫-পি৫৩৩৬ কে জেন ৫ টিএলসি-ভিত্তিক ৭.৬৮ টিবি ডি৭-পিএস১০১০ এর সাথে তুলনা করেছি। প্রথম পাসের সময়, ড্রাইভগুলি পূরণ হওয়ার সাথে সাথে, আমরা দুটি এসএসডি মডেলের মধ্যে কর্মক্ষমতার একটি বৃহত্তর ব্যবধান দেখেছি। দ্রুত জেন ৫ পিএস১০১০ প্রতিটি চেকপয়েন্ট গড়ে ৪৬৪ সেকেন্ডে সম্পন্ন করেছে, জেন ৪ পি৫৩৬ থেকে ৬২৩ সেকেন্ডের তুলনায়। দ্বিতীয় এবং তৃতীয় পাসে, ব্যবধান পিএস১০১০ এর জন্য ৫৭৯ এবং ৫৮৭ সেকেন্ড এবং পি৫৩৬ এর জন্য ৬৭৬ এবং ৬৮০ সেকেন্ডে সংকীর্ণ হয়েছে।
যেসব ব্যবসা চেকপয়েন্টিং বিরতিতে সম্ভাব্য ক্ষুদ্রতম ব্যবধান রাখতে চায় তাদের জন্য, টিএলসি-ভিত্তিক জেন ৫ পিএস১০১০ দ্রুততম সমাপ্তির সময়ে একটি সুবিধা প্রদান করে। যদি লক্ষ্য হয় অনেক চেকপয়েন্ট সাশ্রয়ীভাবে ধরে রাখা, তবে কিউএলসি-ভিত্তিক জেন ৪ পি৫৩৬ তা করতে পারে। আমরা দ্বিতীয় এবং তৃতীয় পাসে উভয় ড্রাইভের মধ্যে গড় চেকপয়েন্ট সময়ের মধ্যে ১৭% এর কম পার্থক্য পরিমাপ করেছি।
জিপিইউডিরেক্ট স্টোরেজ ব্যান্ডউইথ
যদিও ডিএলআইও একটি এআই ওয়ার্কফ্লোতে ফ্ল্যাশ কর্মক্ষমতা দেখায়, ওয়ার্কলোডটি একটি চেকপয়েন্ট পুনরুদ্ধার না হওয়া পর্যন্ত সম্পূর্ণভাবে লেখার উপর ভিত্তি করে। এআই ওয়ার্কলোডগুলিতে সলিডিগম ডি৭-পিএস১০১০ এবং ডি৫-পি৫৩৩৬ এর একটি সম্পূর্ণ চিত্র আঁকতে, আমরা জিডিএসআইও ব্যবহার করে রিড ব্যান্ডউইথ পরিমাপ অন্তর্ভুক্ত করেছি।
জিপিইউ ডিরেক্ট স্টোরেজ কিভাবে কাজ করে
ঐতিহ্যগতভাবে, যখন একটি জিপিইউ একটি এনভিএমই ড্রাইভে সংরক্ষিত ডেটা প্রক্রিয়া করে, তখন ডেটা প্রথমে জিপিইউতে পৌঁছানোর আগে সিপিইউ এবং সিস্টেম মেমরির মধ্য দিয়ে যেতে হয়। এই প্রক্রিয়াটি বাধা সৃষ্টি করে, কারণ সিপিইউ একটি মধ্যস্থতাকারী হয়ে ওঠে, লেটেন্সি যোগ করে এবং মূল্যবান সিস্টেম সংস্থান ব্যবহার করে। জিপিইউ ডিরেক্ট স্টোরেজ এই অদক্ষতা দূর করে জিপিইউকে পিসিআইই বাসের মাধ্যমে সরাসরি স্টোরেজ ডিভাইস থেকে ডেটা অ্যাক্সেস করার অনুমতি দিয়ে। এই সরাসরি পথ ডেটা স্থানান্তরের সাথে যুক্ত ওভারহেড হ্রাস করে, দ্রুত এবং আরও দক্ষ ডেটা স্থানান্তর সক্ষম করে।
এআই ওয়ার্কলোড, বিশেষ করে ডিপ লার্নিং জড়িতগুলি, অত্যন্ত ডেটা-ইনটেনসিভ। বড় নিউরাল নেটওয়ার্ক প্রশিক্ষণ টেরাবাইট ডেটা প্রক্রিয়াকরণের প্রয়োজন হয়, এবং ডেটা স্থানান্তরে যেকোনো বিলম্ব কম ব্যবহৃত জিপিইউ এবং দীর্ঘ প্রশিক্ষণের সময় হতে পারে। জিপিইউ ডিরেক্ট স্টোরেজ ডেটা যত দ্রুত সম্ভব জিপিইউতে সরবরাহ করা নিশ্চিত করে এই চ্যালেঞ্জ মোকাবেলা করে, নিষ্ক্রিয় সময় কমিয়ে এবং কম্পিউটিং দক্ষতা বাড়িয়ে তোলে।
ডিএলআইও পরীক্ষার মতো, লক্ষ্য হল উচ্চ-গতির জেন ৫ এসএসডি এবং উচ্চ-ক্ষমতার কিউএলসি ড্রাইভের মধ্যে পার্থক্যগুলি আরও ভালভাবে বোঝা এবং চিহ্নিত করা। প্রতিটি এআই ওয়ার্কলোড একই নয়, এবং প্রতিটি ড্রাইভ নির্দিষ্ট সুবিধা প্রদান করে, প্রয়োজনের উপর নির্ভর করে।
পরীক্ষা কনফিগারেশন ম্যাট্রিক্স
আমরা আমাদের টেস্ট প্ল্যাটফর্মে একটি এনভিডিয়া এল৪ সহ নিম্নলিখিত প্যারামিটারগুলির প্রতিটি সংমিশ্রণ পদ্ধতিগতভাবে পরীক্ষা করেছি:
- ব্লক আকার: ১এম, ১২৮কে, ৬৪কে, ১৬কে, ৮কে
- থ্রেড সংখ্যা: ১২৮, ৬৪, ৩২, ১৬, ৮, ৪, ১
- জব সংখ্যা: ১৬
- ব্যাচ আকার: ১৬
আমাদের প্রথম নজরে কিউএলসি-ভিত্তিক ডি৫-পি৫৩৩৬ ছিল, যা ১২৮ এর আইও গভীরতায় ১এম স্থানান্তর আকার ব্যবহার করে ৪.২ জিআইবি/এস পর্যন্ত পৌঁছেছে। ব্লক আকারের প্রভাব ব্যান্ডউইথে একটি উল্লেখযোগ্য উন্নতি তৈরি করেছে, ৮কে থেকে ১এম পর্যন্ত উপরে উঠেছে। বর্ধিত আইও গভীরতার সুবিধা ৩২-এ টেপার হতে শুরু করেছে, যেখানে ওয়ার্কলোডগুলি সমতল হতে শুরু করেছে।
এরপরে, আমরা জেন ৫ পিএস-১০১০ দেখি, যা ১এম ব্লক আকার এবং ১২৮ এর আইও গভীরতায় ৬.২ জিআইবি/এস পর্যন্ত স্কেল করতে পারে। সব মিলিয়ে, এটি জেন ৪-ভিত্তিক পি৫৩৬ কে ছাড়িয়ে গেছে, বিশেষ করে ওয়ার্কলোডগুলি একটি উল্লেখযোগ্য উন্নতি প্রদর্শন করেছে। উন্নতির একটি উল্লেখযোগ্য ক্ষেত্র ছিল ১২৮কে ব্লকসাইজে, যেখানে ৬৪ এবং ১২৮ এর আইও গভীরতায়, পিএস১০১০ পি৫৩৬ এর দ্বিগুণ রিড ব্যান্ডউইথ সরবরাহ করেছে।
এটা মনে রাখা গুরুত্বপূর্ণ যে উভয় এসএসডি এনভিডিয়া এল৪ ব্যবহার করে পরীক্ষা করা হয়েছিল। যদিও জেন ৪ ডি৫-পি৫৩৬ তার সর্বোচ্চ প্রান্তে বা তার কাছাকাছি, এইচ১০০-এর মতো উচ্চ-মডেল এনভিডিয়া জিপিইউগুলি ডি৭-পিএস১০১০ এর সাথে উচ্চতর কর্মক্ষমতা প্রদর্শন করেছে। একটি ড্রাইভের গতি কিছু গ্রাহকদের জন্য চূড়ান্ত সিদ্ধান্তকারী বিষয়, অন্যরা সামগ্রিক ঘনত্বকে অগ্রাধিকার দেয়।সলিডিগমএর জন্য সমাধান সরবরাহ করেউভয়, তার সাথেকিউএলসি এবং টিএলসি এসএসডি অফারিং।
উপসংহার
এআই প্রশিক্ষণের স্কেল এবং জটিলতা বাড়তে থাকায়, অন্তর্নিহিত স্টোরেজ অবকাঠামোকে কেবল তাল মিলিয়ে চললেই হবে না, বরং গতিও নির্ধারণ করতে হবে। দুটি স্বতন্ত্র এসএসডি সহ আমাদের পরীক্ষাগুলি নির্দিষ্ট প্রশিক্ষণ অগ্রাধিকারগুলির সাথে স্টোরেজ সমাধানগুলি সারিবদ্ধ করার গুরুত্ব তুলে ধরেছে—তা চেকপয়েন্টিং লেটেন্সি হ্রাস করা বা সাশ্রয়ী স্কেলেবিলিটির জন্য চেকপয়েন্টিং ঘনত্ব সর্বাধিক করা।
আমাদের মূল্যায়নে, আমরা বাস্তবসম্মত এআই প্রশিক্ষণ পরিস্থিতিতে সলিডিগম ডি৫-পি৫৩৩৬ (৬১.৪৪ টিবি) এবং ডি৭-পিএস১০১০ (৭.৬৮ টিবি) পরীক্ষা করেছি, ডিএলআইও বেঞ্চমার্ক এবং একটি বিস্তৃত হাইব্রিড-প্যারালাল এলএলএম চেকপয়েন্টিং ওয়ার্কফ্লো ব্যবহার করে। আমরা জেন ৪ কিউএলসি-ভিত্তিক ডি৫-পি৫৩৬ এবং জেন ৫ টিএলসি-ভিত্তিক ডি৭-পিএস১০১০ এর মধ্যে সমাপ্তির সময়ের কর্মক্ষমতা পার্থক্যগুলি তুলে ধরে, ড্রাইভগুলি পূরণ হওয়ার সাথে সাথে একাধিক পরীক্ষা রানের উপর চেকপয়েন্ট রাইট কর্মক্ষমতা প্রতিফলিত মেট্রিকগুলি ক্যাপচার করেছি।

যদিও ডি৭-পিএস১০১০ দ্রুততম সম্ভাব্য চেকপয়েন্ট রাইট সরবরাহ করেছে, ডি৫-পি৫৩৬ একটি সামান্য কর্মক্ষমতা ট্রেড-অফ সহ আকর্ষণীয় খরচ-কার্যকারিতা এবং ক্ষমতা সুবিধা প্রদর্শন করেছে। আমরা একটি এনভিডিয়া এল৪ জিপিইউ সহ জিডিএসআইও ব্যবহার করে জিপিইউ ডিরেক্ট স্টোরেজ (জিডিএস) রিড ব্যান্ডউইথগুলি আরও পরীক্ষা করেছি। আমাদের ফলাফলগুলি দেখিয়েছে যে সলিডিগম ডি৫-পি৫৩৬ ১এম স্থানান্তর আকারের সাথে ৪.২ জিআইবি/এস পর্যন্ত রিড ব্যান্ডউইথ সরবরাহ করেছে, যখন ডি৭-পিএস১০১০ ৬.২ জিআইবি/এস পর্যন্ত একটি উল্লেখযোগ্য উন্নতি প্রদান করেছে। এনভিডিয়া এল৪০এস বা এইচ১০০/এইচ২০০-এর মতো আরও শক্তিশালী জিপিইউ ব্যবহার করলে কর্মক্ষমতা আরও চিত্তাকর্ষক হবে।
ভবিষ্যতের দিকে তাকিয়ে, সলিডিগম ডি৫-পি৫৩৬ ১২২ টিবি এসএসডি-র অভূতপূর্ব ক্ষমতা এআই প্রশিক্ষণ এবং স্থাপনাকে নতুন আকার দিতে প্রস্তুত। মডেলের আকার এবং চেকপয়েন্টিংয়ের প্রয়োজনীয়তা বাড়তে থাকায়, এই উচ্চ-ক্ষমতার ড্রাইভগুলি নতুন স্তরের দক্ষতা এবং নমনীয়তা আনলক করে, যা পূর্বে অর্জনযোগ্য ছিল না এমন প্রশিক্ষণ কৌশল সক্ষম করে। উচ্চ-ক্ষমতার এসএসডি সমাধানে সলিডিগম-এর নেতৃত্ব সংস্থাগুলিকে কম ড্রাইভে বেশি ডেটা এবং চেকপয়েন্ট সংরক্ষণ করতে সক্ষম করে, যখন এআই জটিলতার পরবর্তী তরঙ্গের বিরুদ্ধে তাদের অবকাঠামোকে ভবিষ্যৎ-প্রমাণ করতে সহায়তা করে।
বেইজিং কিয়ানশিং জিয়েটং টেকনোলজি কোং, লিমিটেড
স্যান্ডি ইয়াং/গ্লোবাল স্ট্র্যাটেজি ডিরেক্টর
হোয়াটসঅ্যাপ / উইচ্যাট: +৮৬ ১৩৪২৬৩৬৬৬২৬
ইমেল: yangyd@qianxingdata.com
ওয়েবসাইট: www.qianxingdata.com/www.storagesserver.com
ব্যবসায়িক ফোকাস:
আইসিটি পণ্য বিতরণ/সিস্টেম ইন্টিগ্রেশন ও পরিষেবা/অবকাঠামো সমাধান
২০ বছরের বেশি আইটি বিতরণ অভিজ্ঞতার সাথে, আমরা নির্ভরযোগ্য পণ্য এবং পেশাদার পরিষেবা সরবরাহ করতে নেতৃস্থানীয় বিশ্ব ব্র্যান্ডগুলির সাথে অংশীদারিত্ব করি।
"একটি বুদ্ধিমান বিশ্ব গড়ে তুলতে প্রযুক্তি ব্যবহার করা" আপনার বিশ্বস্ত আইসিটি পণ্য পরিষেবা প্রদানকারী!