StorageReview গণনার মাধ্যমে π-কে ৩১৪ ট্রিলিয়ন ডিজিটে পৌঁছে দিয়ে কম্পিউটেশনাল মুকুট পুনরুদ্ধার করেছে, যা পূর্বের বিশ্ব রেকর্ড ভেঙে দিয়েছে। π-এর নির্ভুলতার জন্য আধুনিক প্রতিযোগিতা প্রাথমিক ক্লাউড পরীক্ষা থেকে পরিকাঠামো দক্ষতা এবং প্রকৌশল উদ্ভাবনের একটি পূর্ণাঙ্গ প্রদর্শনীতে পরিণত হয়েছে।
২০২২ সালে, গুগল ক্লাউড ১০০ ট্রিলিয়ন ডিজিটে π গণনা করে শিরোনামে এসেছিল। y-cruncher প্রোগ্রাম চালানোর জন্য ক্লাউড ইনস্ট্যান্সের একটি বিশাল বহর ব্যবহার করে, এই প্রকল্পে কয়েক পেটাবাইট I/O ডেটা ব্যবহার করা হয়েছিল। সেই সময়ে, এই মাইলফলকটি ঐতিহ্যবাহী পরিকাঠামো কী অর্জন করতে পারে তার সর্বোচ্চ সীমা নির্ধারণ করেছিল।
এরপর মনোযোগ অন-প্রাঙ্গণ ল্যাব পরিবেশের দিকে সরে যায়। ২০২৪ সালের শুরুতে, আমরা সলিডিগম QLC SSD-এর প্রায় ১ পেটাবাইট দ্বারা সমর্থিত ১০৫ ট্রিলিয়ন ডিজিটের একটি নতুন রেকর্ড স্থাপন করার জন্য আমাদের সিস্টেম আপগ্রেড করেছি। এই অর্জনটি একটি নতুন স্কেল বেঞ্চমার্ক স্থাপন করেছে, প্রমাণ করে যে একটি একক অন-প্রাঙ্গণ মেশিন ব্যতিক্রমী দক্ষতা প্রদান করতে পারে। মাত্র কয়েক মাস পরে, আমরা সীমা আরও বাড়িয়ে ২০২ ট্রিলিয়ন ডিজিটে পৌঁছেছি। এই যুগান্তকারী আবিষ্কারটি প্রমাণ করেছে যে উচ্চ-ঘনত্বের ফ্ল্যাশ স্টোরেজ, সতর্ক সিস্টেম টিউনিংয়ের সাথে মিলিত হয়ে, এই অত্যন্ত চাহিদাপূর্ণ নির্দিষ্ট কাজের জন্য হাইপারস্কেল ক্লাউড পরিকাঠামোকে ছাড়িয়ে যেতে পারে।
স্বাভাবিকভাবেই, প্রতিটি রেকর্ড একটি চ্যালেঞ্জ তৈরি করে। লিনাস মিডিয়া গ্রুপ এবং কিওক্সিয়া পরবর্তীতে ৩০০ ট্রিলিয়ন ডিজিটে π গণনা করে এই খেতাব অর্জন করে। তাদের সেটআপটি ২পিবি ফ্ল্যাশ স্টোরেজ সহ একটি বড় ওয়েকা শেয়ার্ড-স্টোরেজ ক্লাস্টারের উপর নির্ভর করেছিল। যদিও এটি স্টোরেজ-ভারী ঐতিহ্যবাহী পরিকাঠামোর সম্ভাবনা প্রদর্শন করেছিল, তবে এর উল্লেখযোগ্য ট্রেড-অফ ছিল: হার্ডওয়্যারের একটি সম্পূর্ণ র্যাক, প্রচুর বিদ্যুৎ খরচ এবং জটিল শীতলীকরণের প্রয়োজনীয়তা। আমরা এই রেকর্ডটি চ্যালেঞ্জ ছাড়াই থাকতে দেব না বলে দৃঢ়প্রতিজ্ঞ ছিলাম।
আজ, StorageReview আমাদের নতুন বিজয় ঘোষণা করতে পেরে গর্বিত: ৩১৪ ট্রিলিয়ন ডিজিটে π গণনা। এই কৃতিত্বটি একটি একক ২ইউ ডেল পাওয়ারএজ R7725 সার্ভার ব্যবহার করে অর্জন করা হয়েছে, যা ডুয়াল এএমডি এপিক ৯৯৬৫০-কোর সিপিইউ এবং চল্লিশটি ৬১.৪4টিবি মাইক্রন ৬৫৫০ আয়ন এসএসডি দিয়ে সজ্জিত। আমরা জুলাই মাসে সিস্টেম তৈরি এবং টিউনিং সম্পন্ন করেছি, এবং ৩১শে জুলাই, ২০২৫ তারিখে গণনা শুরু করেছি। কাকতালীয়ভাবে, এসসি২৫-এর দ্বিতীয় দিনে গণনা শেষ হয়েছিল, যা এই নতুন উচ্চ-কার্যকারিতা কম্পিউটিং (HPC) রেকর্ডটিকে আরও সময়োপযোগী করে তুলেছে।
y-cruncher কে ৩১৪ ট্রিলিয়ন ডিজিটে স্কেল করা
একবার গণনা স্কেল শত শত ট্রিলিয়ন ডিজিট ছাড়িয়ে গেলে, y-cruncher একটি ঐতিহ্যবাহী বেঞ্চমার্ক থেকে একটি কঠিন দীর্ঘ-দূরত্বের পরিকাঠামো স্ট্রেস টেস্টে রূপান্তরিত হয়। প্রোগ্রামের মূল যুক্তি সহজ থাকে, তবে এই স্কেলে হার্ডওয়্যারের সাথে এর মিথস্ক্রিয়া সিদ্ধান্তমূলক কারণ হয়ে দাঁড়ায়। পুরো অপারেশনটি হাজার হাজার মাল্টি-প্রিসিশন অপারেশন মসৃণভাবে চালানোর জন্য সিস্টেমের ক্ষমতার উপর নির্ভর করে—সিপিইউগুলিকে থামিয়ে না দিয়ে বা স্টোরেজ স্তরকে অভিভূত না করে। প্রকৃতপক্ষে, এই নতুন রেকর্ডটি সত্যিই স্টোরেজ স্তরে জিতেছে।
আমরা ৪০টি মাইক্রন ৬৫৫০ আয়ন জেন৫ এনভিএমই এসএসডি স্থাপন করেছি, যার মধ্যে ৩৪টি বিশেষভাবে y-cruncher চালানোর জন্য বরাদ্দ করা হয়েছে। এই এসএসডি পুলটি প্রায় ২.১ পেটাবাইট ব্যবহারযোগ্য স্থান সরবরাহ করে, যা y-cruncher কে ৩১৪ ট্রিলিয়ন ডিজিটের π গণনা এবং প্রক্রিয়া করার জন্য প্রয়োজনীয় পর্যাপ্ত স্টোরেজ সরবরাহ করে। অবশিষ্ট ৬টি এসএসডি একটি সফ্টওয়্যার RAID10 ভলিউমে কনফিগার করা হয়েছে, যা বিশেষভাবে চূড়ান্ত ৩১৪-ট্রিলিয়ন-ডিজিট ফলাফল সংরক্ষণের জন্য ব্যবহৃত হয়।
ডেল পাওয়ারএজ সার্ভারের ১৬তম এবং ১৭তম প্রজন্মের মধ্যে নকশার উন্নতিগুলিও এই ৩১৪-ট্রিলিয়ন-ডিজিট রেকর্ড রানের জন্য কর্মক্ষমতা বৃদ্ধিতে একটি মূল ভূমিকা পালন করেছে। আমাদের পূর্ববর্তী ২০২-ট্রিলিয়ন-ডিজিট প্রচেষ্টায় ২৪-বে ডেল পাওয়ারএজ R760 ব্যবহার করা হয়েছিল, যেখানে ড্রাইভ ডেনসিটির বিনিময়ে উন্নত কর্মক্ষমতার জন্য ড্রাইভ ব্যাকপ্লেনে একটি PCIe সুইচ ছিল। বিপরীতে, ১৭তম প্রজন্মের পাওয়ারএজ সার্ভার, যেমন ইন্টেল-ভিত্তিক R770 এবং এএমডি-ভিত্তিক R7725, সরাসরি-সংযোগ-শুধুমাত্র নকশার সাথে ব্যাকপ্লেন বৈশিষ্ট্যযুক্ত, প্রতি বে-তে ২ বা ৪টি PCIe লেন সরবরাহ করে।
৪০-বে জেন৫ E3.S ব্যাকপ্লেন সহ পাওয়ারএজ R7725, প্রতিটি এসএসডি স্লটের জন্য ২ PCIe লেন সরবরাহ করে। যদিও এটি কাগজে-কলমে কর্মক্ষমতার একটি সম্ভাব্য ট্রেড-অফ বলে মনে হতে পারে, প্ল্যাটফর্মটি এখনও চিত্তাকর্ষক গতি সরবরাহ করতে পারে: যখন সমস্ত ৪০টি বে সম্পূর্ণরূপে ব্যবহৃত হয় তখন প্রতি সেকেন্ডে ২৮০ জিবি পর্যন্ত যুগপৎ পঠন এবং লিখন কর্মক্ষমতা।
অভ্যন্তরীণ y-cruncher স্টোরেজ বেঞ্চমার্ক ব্যবহার করে, আমরা প্রতিটি প্ল্যাটফর্মের নিজ নিজ কনফিগারেশনের উপর স্টোরেজ কর্মক্ষমতা পরিমাপ করেছি। সমস্ত ওয়ার্কলোডের উপর, আমরা ৭২% থেকে ৩৮৩% পর্যন্ত স্টোরেজ কর্মক্ষমতা উন্নতির লক্ষ্য করেছি, সুষম পঠন এবং লিখন মেট্রিক্স সহ—উচ্চ-স্কেল স্টোরেজ-নিবিড় কম্পিউটিংয়ের জন্য ১৭তম প্রজন্মের পাওয়ারএজ সার্ভারের শ্রেষ্ঠত্বকে শক্তিশালী করে।
| মেট্রিক | ২০২টি সিস্টেম (পুরানো রেকর্ড) | ৩১৪টি সিস্টেম (নতুন রেকর্ড) | শতাংশ পার্থক্য (৩১৪টি বনাম ২০২টি) |
|---|---|---|---|
| সিকোয়েন্সিয়াল রাইট | ৪৭.০ জিআইবি/সে | ১০৭ জিআইবি/সে | +১২৭.৭% |
| সিকোয়েন্সিয়াল রিড | ৫৬.৭ জিআইবি/সে | ১২৭ জিআইবি/সে | +১২৪.০% |
| থ্রেশহোল্ড স্ট্রাইড রাইট | ৬২.২ জিআইবি/সে | ১০৭ জিআইবি/সে | +৭২.০% |
| থ্রেশহোল্ড স্ট্রাইড রিড | ২০.৯ জিআইবি/সে | ১০১ জিআইবি/সে | +৩৮৩.৩% |
ডেল পাওয়ারএজ R7725 শুধুমাত্র একটি স্টোরেজ পাওয়ারহাউসের চেয়ে অনেক বেশি; এটি ব্যতিক্রমী কম্পিউটেশনাল সম্ভাবনা সহ একটি ডুয়াল-সকেট এএমডি তুরিন প্ল্যাটফর্ম হিসাবে উজ্জ্বলভাবে জ্বলে। আমরা আমাদের সিস্টেমে ১৯২-কোর এএমডি এপিক ৯৯৬৫ প্রসেসর দিয়ে সজ্জিত করেছি, যা মোট ৩৮৪ কোর সরবরাহ করে। এই কর্মক্ষমতা আনলক করতে, আমরা লিকুইড-কুলড CoolIT SP5 কোল্ড প্লেটগুলিতে স্টক এয়ার-কুলিং সলিউশন আপগ্রেড করেছি, যা CoolIT AHx10 লিকুইড-টু-এয়ার CDU (কুল্যান্ট ডিস্ট্রিবিউশন ইউনিট) দ্বারা শীতল করা হয়েছে।
এই কৌশলগত কুলিং আপগ্রেড তিনটি মূল সুবিধা প্রদান করেছে: এটি সিপিইউগুলিকে বজায় রাখতে সক্ষম করেছে ধারাবাহিক উচ্চ ক্লক স্পিড, সার্ভারের চ্যাসিস ফ্যানগুলিকে উল্লেখযোগ্যভাবে কম গতিতে চলতে দিয়েছে ৩০% PWM (পালস উইডথ মডুলেশন), এবং সিস্টেমের গড় বিদ্যুৎ খরচ প্রায় ১,৬০০Wআরও পরিপক্ক, প্রোডাকশন-গ্রেড ডিজাইন
সফ্টওয়্যার এবং সিস্টেম অপ্টিমাইজেশান
সফ্টওয়্যার স্তরের জন্য, আমরা উইন্ডোজ সার্ভারের পরিবর্তে উবুন্টু ২৪.০৪.২ এলটিএস সার্ভার বেছে নিয়ে অতীতের অভ্যাস থেকে সরে এসেছি। এই সিদ্ধান্তটি সিস্টেমের স্থিতিশীলতা সর্বাধিকীকরণ এবং ওয়ার্কলোড কর্মক্ষমতায় উল্লেখযোগ্য লাভ আনলক করার জন্য অপরিহার্য প্রমাণিত হয়েছে।
রেকর্ড রানের আগে, আমরা কঠোর পরীক্ষা পুনরাবৃত্তি করেছি এবং কনফিগারেশন ফাইন-টিউন করেছি। একটি গুরুত্বপূর্ণ পদক্ষেপ ছিল ৩৮৪টি উপলব্ধ কোরের মধ্যে ৪টি গুরুত্বপূর্ণ ব্যাকগ্রাউন্ড সিস্টেম অপারেশনের জন্য সংরক্ষণ করা, প্রধান গণনা থ্রেডগুলি অবাধে চলছে তা নিশ্চিত করা। ফলাফল? আমরা কেবল পূর্বের পাই রেকর্ডটিই ভাঙিনি—আমরা এটিকে ধ্বংস করেছি প্রতিটি পরিমাপযোগ্য মেট্রিক জুড়ে। আমাদের রান কর্মক্ষমতা, পাওয়ার দক্ষতা এবং সবচেয়ে চিত্তাকর্ষকভাবে, এর ত্রুটিহীন নির্ভরযোগ্যতার ক্ষেত্রে অতুলনীয়। আমরা শূন্য ডাউনটাইম সহ সম্পন্ন হওয়া একমাত্র বৃহৎ-স্কেল পাই বিশ্ব-রেকর্ড প্রচেষ্টা হওয়ার পার্থক্য ধরে রাখতে বিশেষভাবে গর্বিত; গণনাটি পুনরায় শুরু করার প্রয়োজন ছাড়াই শুরু থেকে শেষ পর্যন্ত নির্বিঘ্নে চলেছে।
রেকর্ড-ব্রেকিং পাওয়ার দক্ষতা
StorageReview-এর প্রতিটি পাই রেকর্ড প্রচেষ্টার পেছনের একটি মূল নীতি হল সিস্টেমের জটিলতা হ্রাস করা এবং শক্তি দক্ষতার জন্য অপ্টিমাইজ করা। পূর্ববর্তী ৩০০টি রেকর্ড একটি বিতরণ করা স্টোরেজ ক্লাস্টারের উপর নির্ভর করেছিল উচ্চ-গতির নেটওয়ার্কিং সহ, যা সহজাতভাবে বৃহত্তর বিদ্যুৎ এবং শীতলীকরণের বাজেট দাবি করেছিল।
আমরা একটি মৌলিকভাবে ভিন্ন পদ্ধতি গ্রহণ করেছি। চরম স্টোরেজ ঘনত্ব এর উপর মনোযোগ কেন্দ্রীভূত করে, আমরা একটি একক ২ইউ সার্ভারে সোয়াপ স্পেস এবং স্থায়ী আউটপুট স্টোরেজ উভয়ই একত্রিত করেছি। এই স্থাপত্য পছন্দটি আমাদের সামগ্রিক বিদ্যুৎ এবং শীতলীকরণের পদচিহ্নকে নাটকীয়ভাবে হ্রাস করার জন্য গুরুত্বপূর্ণ ছিল।
সম্পূর্ণ ৩১৪-ট্রিলিয়ন-ডিজিট গণনার সময়কালে, আমাদের ডেল পাওয়ারএজ R7725 মোট ৩১৪টি একক-সার্ভার রান ব্যবহার করেছে। এটি একটি অসাধারণ প্রতি ট্রিলিয়ন ডিজিটে ১৩.৭০ kWh এর সমতুল্য—
| আমাদের সমাধানকে এখন পর্যন্ত সম্পাদিত সবচেয়ে শক্তি-দক্ষ বৃহৎ-স্কেল পাই গণনার মধ্যে স্থান দিয়েছে। আমাদের দক্ষ, একক-সার্ভার পদ্ধতির এবং বিদ্যুৎ-ক্ষুধার্ত বিতরণ করা ক্লাস্টার পদ্ধতির মধ্যে স্পষ্ট পার্থক্য অবিলম্বে স্পষ্ট, যেমন নীচের তুলনা টেবিলে তুলে ধরা হয়েছে। | রান | মোট kWh | খরচ @ $০.১২/kWh |
|---|---|---|---|
| খরচ @ $০.২০/kWh | ৩০০টি ওয়েকা ক্লাস্টার রান | ৩৩,৬০০ kWh (আনুমানিক) | $৪,০৩২ |
| $৬,৭২০ | ৩১৪টি একক-সার্ভার রান | ৪,৩০৪.৬৬২ kWh | $৫১৭ |
$৮৬১
এটি তুলে ধরা গুরুত্বপূর্ণ যে আমাদের ৩১৪-ট্রিলিয়ন-ডিজিট গণনার সময়, আমরা JBOD (জাস্ট আ বানচ অফ ডিস্কস) কনফিগারেশনে SSD ব্যবহার করেছি, যার মধ্যে ডেটা রিডান্ডেন্সি অন্তর্ভুক্ত নেই। এই সিদ্ধান্তটি দুটি মূল অগ্রাধিকার দ্বারা চালিত হয়েছিল: বিদ্যুৎ খরচ অপ্টিমাইজ করা এবং সামগ্রিক সিস্টেম কর্মক্ষমতা সর্বাধিকীকরণ। তবে, এটি কাজের চাপের নির্দিষ্ট চাহিদা অনুসারে স্টোরেজ সমাধানগুলি তৈরি করার বিষয়ে একটি গুরুত্বপূর্ণ কথোপকথনও শুরু করেছে। প্রতিটি কাজের চাপ অনন্য—কিছু ন্যূনতম অপারেশনাল প্রভাব সহ পুনরায় শুরু করা যেতে পারে এবং তাই মিশন-ক্রিটিক্যাল কাজের মতো একই উচ্চ স্তরের ফল্ট টলারেন্সের প্রয়োজন হয় না। আমাদের ক্ষেত্রে, আমরা একটি ঐতিহ্যবাহী সফ্টওয়্যার RAID সেটআপের মাধ্যমে চূড়ান্ত ডেটা আউটপুট রক্ষা করার উপর মনোযোগ দিয়েছি, সিস্টেমের দক্ষতা আপোস না করে রেকর্ড-ব্রেকিং π ডিজিটের অখণ্ডতা নিশ্চিত করেছি।
১১০ দিন নিরবচ্ছিন্ন রানটাইম
পূর্ববর্তী কোনও π রেকর্ড প্রচেষ্টার চেয়ে বেশি ডিজিট গণনা করা সত্ত্বেও, আমাদের ওয়াল-ক্লক রানটাইম পূর্ববর্তী বেঞ্চমার্কের চেয়ে উল্লেখযোগ্যভাবে কম ছিল। পূর্ববর্তী ৩০০-ট্রিলিয়ন-ডিজিট রেকর্ড সম্পন্ন করতে প্রায় ২২৫ মোট দিন লেগেছিল—ডাউনটাইম বাদ দিলে ১৭৫টি প্রকৃত গণনা দিন। এর বিপরীতে, আমাদের ৩১৪-ট্রিলিয়ন-ডিজিট রান ১১০ দিন নিরবচ্ছিন্ন অপারেশন অর্জন করেছে। এই ব্যতিক্রমী স্থিতিশীলতা চারটি মূল কারণের জন্য দায়ী করা যেতে পারে: একটি শক্তিশালী এবং স্থিতিশীল অপারেটিং সিস্টেম, রিসোর্স কনটেনশন এড়াতে একটি ন্যূনতম ব্যাকগ্রাউন্ড ওয়ার্কলোড, সর্বোত্তম সিপিইউ-মেমরি যোগাযোগের জন্য একটি সুষম NUMA (নন-ইউনিফর্ম মেমরি অ্যাক্সেস) টপোলজি এবং y-cruncher দ্বারা এই অভূতপূর্ব স্কেলে উত্পন্ন অনন্য ডেটা অ্যাক্সেস প্যাটার্নগুলি পরিচালনা করার জন্য বিশেষভাবে তৈরি একটি স্ক্র্যাচ অ্যারে।
- প্রযুক্তিগত হাইলাইটসমোট গণনা করা ডিজিট
- : ৩১৪,০০০,০০০,০০০,০০০ব্যবহৃত হার্ডওয়্যার
- : ডেল পাওয়ারএজ R7725 সহ ২x এএমডি এপিক ৯৯৬৫ সিপিইউ, ১.৫টিব
যোগাযোগের ঠিকানা
Beijing Qianxing Jietong Technology Co., Ltd.
ব্যক্তি যোগাযোগ: Ms. Sandy Yang
টেল: 13426366826



