বাড়ি মামলা

AMD Instinct MI355X MLPerf Inference v6.0 मध्ये १ दशलक्ष टोकन प्रति सेकंद पेक्षा जास्त गतीने यश मिळवते आणि स्केलेबल ROC ला समर्थन देते

সব পণ্য

র্যাক স্টোরেজ সার্ভার
(179)

হুয়াওয়ে ফিউশন সার্ভার
(31)

ডেল পাওয়ারডজ সার্ভার
(59)

H3C সার্ভার
(31)

ডেটাকম সুইচ
(96)

WLAN ডিভাইস
(21)

স্মার্ট ওয়্যারলেস রাউটার
(17)

হার্ড ড্রাইভ HDD
(78)

অভ্যন্তরীণ হার্ড ড্রাইভ SSD
(16)

জিফোর্স গ্রাফিক কার্ড
(27)

ইন্টেল সিপিইউ প্রসেসর
(20)

সার্ভার মেমরি RAM
(6)

সংস্কার করা স্টোরেজ সার্ভার
(6)

SFP ট্রান্সসিভার মডিউল
(4)

ফাইবার চ্যানেল সুইচ
(125)

সাক্ষ্যদান

চীন Beijing Qianxing Jietong Technology Co., Ltd. সার্টিফিকেশন

ক্রেতার পর্যালোচনা

বেইজিং Qianxing Jietong প্রযুক্তি কোং, লিমিটেডের বিক্রয় কর্মীরা খুব পেশাদার এবং ধৈর্যশীল। তারা দ্রুত কোটেশন প্রদান করতে পারেন. পণ্যের মান এবং প্যাকেজিংও খুব ভালো। আমাদের সহযোগিতা খুবই মসৃণ।

—— 《ফেস্টফিং ডিভি》LLC

যখন আমি জরুরীভাবে ইন্টেল CPU এবং Toshiba SSD খুঁজছিলাম, তখন বেইজিং Qianxing Jietong Technology Co., Ltd-এর Sandy আমাকে অনেক সাহায্য করেছিল এবং আমার প্রয়োজনীয় পণ্যগুলি দ্রুত পেয়েছিল। আমি সত্যিই তার প্রশংসা.

—— কিটি ইয়েন

Beijing Qianxing Jietong Technology Co.,Ltd-এর স্যান্ডি একজন অত্যন্ত সতর্ক সেলসম্যান, যিনি সার্ভার কেনার সময় আমাকে কনফিগারেশন ত্রুটির কথা মনে করিয়ে দিতে পারেন। প্রকৌশলীরা খুব পেশাদার এবং দ্রুত পরীক্ষার প্রক্রিয়াটি সম্পূর্ণ করতে পারে।

—— স্ট্রেলকিন মিখাইল ভ্লাদিমিরোভিচ

বেইজিং কিয়ানক্সিং জিয়েটং-এর সাথে কাজ করার অভিজ্ঞতা নিয়ে আমরা খুবই খুশি। পণ্যের গুণমান চমৎকার, এবং ডেলিভারি সবসময় সময় মতো হয়। তাদের বিক্রয় দল পেশাদার, ধৈর্যশীল এবং আমাদের সমস্ত প্রশ্নের উত্তর দিতে খুবই সহায়ক। আমরা তাদের সমর্থনকে সত্যিই মূল্যায়ন করি এবং দীর্ঘমেয়াদী অংশীদারিত্বের জন্য অপেক্ষা করছি। অত্যন্ত সুপারিশকৃত!

—— আহমাদ নাভিদ

গুণমানঃ ¢আমার সরবরাহকারীর সাথে দুর্দান্ত অভিজ্ঞতা। মাইক্রোটিক আরবি 3011 ইতিমধ্যে ব্যবহৃত হয়েছিল, তবে এটি খুব ভাল অবস্থায় ছিল এবং সবকিছু নিখুঁতভাবে কাজ করে। যোগাযোগ দ্রুত এবং মসৃণ ছিল,এবং আমার সকল উদ্বেগ দ্রুত সমাধান করা হয়খুব নির্ভরযোগ্য সরবরাহকারী ঃ অত্যন্ত সুপারিশ ঃ

—— জেরান কোলেসিও

তোমার দর্শন লগ করা অনলাইন চ্যাট এখন

AMD Instinct MI355X MLPerf Inference v6.0 मध्ये १ दशलक्ष टोकन प्रति सेकंद पेक्षा जास्त गतीने यश मिळवते आणि स्केलेबल ROC ला समर्थन देते

April 15, 2026

AMD তাদের MLPerf Inference v6.0 বেঞ্চমার্ক ফলাফল ঘোষণা করেছে, যেখানে Instinct MI355X GPU-কে একটি অত্যন্ত স্কেলযোগ্য ইনফারেন্স প্ল্যাটফর্ম হিসেবে উপস্থাপন করা হয়েছে যা সিঙ্গেল-নোড, মাল্টিনোড এবং হেটেরোজেনাস ডিপ্লয়মেন্ট সমর্থন করতে সক্ষম। শুধুমাত্র পারফরম্যান্সের উন্নতি নয়, এই সাবমিশনে নতুন ওয়ার্কলোড যুক্ত করা হয়েছে, যা প্রতি সেকেন্ডে ১ মিলিয়ন টোকেনের বেশি ক্লাস্টার-স্কেল থ্রুপুট প্রদর্শন করে এবং একটি বিস্তৃত পার্টনার ইকোসিস্টেম জুড়ে ধারাবাহিক পারফরম্যান্স পুনরুৎপাদনযোগ্যতা যাচাই করে।

CDNA 4 আর্কিটেকচার উচ্চ-ক্ষমতার ইনফারেন্সের লক্ষ্য নির্ধারণ করে

Instinct MI355X AMD-এর CDNA 4 আর্কিটেকচারের উপর ভিত্তি করে তৈরি, যা TSMC ডুয়াল-প্রসেস চিপলেট ডিজাইন ব্যবহার করে: কম্পিউট ডাই (XCDs) 3nm নোড ব্যবহার করে, যখন I/O ডাই 6nm FinFET প্রযুক্তি ব্যবহার করে। মাল্টি-চিপলেট প্যাকেজে 185 বিলিয়ন ট্রানজিস্টর একত্রিত করা হয়েছে এবং এটি FP4 ও FP8 ডেটা ফরম্যাট সমর্থন করে—যা বৃহৎ মডেলের দক্ষ ইনফারেন্সের জন্য অত্যন্ত গুরুত্বপূর্ণ। প্রতিটি GPU 288GB পর্যন্ত HBM3E মেমরি (8 TB/sec মেমরি ব্যান্ডউইথ সরবরাহ করে) দিয়ে সজ্জিত, যা একটি একক ডিভাইসে 520 বিলিয়ন প্যারামিটার পর্যন্ত মডেল সমর্থন করতে সক্ষম করে। AMD জোর দিয়ে বলে যে কম্পিউট ডেনসিটি এবং মেমরি ক্যাপাসিটির এই সমন্বয় অতিরিক্ত মডেল পার্টিশনিংয়ের প্রয়োজনীয়তা দূর করে, যা বৃহৎ-স্কেল ইনফারেন্স ওয়ার্কলোডের জন্য একটি মূল সুবিধা।

UBB8 কনফিগারেশনে উপলব্ধ, প্ল্যাটফর্মটি এয়ার-কুলড এবং ডাইরেক্ট লিকুইড-কুলড উভয় বিকল্প সরবরাহ করে, যা বিভিন্ন ডেটা সেন্টার ডিপ্লয়মেন্টের প্রয়োজনীয়তার সাথে সামঞ্জস্যপূর্ণ। উল্লেখযোগ্যভাবে, MI355X-এ লিকুইড কুলিং সহ 1400W TBP (থার্মাল ডিজাইন পাওয়ার) রয়েছে, যা এর এয়ার-কুলড প্রতিরূপ, MI350X-এর চেয়ে উচ্চতর পারফরম্যান্স সরবরাহ করে।

মাল্টিনোড থ্রুপুট প্রতি সেকেন্ডে ১ মিলিয়ন টোকেন ছাড়িয়ে গেছে

MLPerf v6.0 রাউন্ডের একটি উল্লেখযোগ্য অর্জন হল AMD-এর ক্লাস্টার-স্কেল থ্রুপুট প্রতি সেকেন্ডে ১ মিলিয়ন টোকেন ছাড়িয়ে যাওয়া। Instinct MI355X GPU ব্যবহার করে, AMD সার্ভার এবং অফলাইন উভয় পরিস্থিতিতে Llama 2 70B-এর সাথে এই মাইলফলক অর্জন করেছে, পাশাপাশি অফলাইন মোডে GPT-OSS-120B-এর সাথেও এটি অর্জন করেছে।

AMD MLPerf প্রতি সেকেন্ডে ১ মিলিয়ন টোকেন গ্রাফিক

এই ফলাফলগুলি একটি একক অ্যাক্সিলারেটরের পরিবর্তে ক্লাস্টার স্তরে ইনফারেন্স পারফরম্যান্স মূল্যায়নের দিকে ক্রমবর্ধমান শিল্প প্রবণতাকে প্রতিফলিত করে। বৃহৎ-স্কেল AI ডিপ্লয়মেন্টে প্রোডাকশন রেডিডনেস নির্ধারণের জন্য অ্যাগ্রিগেট থ্রুপুট এবং টাইম-টু-সার্ভ প্রধান মেট্রিক হয়ে উঠেছে।

AMD ব্যতিক্রমী স্কেলিং দক্ষতাও প্রদর্শন করেছে। Llama 2 70B-এর জন্য, একটি 11-নোড, 87-GPU কনফিগারেশন অফলাইন, সার্ভার এবং ইন্টারেক্টিভ পরিস্থিতিতে প্রতি সেকেন্ডে ১ মিলিয়ন টোকেনের বেশি অর্জন করেছে, যেখানে স্কেল-আউট দক্ষতা 93% থেকে 98% পর্যন্ত ছিল। GPT-OSS-120B-এর জন্য, একটি 12-নোড, 94-GPU ক্লাস্টার 90% এর বেশি স্কেলিং দক্ষতা সহ অনুরূপ থ্রুপুট সরবরাহ করেছে—যা প্রমাণ করে যে ডিপ্লয়মেন্ট একটি একক সিস্টেমের বাইরে প্রসারিত হওয়ার সাথে সাথে পারফরম্যান্স কার্যকরভাবে অনুবাদ হয়।

প্রজন্মগত লাভ এবং প্রতিযোগিতামূলক সিঙ্গেল-নোড পারফরম্যান্স

AMD উল্লেখযোগ্য প্রজন্মগত উন্নতির কথা জানিয়েছে, যেখানে Instinct MI355X পূর্ববর্তী প্রজন্মের Instinct MI325X-এর তুলনায় Llama 2 70B সার্ভারে 3.1 গুণ বেশি পারফরম্যান্স সরবরাহ করেছে, যা 100,282 টোকেন প্রতি সেকেন্ডে পৌঁছেছে। এই উন্নতি CDNA 4 আর্কিটেকচারাল উন্নতি এবং ROCm সফ্টওয়্যার অপ্টিমাইজেশান উভয় থেকেই উদ্ভূত হয়েছে। অফলাইন স্কোর 4.4 গুণ এবং সার্ভার স্কোর 4.8 গুণ উন্নত হয়েছে পূর্ববর্তী MLPerf রাউন্ডের তুলনায়, যা প্রধানত FP4 কোয়ান্টাইজেশনের কারণে হয়েছে—MI355X-এর একটি মূল বৈশিষ্ট্য যা AI ওয়ার্কলোডের জন্য উচ্চতর থ্রুপুট আনলক করে।

AMD ইনফারেন্স ফলাফল বনাম পূর্ববর্তী প্রজন্মের গ্রাফিক

NVIDIA প্ল্যাটফর্মের সাথে সিঙ্গেল-নোড তুলনাতে, MI355X শক্তিশালী প্রতিদ্বন্দ্বিতা প্রদর্শন করেছে। Llama 2 70B-তে, এটি অফলাইন থ্রুপুটে NVIDIA B200-এর সাথে মিলেছে, সার্ভার পারফরম্যান্সে প্রায় সমতা অর্জন করেছে এবং ইন্টারেক্টিভ মোডে এটিকে ছাড়িয়ে গেছে। NVIDIA B300-এর তুলনায়, MI355X অফলাইন পারফরম্যান্সের 92%, সার্ভার পারফরম্যান্সের 93% সরবরাহ করেছে এবং ইন্টারেক্টিভ মোডে 4% বেশি পারফর্ম করেছে। উল্লেখযোগ্যভাবে, MI355X উন্নত খরচ-দক্ষতাও সরবরাহ করে, NVIDIA B200-এর তুলনায় প্রতি ডলারে 40% বেশি টোকেন সরবরাহ করে।

প্রথমবারের মতো মডেল সক্ষমতা কভারেজ প্রসারিত করে

MLPerf Inference v6.0 বেশ কয়েকটি নতুন ওয়ার্কলোড চালু করেছে, এবং AMD এই রাউন্ডটি দ্রুত মডেল সক্ষমতা প্রদর্শনের জন্য ব্যবহার করেছে। GPT-OSS-120B, একটি মিক্সচার-অফ-এক্সপার্টস মডেল, MI355X-এর সাথে MLPerf-এ আত্মপ্রকাশ করেছে, যা অফলাইন এবং সার্ভার উভয় পরিস্থিতিতে NVIDIA সিস্টেমের বিরুদ্ধে প্রতিযোগিতামূলক ফলাফল অর্জন করেছে।

AMD Wan-2.2 টেক্সট-টু-ভিডিও জেনারেশনের জন্যও ফলাফল জমা দিয়েছে, যা মাল্টিমোডাল এবং জেনারেটিভ ভিডিও ইনফারেন্সে এর প্রবেশ চিহ্নিত করে। যদিও অফিসিয়াল সাবমিশন সিঙ্গেল স্ট্রিম ল্যাটেন্সির উপর দৃষ্টি নিবদ্ধ ছিল, ফলাফলগুলি বিদ্যমান প্ল্যাটফর্মগুলির সাথে সামঞ্জস্যপূর্ণ ছিল। পোস্ট-সাবমিশন টিউনিং পারফরম্যান্সকে আরও উন্নত করেছে, যা সফ্টওয়্যার স্ট্যাক পরিপক্ক হওয়ার সাথে সাথে অপ্টিমাইজেশনের সুযোগ তুলে ধরে।

এই সংযোজনগুলি AMD-এর ঐতিহ্যবাহী LLM বেঞ্চমার্কের বাইরে গিয়ে বিভিন্ন ব্যবহারের ক্ষেত্রে উদীয়মান AI ওয়ার্কলোডগুলিকে সমর্থন করার প্রতিশ্রুতিকে তুলে ধরে।

ROCm সফ্টওয়্যার স্কেলিং এবং হেটেরোজেনাস ইনফারেন্স সক্ষম করে

AMD MI355X-এর পারফরম্যান্স এবং স্কেলেবিলিটির বেশিরভাগ কৃতিত্ব এর ROCm সফ্টওয়্যার স্ট্যাককে দেয়। মূল উন্নতিগুলির মধ্যে রয়েছে অপ্টিমাইজড FP4 এক্সিকিউশন, ডিস্ট্রিবিউটেড ইনফারেন্সের জন্য উন্নত GPU-টু-GPU যোগাযোগ, এবং হেটেরোজেনাস পরিবেশ জুড়ে ডাইনামিক ওয়ার্কলোড বিতরণের জন্য সমর্থন—যা মিশ্র-GPU ডিপ্লয়মেন্টের জন্য অত্যন্ত গুরুত্বপূর্ণ।

AMD MLPerf ইনফারেন্স ফলাফল Instinct MI355X গ্রাফিক

একটি মাইলফলক হেটেরোজেনাস সাবমিশন—যা Dell এবং MangoBoost দ্বারা তৈরি—তিনটি AMD Instinct GPU মডেল ব্যবহার করেছে: MI300X, MI325X, এবং MI355X। এই কনফিগারেশন Llama 2 70B সার্ভারে 141,521 টোকেন প্রতি সেকেন্ড এবং Llama 2 70B অফলাইনে 151,843 টোকেন প্রতি সেকেন্ড অর্জন করেছে। উল্লেখযোগ্যভাবে, MI355X প্ল্যাটফর্মটি Dell-এর মার্কিন যুক্তরাষ্ট্রের ল্যাবে অবস্থিত ছিল, যখন MI300X এবং MI325X সিস্টেমগুলি কোরিয়াতে ছিল—যা ভৌগলিক অবস্থান জুড়ে ডিস্ট্রিবিউটেড সিস্টেম সমন্বয় করার ক্ষমতা প্রদর্শন করে।

ইকোসিস্টেম বৃদ্ধি এবং পুনরুৎপাদনযোগ্যতা

এই MLPerf রাউন্ডে AMD-এর পার্টনার ইকোসিস্টেম উল্লেখযোগ্যভাবে প্রসারিত হয়েছে, যেখানে নয়টি কোম্পানি একাধিক Instinct GPU প্রজন্মের ফলাফল জমা দিয়েছে। অংশগ্রহণকারী বিক্রেতাদের মধ্যে রয়েছে Cisco, Dell, Giga Computing, HPE, MangoBoost, MiTAC, Oracle, Supermicro, এবং Red Hat—যা AMD-এর ইনফারেন্স সলিউশনের বিস্তৃত শিল্প গ্রহণকে প্রতিফলিত করে।

পার্টনার সাবমিশনগুলি AMD-এর অভ্যন্তরীণ ফলাফলের সাথে ঘনিষ্ঠভাবে সামঞ্জস্যপূর্ণ ছিল, সাধারণত 4% এর মধ্যে এবং কিছু ক্ষেত্রে 1% এর মধ্যে। এই ধারাবাহিকতা নিশ্চিত করে যে MI355X পারফরম্যান্স OEM এবং ক্লাউড প্ল্যাটফর্ম জুড়ে পুনরুৎপাদনযোগ্য, যা ডিপ্লয়মেন্ট ঝুঁকি হ্রাস করে এবং বাস্তব-বিশ্বের পারফরম্যান্স ফলাফলের উপর আস্থা বাড়ায়।

বেইজিং Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Global Strategy Director
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com
ব্যবসার মূল ফোকাস:
ICT পণ্য বিতরণ/সিস্টেম ইন্টিগ্রেশন ও পরিষেবা/অবকাঠামো সমাধান
20 বছরের বেশি আইটি বিতরণ অভিজ্ঞতার সাথে, আমরা নির্ভরযোগ্য পণ্য এবং পেশাদার পরিষেবা সরবরাহ করতে শীর্ষস্থানীয় বিশ্ব ব্র্যান্ডগুলির সাথে অংশীদারিত্ব করি।
“প্রযুক্তি ব্যবহার করে একটি বুদ্ধিমান বিশ্ব তৈরি করা” আপনার বিশ্বস্ত ICT পণ্য পরিষেবা প্রদানকারী!

PREV: ভিডিইউআরএ জিটিসি ২০২৬-এ এআই ডেটা প্ল্যাটফর্মের জন্য আরডিএমএ এবং কনটেক্সট-সচেতন স্তরায়ন চালু করেছে

NEXT: এএমডি ইপিওয়াইসি ৪০০৫-এ নির্মিত তিনটি নতুন এজ এআই সিস্টেম উন্মোচন করেছে সুপারমাইক্রো

যোগাযোগের ঠিকানা

Beijing Qianxing Jietong Technology Co., Ltd.

ব্যক্তি যোগাযোগ: Ms. Sandy Yang

টেল: 13426366826

AMD Instinct MI355X MLPerf Inference v6.0 मध्ये १ दशलक्ष टोकन प्रति सेकंद पेक्षा जास्त गतीने यश मिळवते आणि स्केलेबल ROC ला समर्थन देते

র্যাক স্টোরেজ সার্ভার

হুয়াওয়ে ফিউশন সার্ভার

ডেল পাওয়ারডজ সার্ভার

H3C সার্ভার

ডেটাকম সুইচ

WLAN ডিভাইস

স্মার্ট ওয়্যারলেস রাউটার

হার্ড ড্রাইভ HDD

অভ্যন্তরীণ হার্ড ড্রাইভ SSD

জিফোর্স গ্রাফিক কার্ড

ইন্টেল সিপিইউ প্রসেসর

সার্ভার মেমরি RAM

সংস্কার করা স্টোরেজ সার্ভার

SFP ট্রান্সসিভার মডিউল

ফাইবার চ্যানেল সুইচ

AMD Instinct MI355X MLPerf Inference v6.0 मध्ये १ दशलक्ष टोकन प्रति सेकंद पेक्षा जास्त गतीने यश मिळवते आणि स्केलेबल ROC ला समर्थन देते

CDNA 4 আর্কিটেকচার উচ্চ-ক্ষমতার ইনফারেন্সের লক্ষ্য নির্ধারণ করে

মাল্টিনোড থ্রুপুট প্রতি সেকেন্ডে ১ মিলিয়ন টোকেন ছাড়িয়ে গেছে

প্রজন্মগত লাভ এবং প্রতিযোগিতামূলক সিঙ্গেল-নোড পারফরম্যান্স

প্রথমবারের মতো মডেল সক্ষমতা কভারেজ প্রসারিত করে

ROCm সফ্টওয়্যার স্কেলিং এবং হেটেরোজেনাস ইনফারেন্স সক্ষম করে

ইকোসিস্টেম বৃদ্ধি এবং পুনরুৎপাদনযোগ্যতা

র্যাক স্টোরেজ সার্ভার

12 Bays 1U Rackmount সার্ভার Lenovo ThinkSystem SR630 Rack Server

ThinkSystem SR250 V2 4SFF র্যাক স্টোরেজ সার্ভার Intel Xeon E-2378G প্রসেসর

ইন্টেল C621A র্যাক স্টোরেজ সার্ভার Inspur NF5180M6 1U র্যাক মাউন্ট সার্ভার

হুয়াওয়ে ফিউশন সার্ভার

FusionServer 5288 V6 4U Rack Server 32 DDR4 DIMMs 44 3.5 ইঞ্চি হার্ড ডিস্ক

আল্ট্রা হাই ডেনসিটি হুয়াওয়ে ফিউশন সার্ভার 1U নেটওয়ার্ক স্টোরেজ সার্ভার 1288H V5

নিউ জেন ওশানস্টর 5310 হুয়াওয়ে র্যাক সার্ভার হাইব্রিড ফ্ল্যাশ স্টোরেজ