বাড়ি মামলা

NVIDIA DGX স্পার্ক ক্লাস্টার পর্যালোচনা: Dell, GIGABYTE, এবং HP-এ বিতরণ করা অনুমান

সব পণ্য

র্যাক স্টোরেজ সার্ভার
(165)

হুয়াওয়ে ফিউশন সার্ভার
(31)

ডেল পাওয়ারডজ সার্ভার
(59)

H3C সার্ভার
(31)

ডেটাকম সুইচ
(96)

WLAN ডিভাইস
(21)

স্মার্ট ওয়্যারলেস রাউটার
(10)

হার্ড ড্রাইভ HDD
(78)

অভ্যন্তরীণ হার্ড ড্রাইভ SSD
(16)

জিফোর্স গ্রাফিক কার্ড
(27)

ইন্টেল সিপিইউ প্রসেসর
(20)

সার্ভার মেমরি RAM
(6)

সংস্কার করা স্টোরেজ সার্ভার
(6)

SFP ট্রান্সসিভার মডিউল
(4)

ফাইবার চ্যানেল সুইচ
(42)

সাক্ষ্যদান

চীন Beijing Qianxing Jietong Technology Co., Ltd. সার্টিফিকেশন

ক্রেতার পর্যালোচনা

বেইজিং Qianxing Jietong প্রযুক্তি কোং, লিমিটেডের বিক্রয় কর্মীরা খুব পেশাদার এবং ধৈর্যশীল। তারা দ্রুত কোটেশন প্রদান করতে পারেন. পণ্যের মান এবং প্যাকেজিংও খুব ভালো। আমাদের সহযোগিতা খুবই মসৃণ।

—— 《ফেস্টফিং ডিভি》LLC

যখন আমি জরুরীভাবে ইন্টেল CPU এবং Toshiba SSD খুঁজছিলাম, তখন বেইজিং Qianxing Jietong Technology Co., Ltd-এর Sandy আমাকে অনেক সাহায্য করেছিল এবং আমার প্রয়োজনীয় পণ্যগুলি দ্রুত পেয়েছিল। আমি সত্যিই তার প্রশংসা.

—— কিটি ইয়েন

Beijing Qianxing Jietong Technology Co.,Ltd-এর স্যান্ডি একজন অত্যন্ত সতর্ক সেলসম্যান, যিনি সার্ভার কেনার সময় আমাকে কনফিগারেশন ত্রুটির কথা মনে করিয়ে দিতে পারেন। প্রকৌশলীরা খুব পেশাদার এবং দ্রুত পরীক্ষার প্রক্রিয়াটি সম্পূর্ণ করতে পারে।

—— স্ট্রেলকিন মিখাইল ভ্লাদিমিরোভিচ

বেইজিং কিয়ানক্সিং জিয়েটং-এর সাথে কাজ করার অভিজ্ঞতা নিয়ে আমরা খুবই খুশি। পণ্যের গুণমান চমৎকার, এবং ডেলিভারি সবসময় সময় মতো হয়। তাদের বিক্রয় দল পেশাদার, ধৈর্যশীল এবং আমাদের সমস্ত প্রশ্নের উত্তর দিতে খুবই সহায়ক। আমরা তাদের সমর্থনকে সত্যিই মূল্যায়ন করি এবং দীর্ঘমেয়াদী অংশীদারিত্বের জন্য অপেক্ষা করছি। অত্যন্ত সুপারিশকৃত!

—— আহমাদ নাভিদ

গুণমানঃ ¢আমার সরবরাহকারীর সাথে দুর্দান্ত অভিজ্ঞতা। মাইক্রোটিক আরবি 3011 ইতিমধ্যে ব্যবহৃত হয়েছিল, তবে এটি খুব ভাল অবস্থায় ছিল এবং সবকিছু নিখুঁতভাবে কাজ করে। যোগাযোগ দ্রুত এবং মসৃণ ছিল,এবং আমার সকল উদ্বেগ দ্রুত সমাধান করা হয়খুব নির্ভরযোগ্য সরবরাহকারী ঃ অত্যন্ত সুপারিশ ঃ

—— জেরান কোলেসিও

তোমার দর্শন লগ করা অনলাইন চ্যাট এখন

NVIDIA DGX স্পার্ক ক্লাস্টার পর্যালোচনা: Dell, GIGABYTE, এবং HP-এ বিতরণ করা অনুমান

May 15, 2026

NVIDIA DGX স্পার্কের জন্য দুটি সংজ্ঞায়িত বৈশিষ্ট্য আলাদা: $4,000 ডেস্কটপ ইউনিটে 128GB ইউনিফাইড মেমরি এবং একটি বিল্ট-ইন 200Gb ডেটাসেন্টার-গ্রেড নেটওয়ার্ক। উচ্চ-গতির ফ্যাব্রিক এটিকে নিয়মিত ওয়ার্কস্টেশন থেকে আলাদা করে, মাল্টি-নোড ক্লাস্টারিং সক্ষম করে যা একবার র্যাক-মাউন্ট করা সার্ভারের জন্য একচেটিয়া। এই পর্যালোচনা বেঞ্চমার্কগুলি বিভিন্ন মডেল এবং কাজের চাপ জুড়ে দুই-নোড 200GbE ক্লাস্টারে Dell, GIGABYTE, এবং HP Spark ভেরিয়েন্ট জুড়ে অনুমান বিতরণ করেছে। এটি পাইপলাইন সমান্তরালতা (PP) বিশ্লেষণ করে, একটি বিকল্প বিভাজন পদ্ধতি যা NVIDIA-এর ডিফল্ট টেনসর সমান্তরালতা (TP) কে ছাড়িয়ে যায়।

200Gb নেটওয়ার্ক ফ্যাব্রিক

প্রতিটি স্পার্ক একটি সমন্বিত ConnectX-7 SmartNIC এর সাথে যুক্ত দুটি QSFP56 খাঁচা সজ্জিত করে। PCIe Gen5 x4 ব্যান্ডউইথ দ্বারা সীমিত, 200Gb-এ ব্যবহারযোগ্য নেটওয়ার্ক স্পিড ক্যাপ, সম্পূর্ণ ব্যান্ডউইথের জন্য যথেষ্ট একটি পোর্ট সহ; দ্বিতীয় পোর্ট টপোলজি নমনীয়তা প্রদান করে। তিনটি সাধারণ কনফিগারেশন উপলব্ধ: সরাসরি স্পার্ক-টু-স্পার্ক 200Gb লিঙ্ক, দ্বৈত 100Gb পোর্টের মাধ্যমে সুইচ-ফ্রি রিং টপোলজি এবং NVMe-oF হাই-স্পিড স্টোরেজ অ্যাক্সেস সহ হাইব্রিড ক্লাস্টারিং। NVIDIA একক-ইউনিট ডেস্কটপ, বৈধ দুই-নোড ক্লাস্টার এবং নতুন প্রকাশিত চার-নোড সেটআপ বিক্রি করে। দ্বৈত-স্পার্ক কনফিগারেশন উৎপাদন-শৈলী অনুমান এবং এই পরীক্ষার ফোকাসের জন্য সবচেয়ে ব্যবহারিক।

স্পার্ক ক্লাস্টারিং জন্য যুক্তি

প্রাথমিক সুবিধা হল মডেলের ক্ষমতা প্রসারিত করা: দুটি লিঙ্কযুক্ত স্পার্ক 120B-প্যারামিটার মডেল চালাতে পারে যা একক-ইউনিট মেমরি সীমা অতিক্রম করে। আরও গুরুত্বপূর্ণ, প্ল্যাটফর্মটি একটি সাশ্রয়ী মূল্যের শিক্ষামূলক সরঞ্জাম হিসাবে কাজ করে। NVIDIA নতুনদের জন্য AI ওয়ার্কফ্লো শেখার জন্য স্পার্ক ডিজাইন করে, যেখানে অফিসিয়াল গাইড মডেল স্থাপন, ফাইন-টিউনিং এবং PyTorch/JAX ডেভেলপমেন্ট কভার করে। ডুয়াল-নোড ক্লাস্টারগুলি ব্যয়বহুল ডেটাসেন্টার হার্ডওয়্যার ছাড়াই মাল্টি-নোড সমান্তরালতা এবং নেটওয়ার্ক বটলনেক বিশ্লেষণ শেখায়। উল্লেখযোগ্যভাবে, স্পার্ক উৎপাদন অনুমানের জন্য অপ্টিমাইজ করা হয় না। মেমরি ব্যান্ডউইথ এবং ইন্টার-নোড লেটেন্সি দ্বারা সীমাবদ্ধ, এর 200GbE লিঙ্কটি অভ্যন্তরীণ PCIe সংযোগের চেয়ে ধীর। বৃহত্তর ক্লাস্টারগুলি কম টোকেন থ্রুপুট সহ, ব্যবসায়িক পরিবেশনের পরিবর্তে শিক্ষাগত ব্যবহারে সীমাবদ্ধ করে মারাত্মক কর্মক্ষমতা হ্রাস পায়।

কর্মক্ষমতা পরীক্ষা: পিপি বনাম টিপি

সমান্তরাল কৌশল নির্বাচন

NVIDIA ডিফল্ট TP-তে, যা প্রতিটি ট্রান্সফরমার স্তরকে দুটি GPU জুড়ে বিভক্ত করে যাতে ঘন ঘন সমস্ত-কমানো ডেটা এক্সচেঞ্জ হয়। বিপরীতে, PP মডেলগুলিকে স্তর দ্বারা বিভক্ত করে, নোডগুলির মধ্যে শুধুমাত্র একবার সক্রিয়করণ স্থানান্তর করে। 200GbE লিঙ্কগুলিতে, PP ক্রস-নোড যোগাযোগ কমিয়ে দেয়। উচ্চ ব্যাচ আকারে বড় মডেলের জন্য, PP ব্যাপকভাবে TP-কে ছাড়িয়ে যায়; TP শুধুমাত্র একক-অনুরোধের লো-লেটেন্সি চ্যাট পরিস্থিতিতে উৎকৃষ্ট।

GPT-OSS-120B-এর পরীক্ষা এই ব্যবধান নিশ্চিত করে। ব্যাচ সাইজ 128-এ, PP ভারসাম্যপূর্ণ কাজের চাপে 554.69 টোক/সেকেন্ড (TP-এর চেয়ে 2.20× দ্রুত) হিট করে, প্রিফিল-ভারী কাজগুলিতে 310.63 টোক/সে বনাম 164.99 টোক/সেকেন্ড। TP শুধুমাত্র ব্যাচ সাইজ 1 এ এগিয়ে যায়। Llama-3.1-8B-এর মত ছোট মডেলের জন্য, TP লাইটওয়েট লেয়ার কম্পিউটেশনের কারণে বেশিরভাগ ব্যাচের মাপকে প্রাধান্য দেয়, যেখানে পিপি কেবলমাত্র উচ্চ সঙ্গতিতে TP-কে ছাড়িয়ে যায়।

মাল্টি-মডেল বেঞ্চমার্ক ফলাফল (PP=2)

GPT-OSS সিরিজ

GPT-OSS-120B-এর জন্য, HP ভারসাম্যপূর্ণ (504.88 টোক/সেকেন্ড) এবং প্রিফিল-হেভি (441.63 টোক/সে) কাজের চাপে শীর্ষে রয়েছে; GIGABYTE নেতৃত্বাধীন ডিকোড-ভারী পরীক্ষা (494.37 tok/s)। GPT-OSS-20B-এর জন্য, ডেল ভারসাম্যপূর্ণ (976.77 টোক/সে) এবং প্রিফিল-হেভি (852.39 টোক/সে) দৃশ্যকল্পে আধিপত্য বিস্তার করে, যখন GIGABYTE ডিকোড কাজগুলি (945.55 টোক/সে) নেতৃত্বে।

Llama 3.1 8B ভেরিয়েন্ট

BF16 নির্ভুলতায়, ডেল ভারসাম্যপূর্ণ (689.53 টোক/সে) এবং ডিকোড-ভারী (581.43 টোক/সে) কাজের চাপের নেতৃত্ব দেয়; GIGABYTE প্রিফিল-ভারী পরীক্ষা জিতেছে (539.27 tok/s)। FP4 অপ্টিমাইজেশান থ্রুপুটকে তীক্ষ্ণভাবে বুস্ট করেছে: GIGABYTE ভারসাম্যপূর্ণ (1458.86 tok/s) এবং প্রিফিল-হেভি (954.23 tok/s) টাস্ক। FP8-এর জন্য, ডেল সুষম (1105.42 টোক/সে) এবং ডিকোড-হেভি (862.33 টোক/সে) পরিস্থিতিতে সংকীর্ণ লিড বজায় রেখেছে।

মিস্ট্রাল এবং কুয়েন মডেল

Mistral Small 3.1 24B ন্যূনতম ফাঁক দেখেছে: ভারসাম্যপূর্ণ কাজের চাপে GIGABYTE 255.09 টোক/সেকেন্ডে পৌঁছেছে। Qwen3 কোডার 30B (A3B বেস) এর জন্য, GIGABYTE নেতৃত্বাধীন প্রিফিল-ভারী কাজ (1862.40 tok/s); ডেল ডিকোড পরিস্থিতিতে পারদর্শী। FB8 কোয়ান্টাইজেশনের অধীনে, GIGABYTE প্রিফিল-হেভি থ্রুপুট (3088.62 টোক/সেকেন্ড) শীর্ষে রয়েছে, যখন ডেল ডিকোড টাস্কের নেতৃত্ব দিয়েছে (705.77 টোক/সে)।

ডুয়াল স্পার্ক সিস্টেমের পিক আউটপুট সারাংশ

মডেল	দৃশ্যকল্প (BS – 64)	ডেল পিক আউটপুট	গিগাবাইট পিক আউটপুট	এইচপি পিক আউটপুট
GPT-OSS-120B	সমান আইএসএল/ওএসএল	463.97 টোক/সে	497.26 টোক/সে	504.88 টোক/সে
GPT-OSS-120B	প্রিফিল ভারী	419.56 টোক/সে	417.34 টোক/সে	441.63 টোক/সে
GPT-OSS-120B	ডিকোড ভারী	451.18 টোক/সে	494.37 টোক/সে	474.85 টোক/সে
GPT-OSS-20B	সমান আইএসএল/ওএসএল	976.77 টোক/সে	952.31 টোক/সে	915.72 টোক/সে
GPT-OSS-20B	প্রিফিল ভারী	852.39 টোক/সে	802.37 টোক/সে	757.05 টোক/সে
GPT-OSS-20B	ডিকোড ভারী	938.65 টোক/সে	945.55 টোক/সে	865.78 টোক/সে
লামা-৩.১-৮বি-নির্দেশ	সমান আইএসএল/ওএসএল	689.53 টোক/সে	687.48 টোক/সে	618.87 টোক/সে
লামা-৩.১-৮বি-নির্দেশ	প্রিফিল ভারী	515.45 টোক/সে	539.27 টোক/সে	463.39 টোক/সে
লামা-৩.১-৮বি-নির্দেশ	ডিকোড ভারী	581.43 টোক/সে	576.91 টোক/সে	531.07 টোক/সে
লামা-3.1-8B-FP4	সমান আইএসএল/ওএসএল	1427.39 টোক/সে	1458.86 টোক/সে	1413.51 টোক/সে
লামা-3.1-8B-FP4	প্রিফিল ভারী	884.22 টোক/সে	954.23 টোক/সে	843.57 টোক/সে
লামা-3.1-8B-FP4	ডিকোড ভারী	1008.98 টোক/সে	1007.23 টোক/সে	943.73 টোক/সে
লামা-3.1-8B-FP8	সমান আইএসএল/ওএসএল	1105.42 টোক/সে	1089.85 টোক/সে	1076.68 টোক/সে
লামা-3.1-8B-FP8	প্রিফিল ভারী	759.50 টোক/সে	827.40 টোক/সে	725.51 টোক/সে
লামা-3.1-8B-FP8	ডিকোড ভারী	862.33 টোক/সে	855.81 টোক/সে	800.78 টোক/সেকেন্ড
Mistral-ছোট-3.1-24B	সমান আইএসএল/ওএসএল	249.77 টোক/সে	255.09 টোক/সে	239.09 টোক/সে
Mistral-ছোট-3.1-24B	প্রিফিল ভারী	216.01 টোক/সে	214.38 টোক/সে	197.92 টোক/সে
Mistral-ছোট-3.1-24B	ডিকোড ভারী	238.44 টোক/সে	237.97 টোক/সে	221.41 টোক/সে

উপসংহার

ডেল, গিগাবাইট এবং এইচপি স্পার্ক ইউনিটগুলি সামান্য ব্যাচ-নির্দিষ্ট লিড সহ নগণ্য কর্মক্ষমতা ব্যবধান সরবরাহ করে। ক্রয়ের সিদ্ধান্তে তুচ্ছ বেঞ্চমার্ক পার্থক্যের চেয়ে চ্যাসি ডিজাইন, তাপীয় কার্যক্ষমতা, ওয়ারেন্টি এবং বিক্রয়োত্তর সমর্থনকে অগ্রাধিকার দেওয়া উচিত। সমান্তরালতা কৌশলটি OEM বৈচিত্রের তুলনায় অনেক বেশি প্রভাব ফেলে: PP ব্যাচড অনুমানের জন্য TP-কে ছাড়িয়ে যায়, যখন TP একক-স্ট্রিম লো-লেটেন্সি ইন্টারঅ্যাকশনের জন্য উপযুক্ত। NVIDIA-এর TP সুপারিশ উত্পাদন পরিকাঠামোর পরিবর্তে একটি ইন্টারেক্টিভ লার্নিং ডিভাইস হিসাবে স্পার্কের অবস্থানের সাথে সারিবদ্ধ। একটি ডুয়াল-নোড স্পার্ক ক্লাস্টার বিতরণ করা AI-এর জন্য একটি সাশ্রয়ী মূল্যের শিক্ষার প্ল্যাটফর্ম হিসাবে কাজ করে। ভবিষ্যতের পরীক্ষাগুলি বৃহত্তর ক্লাস্টার এবং এন্ড-টু-এন্ড ছোট-মডেল প্রশিক্ষণ, মুলতুবি ল্যাব 800Gb সুইচ স্থাপনাকে কভার করবে।

বেইজিং Qianxing Jietong প্রযুক্তি কোং, লি.
স্যান্ডি ইয়াং/গ্লোবাল স্ট্র্যাটেজি ডিরেক্টর
WhatsApp / WeChat: +86 13426366826
ইমেল: yangyd@qianxingdata.com
ওয়েবসাইট: www.qianxingdata.com/www.storagesserver.com
ব্যবসায়িক ফোকাস:
আইসিটি প্রোডাক্ট ডিস্ট্রিবিউশন/সিস্টেম ইন্টিগ্রেশন অ্যান্ড সার্ভিসেস/ইনফ্রাস্ট্রাকচার সলিউশন
20+ বছরের আইটি বিতরণের অভিজ্ঞতার সাথে, আমরা বিশ্বস্ত পণ্য এবং পেশাদার পরিষেবা প্রদানের জন্য শীর্ষস্থানীয় বিশ্ব ব্র্যান্ডগুলির সাথে অংশীদারি করি।
"একটি বুদ্ধিমান বিশ্ব গড়তে প্রযুক্তির ব্যবহার" আপনার বিশ্বস্ত আইসিটি পণ্য পরিষেবা প্রদানকারী!

PREV: ORICO X50 পর্যালোচনাঃ একটি পোর্টেবল এসএসডি কেস মধ্যে থান্ডারবোল্ট 5 গতি

NEXT: Seagate IronWolf Pro 32TB পর্যালোচনা: মাল্টি-বে NAS-এর জন্য টপ-অফ-স্ট্যাক ক্ষমতা

যোগাযোগের ঠিকানা

Beijing Qianxing Jietong Technology Co., Ltd.

ব্যক্তি যোগাযোগ: Ms. Sandy Yang

টেল: 13426366826

NVIDIA DGX স্পার্ক ক্লাস্টার পর্যালোচনা: Dell, GIGABYTE, এবং HP-এ বিতরণ করা অনুমান

র্যাক স্টোরেজ সার্ভার

হুয়াওয়ে ফিউশন সার্ভার

ডেল পাওয়ারডজ সার্ভার

H3C সার্ভার

ডেটাকম সুইচ

WLAN ডিভাইস

স্মার্ট ওয়্যারলেস রাউটার

হার্ড ড্রাইভ HDD

অভ্যন্তরীণ হার্ড ড্রাইভ SSD

জিফোর্স গ্রাফিক কার্ড

ইন্টেল সিপিইউ প্রসেসর

সার্ভার মেমরি RAM

সংস্কার করা স্টোরেজ সার্ভার

SFP ট্রান্সসিভার মডিউল

ফাইবার চ্যানেল সুইচ

NVIDIA DGX স্পার্ক ক্লাস্টার পর্যালোচনা: Dell, GIGABYTE, এবং HP-এ বিতরণ করা অনুমান

200Gb নেটওয়ার্ক ফ্যাব্রিক

স্পার্ক ক্লাস্টারিং জন্য যুক্তি

কর্মক্ষমতা পরীক্ষা: পিপি বনাম টিপি

সমান্তরাল কৌশল নির্বাচন

মাল্টি-মডেল বেঞ্চমার্ক ফলাফল (PP=2)

GPT-OSS সিরিজ

Llama 3.1 8B ভেরিয়েন্ট

মিস্ট্রাল এবং কুয়েন মডেল

ডুয়াল স্পার্ক সিস্টেমের পিক আউটপুট সারাংশ

উপসংহার

র্যাক স্টোরেজ সার্ভার

12 Bays 1U Rackmount সার্ভার Lenovo ThinkSystem SR630 Rack Server

ThinkSystem SR250 V2 4SFF র্যাক স্টোরেজ সার্ভার Intel Xeon E-2378G প্রসেসর

ইন্টেল C621A র্যাক স্টোরেজ সার্ভার Inspur NF5180M6 1U র্যাক মাউন্ট সার্ভার

হুয়াওয়ে ফিউশন সার্ভার

FusionServer 5288 V6 4U Rack Server 32 DDR4 DIMMs 44 3.5 ইঞ্চি হার্ড ডিস্ক

আল্ট্রা হাই ডেনসিটি হুয়াওয়ে ফিউশন সার্ভার 1U নেটওয়ার্ক স্টোরেজ সার্ভার 1288H V5

নিউ জেন ওশানস্টর 5310 হুয়াওয়ে র্যাক সার্ভার হাইব্রিড ফ্ল্যাশ স্টোরেজ