MinIO MemKV প্রকাশ করেছে, একটি ডেডিকেটেড কনটেক্সট মেমরি স্টোর যা বড় আকারের AI ইনফারেন্স পাইপলাইনের মধ্যে একটি জটিল বাধা সমাধানের জন্য তৈরি করা হয়েছে। AIStor-এর পাশাপাশি MinIO-এর দ্বিতীয় ফ্ল্যাগশিপ সমাধান হিসাবে কাজ করে, MemKV ফার্মের ডেটা পরিকাঠামোকে মেমরি স্তরে প্রসারিত করে। ডিস্ট্রিবিউটেড GPU ক্লাস্টারে চলমান এজেন্টিক AI ওয়ার্কলোডের জন্য অবিরাম, শেয়ার করা প্রাসঙ্গিক ডেটা সরবরাহ করার জন্য এটি ইঞ্জিনিয়ারড।
MinIO AIStor
যেহেতু AI সিস্টেমগুলি একমুখী উত্তর থেকে বহু-মুখী যুক্তি এবং স্বয়ংক্রিয় কার্য সম্পাদনের দিকে অগ্রসর হচ্ছে, অনুমান চক্র জুড়ে অবিচ্ছিন্ন প্রসঙ্গ টিকিয়ে রাখা ক্রমশ অপরিহার্য হয়ে উঠেছে। বিদ্যমান আর্কিটেকচারের অধীনে, HBM এবং DRAM সহ GPU-সংলগ্ন মেমরি স্তরগুলির সীমিত ক্ষমতার কারণে প্রসঙ্গ ডেটা প্রায়শই বাতিল করা হয়। এটি GPU-গুলিকে বিদ্যমান প্রসঙ্গ বারবার পুনঃগণনা করতে বাধ্য করে, লেটেন্সি, গণনা ব্যবহার এবং পাওয়ার ড্র বাড়ায়। MinIO এই অপ্রয়োজনীয় কাজের চাপকে "পুনঃকম্পিউট ট্যাক্স" হিসাবে সংজ্ঞায়িত করে, একটি অদক্ষতা যা হাইপারস্কেল ক্লাউড পরিবেশে দ্রুতগতিতে খারাপ হয়।
MemKV একটি শেয়ার্ড, ক্রমাগত মেমরি লেয়ারের মাধ্যমে এই ব্যথা উপশম করার জন্য ইঞ্জিনিয়ার করা হয়েছে যা মাইক্রোসেকেন্ড-লেভেল অ্যাক্সেস লেটেন্সি সহ পেটাবাইট-স্কেল স্টোরেজ করতে সক্ষম। অনুমান ওয়ার্কফ্লো জুড়ে প্রাসঙ্গিক ডেটা ধরে রাখার মাধ্যমে, প্ল্যাটফর্মটি অপ্রয়োজনীয় গণনা কমিয়ে দেয় এবং সামগ্রিক অবকাঠামো দক্ষতা বাড়ায়। MinIO থেকে অভ্যন্তরীণ বেঞ্চমার্ক ডেটা প্রোডাকশন-গ্রেড কনকারেন্সির অধীনে উন্নত টাইম-টু-ফার্স্ট-টোকেন লেটেন্সি যাচাই করে। 128 GPU এবং 128K-টোকেন কনটেক্সট উইন্ডোর সাথে সজ্জিত একটি সাধারণ স্থাপনায়, GPU ব্যবহার প্রায় 50% থেকে 90%-এর উপরে বেড়েছে, যা উল্লেখযোগ্য বার্ষিক গণনা খরচ হ্রাসে অনুবাদ করেছে।
MinIO এর এক্সিকিউটিভরা বলেছেন যে পুনঃগণনা ওভারহেড ছোট আকারের স্থাপনায় অলক্ষ্য রয়ে গেছে তবুও এন্টারপ্রাইজ স্কেলে একটি মৌলিক কাঠামোগত ত্রুটিতে পরিণত হয়েছে। GPU ক্লাস্টারগুলি প্রসারিত হওয়ার সাথে সাথে, বারবার প্রসঙ্গ পুনরুত্থানের ফলে উচ্চ শক্তি খরচ এবং পরিকাঠামো ব্যয় হয়, যা টেকসই এআই অপারেশনের জন্য বিশেষ মেমরি সিস্টেমগুলিকে অপরিহার্য করে তোলে।
মেমরি-স্কেল ট্রেডঅফকে সম্বোধন করা
লিগ্যাসি এআই অবকাঠামো বিকাশকারীদের অ্যাক্সেসের গতি এবং স্টোরেজ ক্ষমতার মধ্যে আপস করতে বাধ্য করে। HBM এবং DRAM-এর মতো উচ্চ-পারফরম্যান্স মেমরি স্তরগুলি মাইক্রোসেকেন্ড লেটেন্সি সরবরাহ করে তবে কঠোর ক্ষমতা সীমা এবং উচ্চ খরচ সহ আসে। বিপরীতে, প্রচলিত স্টোরেজ সিস্টেমগুলি বিশাল মাপযোগ্যতা অফার করে কিন্তু মিলিসেকেন্ড-স্তরের লেটেন্সিতে ভোগে, যা তাদের রিয়েল-টাইম ইনফারেন্স এবং দীর্ঘ-প্রসঙ্গ যুক্তির কাজগুলির সাথে বেমানান করে তোলে।
মাইক্রোন HBM4
MemKV একটি ইন্টারমিডিয়েট শেয়ার্ড মেমরি টিয়ার প্রবর্তন করে এই শিল্পের ব্যবধান পূরণ করে যা অতি-লো লেটেন্সি এবং বড় স্টোরেজ স্কেলেবিলিটি ভারসাম্য বজায় রাখে। NVIDIA BlueField-4 STX-এর সাথে স্থানীয়ভাবে সামঞ্জস্যপূর্ণ এবং NIXL টুলগুলির সাথে NVIDIA ডায়নামোর সাথে একত্রিত, সমাধানটি সমগ্র GPU ক্লাস্টারগুলিকে অনুমান-সারিবদ্ধ ট্রান্সমিশন গতিতে ইউনিফাইড প্রাসঙ্গিক ডেটা পুল অ্যাক্সেস করতে সক্ষম করে। এই নকশাটি বিচ্ছিন্ন মেমরি এবং স্টোরেজ স্তরগুলির মধ্যে ঘন ঘন প্রসঙ্গ ডেটা স্থানান্তর দূর করে, বিলম্ব কমায় এবং সিস্টেম থ্রুপুট উন্নত করে।
NVIDIA BlueField-4
ইনফারেন্স ওয়ার্কলোডের জন্য অপ্টিমাইজ করা আর্কিটেকচার
অনুমান ডেটা পাইপলাইনগুলির জন্য একচেটিয়াভাবে তৈরি, MemKV MinIO-এর GPU মেমরি শ্রেণিবিন্যাসের কাঠামোর G3.5 স্তরে ফিট করে৷ NVMe স্টোরেজ অবকাঠামোর উপর নির্মিত, এটি মাইক্রোসেকেন্ড অ্যাক্সেস লেটেন্সি বজায় রেখে পেটাবাইট-স্তরের ক্ষমতা অর্জন করে, GPU কম্পিউট রিসোর্স থেকে সফলভাবে মেমরি স্কেলেবিলিটি ডিকপলিং করে।
সিস্টেমটি কষ্টকর ঐতিহ্যবাহী স্টোরেজ বিমূর্ততা পরিত্যাগ করে, সরাসরি এনভিএমই ড্রাইভ থেকে এআই ডেটা পাইপলাইনে এন্ড-টু-এন্ড RDMA ট্রান্সমিশনের মাধ্যমে ডেটা স্থানান্তর করে। এটি HTTP প্রোটোকল, ফাইল সিস্টেম রূপান্তর এবং মধ্যবর্তী স্টোরেজ সার্ভার দ্বারা আনা কর্মক্ষমতা ওভারহেডকে কেটে দেয়—অবজেক্ট এবং ফাইল-ভিত্তিক স্টোরেজ আর্কিটেকচারে সাধারণ বাধা।
সূত্র: গুগল
মূল আর্কিটেকচারাল অপ্টিমাইজেশানগুলির মধ্যে রয়েছে NVIDIA BlueField-4 STX-এ নেটিভ ARM64 বাইনারি এক্সিকিউশন, এক্সটার্নাল x86 স্টোরেজ নোডের উপর নির্ভরতা কমাতে সরাসরি স্টোরেজ লেয়ারের মধ্যে এমবেড করা। GPU মেমরি এবং NVMe স্টোরেজের মধ্যে সমস্ত ডেটা স্থানান্তর অপ্রয়োজনীয় প্রচলিত স্টোরেজ স্ট্যাকগুলিকে বাইপাস করে RDMA ট্রান্সমিশন গ্রহণ করে। অতিরিক্তভাবে, MemKV 2 MB থেকে 16 MB পর্যন্ত বর্ধিত ব্লকের আকার ব্যবহার করে, যেগুলি লিগ্যাসি 4 KB স্টোরেজ ব্লকের পরিবর্তে GPU থ্রুপুট বৈশিষ্ট্যের জন্য অপ্টিমাইজ করা হয়েছে। এটি এনভিআইডিআইএ স্পেকট্রাম-এক্স ইথারনেট এবং পিসিআই জেন6-এর মতো অত্যাধুনিক উচ্চ-গতির আন্তঃসংযোগ কাপড়কে সমর্থন করে, যা ক্লাস্টার জুড়ে তার-গতির ডেটা ট্রান্সমিশনকে সহজতর করে।
প্রাপ্যতা
MinIO MemKV এখন বাণিজ্যিকভাবে এন্টারপ্রাইজ স্থাপনের জন্য উপলব্ধ।
বেইজিং Qianxing Jietong প্রযুক্তি কোং, লি.
স্যান্ডি ইয়াং/গ্লোবাল স্ট্র্যাটেজি ডিরেক্টর
WhatsApp / WeChat: +86 13426366826
ইমেল: yangyd@qianxingdata.com
ওয়েবসাইট: www.qianxingdata.com/www.storagesserver.com
ব্যবসায়িক ফোকাস:
আইসিটি প্রোডাক্ট ডিস্ট্রিবিউশন/সিস্টেম ইন্টিগ্রেশন অ্যান্ড সার্ভিসেস/ইনফ্রাস্ট্রাকচার সলিউশন
20+ বছরের আইটি বিতরণের অভিজ্ঞতার সাথে, আমরা বিশ্বস্ত পণ্য এবং পেশাদার পরিষেবা প্রদানের জন্য শীর্ষস্থানীয় বিশ্ব ব্র্যান্ডগুলির সাথে অংশীদারি করি।
"একটি বুদ্ধিমান বিশ্ব গড়তে প্রযুক্তির ব্যবহার" আপনার বিশ্বস্ত আইসিটি পণ্য পরিষেবা প্রদানকারী!
স্যান্ডি ইয়াং/গ্লোবাল স্ট্র্যাটেজি ডিরেক্টর
WhatsApp / WeChat: +86 13426366826
ইমেল: yangyd@qianxingdata.com
ওয়েবসাইট: www.qianxingdata.com/www.storagesserver.com
ব্যবসায়িক ফোকাস:
আইসিটি প্রোডাক্ট ডিস্ট্রিবিউশন/সিস্টেম ইন্টিগ্রেশন অ্যান্ড সার্ভিসেস/ইনফ্রাস্ট্রাকচার সলিউশন
20+ বছরের আইটি বিতরণের অভিজ্ঞতার সাথে, আমরা বিশ্বস্ত পণ্য এবং পেশাদার পরিষেবা প্রদানের জন্য শীর্ষস্থানীয় বিশ্ব ব্র্যান্ডগুলির সাথে অংশীদারি করি।
"একটি বুদ্ধিমান বিশ্ব গড়তে প্রযুক্তির ব্যবহার" আপনার বিশ্বস্ত আইসিটি পণ্য পরিষেবা প্রদানকারী!



