preloader-image-gif

عنق زجاجة خفي يهدد توسع Google TPU رغم الأداء المذهل

Google TPU

تواصل Google تعزيز وجودها في سباق الذكاء الاصطناعي عبر تحسين وحدات المعالجة Tensor Processing Units – TPUs، والتي أثبتت خلال اختبارات 2025 أنها قادرة على تقديم أداء مذهل يتجاوز توقعات الكثير من المنافسين.

ومع ذلك، ورغم القوة الحسابية الهائلة التي توفرها TPUs، تشير تقارير جديدة إلى وجود عنق زجاجة خفي قد يحد من قدرة هذه الأنظمة على التوسع الخارجي — وهو ما يمثل التحدي الأكبر أمام Google في منافسة NVIDIA على مستوى مراكز البيانات الضخمة.

أداء TPU: أرقام مذهلة تضع Google في الصدارة

وفقًا لمختبرات قياس الأداء:

  • وحدات TPU v5e وv6 تقدم قوة تدريب ونمذجة ضخمة في مهام LLM
  • استهلاك الطاقة أصبح أكثر كفاءة مقارنة بالأجيال السابقة
  • تحسينات كبيرة في سرعة الأنظمة عند العمل ضمن كتل (Pods) من آلاف الشرائح
  • أداء منافس بشدة لـ NVIDIA H100 وH200 في بعض السيناريوهات

كل هذه العوامل جعلت TPUs خيارًا جذابًا لكبرى شركات الذكاء الاصطناعي.


المشكلة الحقيقية: التوسع خارج حدود الـPod

رغم الأداء الممتاز داخل البنية المغلقة، تواجه Google تحديًا كبيرًا عند محاولة ربط عدة "Pods" ببعضها البعض.

التقرير يشير إلى أن البنية التحتية للربط الخارجي (Interconnect) تمثل عنق الزجاجة.

أبرز نقاط المشكلة:

  1. سرعة الاتصال الخارجي أقل بكثير من السرعة الداخلية
  2. عند الانتقال من آلاف الشرائح إلى عشرات الآلاف، يبدأ الأداء بالهبوط
  3. مشاكل في مزامنة البيانات بين الـPods على نطاق واسع
  4. محدودية في تمرير بيانات النماذج الضخمة عبر الشبكة الخارجية

وهذا يعني أن Google قد تتمتع بأداء مذهل داخل حدود البنية الداخلية، لكن التوسع الأفقي الضخم قد يتوقف قبل أن يبدأ تمامًا.


لماذا يعتبر هذا خطرًا على Google؟

في عصر النماذج العملاقة — مثل GPT-5 وGemini Ultra XXL — تعتمد المؤسات على:

  • توسيع مراكز البيانات
  • ربط آلاف الشرائح عبر عدة مناطق
  • نقل بيانات ضخمة بين مجموعات الحوسبة
  • تدريب نماذج تحتاج ملايين الاتصالات في الثانية

إذا لم تستطع TPUs الحفاظ على الأداء خارج الـPod، فستظل NVIDIA — التي تمتلك حلول interconnect أكثر نضجًا مثل NVLink وInfiniBand — في موقع الصدارة.


ما الذي يمكن أن يحدث لاحقًا؟

قد تتجه Google إلى:

  • إطلاق جيل جديد من interconnect بسرعة أعلى
  • تحسين برامج الـCompiler الخاصة بـTPU
  • استخدام تقنيات ضغط البيانات لتقليل حجم النقل
  • الاعتماد على حلول شبكية داخلية مخصصة لمراكز البيانات العملاقة

ومع ذلك، يتفق الخبراء على أن Google أمام معركة صعبة إذا أرادت منافسة NVIDIA على نطاق واسع “بين مراكز البيانات”.