Browse parent directory

2025-01-18

# एआई-सक्षम क्लाउड गेमिंग

एआई-सक्षम क्लाउड गेमिंग को लोकल (यानी अपने कंप्यूटर पर) करने की बजाय क्लाउड पर करना बहुत कठिन लगता है। फिर भी, मुझे उम्मीद है कि अगले 10 साल में यह संभव हो जाएगा।

अगर आप एक गेम डेवलपर हैं तो आप इस पर काम करना चाहेंगे।

क्यों?
- शरीर की विलंबता (लेटेंसी) की सीमाएं
  - वीडियो आउटपुट: ज्यादातर लोग 90 फ्रेम प्रति सेकंड (लगभग 10 मिलीसेकंड प्रति फ्रेम) से ऊपर वाले वीडियो में अलग-अलग फ्रेम नहीं पहचान पाते हैं।
  - ऑडियो आउटपुट: कुछ ऑडियो इंजीनियर (रेडिट पर) पाते हैं कि डिजिटल म्यूज़िक बजाने में 10 मिलीसेकंड की लेटेंसी सुनने में ध्यान देने योग्य लेकिन स्वीकार्य होती है।
  - कीबोर्ड + माउस इनपुट: इंसान की प्रतिक्रियात्मक समय (reaction time) अधिकतर 100 मिलीसेकंड से ज़्यादा मानी गई है। तंत्रिका (नर्व) सिग्नल की अधिकतम रफ़्तार लगभग 120 मी/से है, हाथ से मस्तिष्क तक 1 मीटर दूर सिग्नल जाने में 10 मिलीसेकंड से ज़्यादा लग सकते हैं। इनपुट का अनुमान और उन पर तेज़ी से रिएक्ट करने से (गेम्स में अक्सर होता है) प्रतिक्रिया समय कम किया जा सकता है।
  - एंड-टू-एंड लेटेंसी: बहुत से क्लाउड गेमर्स (रेडिट पर) ने बताया है कि 10 मिलीसेकंड से कम लेटेंसी होने पर FPS जैसे तेज़-एक्शन गेम भी ऑफ़लाइन खेलने जितने तेज़ महसूस होते हैं।

- इंटरनेट बैंडविड्थ की सीमाएं
  - लगातार 24x7 वीडियो स्ट्रीम करना टेक्स्ट/इमेज/ऑडियो से कहीं ज़्यादा बैंडविड्थ लेता है।
  - 1 जीबीपीएस फाइबर कनेक्शन (बिना अपलोड/डाउनलोड कैप) अमेरिका में ज्यादा लोकप्रिय हो रहा है, जो UHD 90 fps वीडियो स्ट्रीम करने के लिए काफ़ी है।
  - 3डी कंटेंट को सीधे स्ट्रीम करना अभी संभव नहीं है। वीआर हेडसेट वालों के मामले में शायद 3डी कंटेंट लाइव-स्ट्रीम करने की ज़रूरत पड़े, पर मैंने वीआर पर इतना अध्ययन नहीं किया है।

- कंप्यूटर हार्डवेयर लेटेंसी की सीमाएं
  - इनपुट/आउटपुट डिवाइस लेटेंसी: 1 मिलीसेकंड (1000 Hz) की लेटेंसी कीबोर्ड और माउस में पाई गई है, और गेमर्स मानते हैं कि इससे ज्यादा लेटेंसी हो तो भी शायद पता नहीं चलेगा।
  - गेम इंजन, 3डी रेंडरिंग लेटेंसी: मुझे इस बारे में ज्यादा जानकारी नहीं, पर आजकल ज्यादातर गेम 1 मिलीसेकंड से भी कम में रेंडर हो सकते हैं। यह एप्लिकेशन पर निर्भर है, कुछ 3डी ऐप्स ऐसी भी हैं जिन्हें 10 मिलीसेकंड से कम लेटेंसी में बनाना शायद संभव नहीं।
  - नेटवर्क राउंडट्रिप लेटेंसी: 10 मिलीसेकंड से कम लेटेंसी उपभोक्ता फाइबर कनेक्शन पर अमेरिका के कई शहरों में पहले ही मिल रही है, और सैद्धांतिक रूप से दुनिया भर के शहरों में भी इसे प्रदान किया जा सकता है। नीदरलैंड्स से कैलिफोर्निया (9000 किमी) तक लाइट को एक तरफ़ जाने में लगभग 33 मिलीसेकंड लगती है, व्यावहारिक रूप से राउंडट्रिप में 100 मिलीसेकंड रिपोर्ट किए जाते हैं। जब तक नज़दीकी डेटा सेंटर 1000 किमी के अंदर हो, फाइबर कनेक्शन से 10 मिलीसेकंड से कम लेटेंसी हासिल करने में कोई भौतिक बाधा नहीं।
  - एआई इनफेरेंस समय: जैकब स्टीनहार्ट के अनुसार, फॉरवर्ड पास को काफी पैरेलाइज (समानांतर) किया जा सकता है (स्रोत: https://bounded-regret.ghost.io/how-fast-can-we-perform-a-forward-pass/ )। 1 फ्रेम को <1 मिलीसेकंड में जेनरेट किया जा सकता है, बशर्ते उसका ASIC खास उसी मॉडल के लिए बना हो।
  - एआई इनफेरेंस लागत: यही सबसे बड़ा अड़ंगा है। डिफ्यूज़न मॉडल लगभग 0.1-1.0 PFLOP यूज़ कर सकते हैं (100 सैम्पलिंग स्टेप्स के लिए), एक फ्रेम के लिए। 90 फ्रेम प्रति सेकंड पर 10-100 PFLOP प्रति सेकंड की ज़रूरत पड़ेगी। 1 सेकंड आउटपुट के लिए 10-100 PFLOP/s की जीपीयू क्लस्टर क्षमता चाहिए। H200 है 4 PFLOP/s fp8, जिसका किराया $2/घंटा है। Epoch AI स्केलिंग लॉज़ के मुताबिक FLOP/s/डॉलर हर 2.5 साल में 2x होने पर, 10 साल में 16 गुना सुधार आ सकता है, जिससे 100 PFLOP/s को $2/घंटा में रेंट करना संभव हो सकता है।

## आईटी ईकोसिस्टम पर प्रभाव
- अगर यह काम क्लाउड पर मुमकिन हो जाता है, तो लगभग कोई भी काम क्लाउड पर किया जा सकेगा।
- साइबरसिक्योरिटी या यूज़र कंट्रोल ही लोकल पर काम करने के कारण बचेंगे, प्रदर्शन (परफ़ॉर्मेंस) अब वजह नहीं रहेगा। सिक्योरिटी और यूज़र कंट्रोल को बढ़ावा देने के लिए प्रोत्साहन उतना मज़बूत नहीं होगा, जितना तेज़ परफ़ॉर्मेंस के लिए होता है। बड़ी टेक कंपनियों को ओपन सोर्स सॉफ्टवेयर पर निवेश करने की ज़रूरत अब कम पड़ सकती है, जिससे ओपन सोर्स पीछे रह सकता है।
- क्लाइंट डिवाइस भी बदल सकते हैं। इस विज़न का अंतिम रूप: 99.9% लोग ऐसे मशीन का इस्तेमाल करें जिसमें टचस्क्रीन (या कीबोर्ड+मॉनिटर) और नेटवर्क कार्ड हो लेकिन सीपीयू, डिस्क या रैम न हो। तब जीने के लिए भी (“कुछ करने के लिए”) सर्वर पर जॉब सबमिट करना पड़ेगा। (शायद यह किसी बड़ी टेक कंपनी के सर्वर पर ही हो, जब तक छोटे क्लाउड कम लेटेंसी के लिए ISPs से टक्कर न ले सकें।) मोबाइल फ़ोन के उदाहरण जैसा- यह डेस्कटॉप से ज्यादा लॉक-डाउन है, फिर भी उसके यूज़र ज़्यादा हैं। आजकल फोन के बिना जीना संभव है पर नौकरियों, दोस्तियों आदि से वंचित रह सकते हैं।
- इस से NSA (या आपके देश की कोई ऐसी संस्था) के लिए 99% लोगों के विचारों पर निगरानी रख पाना तकनीकी रूप से आसान हो जाएगा। अभी उन्हें कई डिवाइस, राउटर और केबल्स में बैकडोर करना पड़ता है और काम की सूचनाएं अपने सर्वर पर भेजनी होती हैं। यह करना संभव है लेकिन डेवलपर्स का समय और मध्यस्थों (intermediaries) से तालमेल/दबाव की जरूरत पड़ती है।
- ऐसे माहौल में राजनीतिक उद्देश्यों के लिए या डेटा लीक होने के लिए इस डेटा का गलत इस्तेमाल होने की संभावना भी बढ़ जाती है।