टेक महिंद्रा, एक वैश्विक प्रौद्योगिकी परामर्श और डिजिटल समाधान प्रदान करने वाली कंपनी है, ने NVIDIA के साथ मिलकर ‘Project Indus’ के तहत एक नया हिंदी-फर्स्ट एजुकेशन Large Language Model (LLM) पेश किया है। यह मॉडल विशेष रूप से भारत की शिक्षा प्रणाली और भाषाई विविधता को ध्यान में रखकर विकसित किया गया है। कंपनी के अनुसार इसका उद्देश्य छात्रों को उनकी अपनी भाषा, खासकर हिंदी में, उच्च गुणवत्ता वाली डिजिटल शिक्षा उपलब्ध कराना है।
यह नया AI मॉडल शिक्षा क्षेत्र पर केंद्रित है और इसे इस तरह डिजाइन किया गया है कि यह छात्रों को Physics, Mathematics और अन्य मुख्य विषयों को सरल हिंदी भाषा में समझने में मदद कर सके। इसका लक्ष्य देश में “डिजिटल और भाषाई रूप से समावेशी शिक्षा” को बढ़ावा देना है, ताकि अंग्रेजी भाषा की बाधा सीखने में रुकावट न बने।
Project Indus और हिंदी-फर्स्ट AI पहल
Project Indus Tech Mahindra की एक बड़ी AI पहल है, जिसे भारतीय भाषाओं के लिए sovereign (स्थानीय रूप से विकसित) AI मॉडल बनाने के उद्देश्य से तैयार किया गया है। यह मॉडल हिंदी और उसकी कई बोलियों को सपोर्ट करता है और शिक्षा सहित विभिन्न उपयोगों के लिए तैयार किया गया है।
इस मॉडल को NVIDIA की AI तकनीक का उपयोग करके विकसित किया गया है, जिसमें NVIDIA NeMo framework और NIM microservices जैसी तकनीकें शामिल हैं। इनकी मदद से मॉडल को ट्रेनिंग, स्केलिंग और डिप्लॉयमेंट के लिए तैयार किया गया है, जिससे यह बड़े स्तर पर उपयोग किया जा सके।
डेटा चुनौती और तकनीकी सुधार
भारतीय भाषाओं के लिए डेटा की कमी को दूर करने के लिए डेवलपमेंट टीम ने NVIDIA NeMo Data Designer की मदद से बड़े पैमाने पर synthetic training data तैयार किया। रिपोर्ट्स के अनुसार, इसमें सैकड़ों मिलियन (लगभग 500 मिलियन तक) synthetic tokens बनाए गए, जिससे मॉडल की भाषा समझने की क्षमता बेहतर हुई।
यह मॉडल Agentic AI capabilities को भी सपोर्ट करता है, यानी यह ऐसे AI एजेंट बना सकता है जो छात्रों के सवालों का जवाब दे सकें और उनके साथ प्राकृतिक हिंदी में बातचीत कर सकें।
मॉडल का स्केल और विकास
Tech Mahindra ने इस मॉडल को पहले 1.2 बिलियन पैरामीटर वाले संस्करण से आगे बढ़ाकर अब लगभग 8 बिलियन पैरामीटर आर्किटेक्चर तक स्केल किया है, जिससे इसकी क्षमता और प्रदर्शन में सुधार हुआ है।
NVIDIA के अनुसार, दुनिया भर में “Sovereign AI” की मांग बढ़ रही है ऐसे AI सिस्टम जो स्थानीय भाषा और सांस्कृतिक संदर्भ के अनुसार बनाए जाते हैं। इस पहल के जरिए भारत में उसी दिशा में एक मजबूत कदम उठाया गया है।
अत: Tech Mahindra और NVIDIA का यह हिंदी-फर्स्ट एजुकेशन LLM भारत के लिए एक भाषा-केंद्रित AI शिक्षा मॉडल है, जो डिजिटल लर्निंग को आसान, सुलभ और अधिक समावेशी बनाने की दिशा में विकसित किया गया है। यह मॉडल खास तौर पर भारतीय छात्रों के लिए स्थानीय भाषा में बेहतर सीखने का अनुभव प्रदान करने पर केंद्रित है।