एआई ट्यूटर पर जेएमयू शोध: 82% सटीकता, लेकिन अभी नहीं कर सकते स्वतंत्र मार्गदर्शन
जूलियस-मैक्सिमिलियंस-यूनिवर्सिटी वुर्ज़बर्ग के शोध में पाया गया कि बड़े भाषा मॉडल थर्मोडायनामिक्स की शिक्षा में सहायक तो हैं, लेकिन अभी भी असUPERVISED ट्यूटर बनने के स्तर तक विश्वसनीय नहीं हुए हैं।

आर्टिफिशियल इंटेलिजेंस आज कई लोगों के जीवन का हिस्सा बन चुकी है। चैटजीपीटी, जेमिनी और कोपायलट जैसे बड़े भाषा मॉडल अब पत्र लिखने, टर्म पेपर तैयार करने, यात्रा सलाह देने और सामान्य प्रश्नों का उत्तर देने में व्यापक रूप से उपयोग किए जा रहे हैं। विश्वविद्यालयों में भी एआई का उपयोग लंबे समय से हो रहा है। इसी कड़ी में जूलियस-मैक्सिमिलियंस-यूनिवर्सिटी वुर्ज़बर्ग (JMU) के शोधकर्ताओं ने यह जांचने का प्रयास किया कि प्राकृतिक विज्ञानों में छात्र बड़े भाषा मॉडलों से कितनी सहायता ले सकते हैं और क्या वे बिना निगरानी के ट्यूटर की भूमिका निभा सकते हैं।
भौतिक रसायन विभाग की एक टीम ने इस उद्देश्य से एक मूल्यांकन उपकरण विकसित किया है, जिसे यूटीक्यूए (Undergraduate Thermodynamics Question Answering) कहा जाता है। यह उपकरण थर्मोडायनामिक्स की समझ की जांच करता है और यह परखता है कि भाषा मॉडल केवल तथ्यों तक सीमित हैं या वास्तव में जटिल अवधारणाओं को जोड़ने में भी सक्षम हैं। यह उपकरण शिक्षकों और शोधकर्ताओं के लिए मुफ्त में उपलब्ध है और भाषा मॉडलों की क्षमताओं का निष्पक्ष और विषय-विशिष्ट मूल्यांकन करने में मदद करता है।
प्रोफेसर टोबियास हर्टेल के अनुसार, उनका सपना है कि एक दिन एआई ऐसे चैटबॉट्स के रूप में विकसित हो सके जो छात्रों की व्यक्तिगत जरूरतों के हिसाब से उन्हें पढ़ाई में बिना निगरानी के सहायता प्रदान करें। हालांकि अभी यह संभव नहीं है, लेकिन पिछले कुछ वर्षों में उल्लेखनीय प्रगति हुई है।
हर्टेल की टीम ने 2023 के शीतकालीन सत्र से ही 150 से अधिक छात्रों के साथ थर्मोडायनामिक्स व्याख्यानों में भाषा मॉडलों का उपयोग शुरू किया था। चैटजीपीटी-3.5 और चैटजीपीटी-4 जैसे मॉडलों ने कई मामलों में अच्छा प्रदर्शन किया, लेकिन कुछ महत्वपूर्ण क्षेत्रों में कमजोरियां भी सामने आईं। इसी कारण यूटीक्यूए का निर्माण किया गया, जिसमें 50 चुनौतीपूर्ण प्रश्न शामिल हैं। इनमें से दो तिहाई प्रश्न पाठ-आधारित हैं और एक तिहाई में आरेख और रेखाचित्र दिए गए हैं, जैसा कि शिक्षण में आम तौर पर किया जाता है। इसका उद्देश्य केवल तथ्यों की जांच नहीं बल्कि विभिन्न परिस्थितियों को जोड़कर समझ विकसित करने की क्षमता को परखना भी था।
शोध में सामने आया कि 2025 के सर्वश्रेष्ठ प्रदर्शन करने वाले मॉडल भी 95 प्रतिशत सफलता दर हासिल नहीं कर पाए, जो बिना निगरानी वाले एआई ट्यूटर के लिए आवश्यक है। सबसे बेहतर जीपीटी-o3 मॉडल ने 82 प्रतिशत सटीकता हासिल की। इसमें खास तौर पर दो कमजोरियां सामने आईं। पहली, मॉडल अपरिवर्तनीय प्रक्रियाओं को समझने में लगातार कठिनाई महसूस करते हैं, जहां स्थिति परिवर्तन की गति परिणाम को प्रभावित करती है। दूसरी, वे आरेखों और चित्रों की व्याख्या में भी कमजोर साबित हुए।
यह परिणाम चौंकाने वाला नहीं है। फ्रांसीसी भौतिक विज्ञानी पियरे ड्यूहम ने लगभग सौ साल पहले ही कहा था कि रिवर्सिबिलिटी थर्मोडायनामिक्स का सबसे कठिन पहलू है। वहीं, चित्रों की व्याख्या मनुष्यों की खास संज्ञानात्मक क्षमता रही है, इसलिए एआई की सीमाएं यहां स्पष्ट रूप से सामने आईं।
हर्टेल का मानना है कि व्यवहार में एआई शिक्षण में सहायक साबित हो सकता है, लेकिन अभी इसे पूरी तरह स्वतंत्र ट्यूटर के रूप में उपयोग नहीं किया जा सकता। फिर भी पिछले दो वर्षों में हुई प्रगति यह उम्मीद जगाती है कि यदि विकास की गति इसी तरह जारी रही तो जल्द ही शिक्षा क्षेत्र में एआई एक विश्वसनीय सहायक बन जाएगा। इस परियोजना में दो प्रशिक्षु छात्र-शिक्षकों ने भी महत्वपूर्ण भूमिका निभाई, जिन्होंने कार्यों का जर्मन और अंग्रेज़ी संस्करण तैयार करने और उनका विस्तार करने में योगदान दिया।
हर्टेल के अनुसार थर्मोडायनामिक्स इस परीक्षण के लिए आदर्श विषय है क्योंकि इसमें प्रकृति की मूलभूत समझ, संक्षिप्त नियम और जटिल प्रक्रियाओं की पहचान शामिल है। यह क्षेत्र केवल याद रखने की बजाय गहन तर्कशक्ति की मांग करता है। अगला कदम वास्तविक गैसों, मिश्रणों, फेज़ डायग्राम और मानक चक्रों जैसे विषयों को उपकरण में शामिल करना है ताकि और व्यापक मूल्यांकन संभव हो सके।
हर्टेल का कहना है कि जैसे-जैसे मॉडल टेक्स्ट और चित्रों के संयोजन और अपरिवर्तनीय प्रक्रियाओं को समझने में सक्षम होंगे, वैसे-वैसे वे विश्वसनीय और विषय-संवेदनशील एआई ट्यूटर बनने के और करीब पहुंचेंगे।