Characteristics Of Good Tool Of Evaluation In Hindi

KVS सिलेबस के अंदर एक टॉपिक है जिसका नाम है | Understanding Teaching Learning | Characteristics Of Good Tool Of Evaluation In Hindi PDF Notes Download, यह उसी का एक point है | हम आज के इन नोट्स में इसे कवर करेंगे और हमारा अगला टॉपिक Assessment for/of/as Learning होगा | हम आपको संपूर्ण नोट्स देंगे जिन्हें पढ़कर आप अपना कोई भी Teaching Exam पास कर सकते हैं तो चलिए शुरू करते हैं बिना किसी देरी के |

Table of Contents

Note:-

Understanding the Learner के संपूर्ण नोट्स हम कवर कर चुके हैं | वेबसाइट के होमपेज पर जाकर चेक कर लीजिये |
आप अपनी पढ़ाई पर ध्यान दो और बाकी का काम हम पर छोड़ दो |

Characteristics of Good Tool of Evaluation

(मूल्यांकन के अच्छे उपकरण के लक्षण)

Validity (वैधता)
Reliability (विश्वसनीयता)
Objectivity (निष्पक्षतावाद)
Discriminating Power (विभेदकारी शक्ति)
Comparability (तुलनीयता)
Practicability Utility (व्यावहारिकता उपयोगिता)
Norms (मानदंड)
Comprehensiveness (व्यापकता)

संक्षेप में (In short)

Validity (वैधता): मापने के लिए एक उपकरण की क्षमता जिसे मापने का इरादा है। उदाहरण के लिए, किसी छात्र की बीजगणित की समझ को मापने के लिए डिज़ाइन की गई गणित की परीक्षा में ज्यामिति के प्रश्न शामिल नहीं होने चाहिए।
Reliability (विश्वसनीयता): एक उपकरण का उपयोग करने से प्राप्त परिणामों की निरंतरता। उदाहरण के लिए, यदि कोई छात्र किसी परीक्षा में एक दिन 80 और उसी परीक्षा में अगले दिन 85 अंक प्राप्त करता है, तो परीक्षण को विश्वसनीय माना जाता है।
Objectivity (निष्पक्षतावाद): निष्पक्ष परिणाम उत्पन्न करने के लिए एक उपकरण की क्षमता। उदाहरण के लिए, किसी छात्र के निबंध की ग्रेडिंग करने वाले शिक्षक को उनके व्यक्तिगत विचारों या पूर्वाग्रहों से प्रभावित नहीं होना चाहिए।
Discriminating Power (विभेदकारी शक्ति): प्रदर्शन के विभिन्न स्तरों वाले व्यक्तियों या समूहों के बीच अंतर करने के लिए एक उपकरण की क्षमता। उदाहरण के लिए, बीजगणित की एक छात्र की समझ को मापने के लिए डिज़ाइन किया गया एक परीक्षण उन छात्रों के बीच अंतर करने में सक्षम होना चाहिए जो विषय की अच्छी समझ रखते हैं और जो नहीं करते हैं।
Comparability (तुलनीयता): एक उपकरण की क्षमता परिणाम उत्पन्न करने के लिए जिसकी तुलना अन्य उपकरणों या विधियों से प्राप्त परिणामों से की जा सकती है। उदाहरण के लिए, एक गणित परीक्षा के परिणाम ऐसे होने चाहिए जिनकी तुलना किसी भिन्न गणित की परीक्षा से प्राप्त परिणामों से की जा सके।
Practicability Utility (व्यावहारिकता उपयोगिता): लागत, समय और संसाधनों के संदर्भ में एक उपकरण की उपयोगिता और व्यवहार्यता। उदाहरण के लिए, एक गणित की परीक्षा जिसे पूरा करने में 8 घंटे लगते हैं और महंगी सामग्री की आवश्यकता होती है, उसे व्यावहारिक नहीं माना जाएगा।
Norms (मानदंड): वे मानक या मापदंड जिनके विरुद्ध किसी उपकरण के परिणामों की तुलना की जाती है। उदाहरण के लिए, समान ग्रेड स्तर में अन्य छात्रों के प्रदर्शन के खिलाफ गणित की परीक्षा को आदर्श बनाया जा सकता है।
Comprehensiveness (व्यापकता): किसी विषय या विषय के सभी पहलुओं को कवर करने के लिए एक उपकरण की क्षमता। उदाहरण के लिए, एक गणित परीक्षण जिसमें केवल बीजगणित शामिल है और ज्यामिति नहीं, उसे व्यापक नहीं माना जाएगा।

वैधता

(Validity)

वैधता एक मापने वाले उपकरण की वास्तव में मापने की क्षमता है जिसे वह मापने का दावा करता है।
वैधता की अवधारणा को प्रश्न पूछकर भी समझा जा सकता है, ‘क्या हम वह माप रहे हैं या मापने में सक्षम हैं जिसे हम मूल रूप से मापना चाहते थे?’।
आम तौर पर, वैधता को विश्वसनीयता से कहीं अधिक महत्वपूर्ण माना जाता है।
वैधता के बिना अनुसंधान गलत दिशा में जाता है।

उदाहरण: प्राथमिक विद्यालय के बच्चों की बुद्धि को मापने के लिए एक अध्ययन किया जाता है, शोधकर्ता एक शब्दावली परीक्षण का उपयोग बुद्धि के माप के रूप में करते हैं। हालाँकि, यह बाद में पता चला कि शब्दावली परीक्षण बुद्धि का एक वैध उपाय नहीं है और यह बच्चों की बौद्धिक क्षमताओं का एक खराब संकेतक है। प्राथमिक विद्यालय के बच्चों की बुद्धि के बारे में अध्ययन के निष्कर्ष अमान्य हैं और शोध गलत दिशा में जाता है।

वैधता के प्रकारों का सबसे महत्वपूर्ण वर्गीकरण वह है जो अमेरिकन साइकोलॉजिकल एसोसिएशन, (American Psychological Association) अमेरिकन एजुकेशनल रिसर्च एसोसिएशन (American Educational Research Association) और नेशनल काउंसिल ऑन मापन (National Council on measurements) की एक संयुक्त समिति द्वारा शिक्षा में उपयोग किए जाने के लिए तैयार किया गया है।

वैधता तीन प्रकार की होती है:

सामग्री वैधता (Content validity)
मानदंड वैधता (भविष्य कहनेवाला वैधता और समवर्ती वैधता) (Criterion validity (Predictive validity and Concurrent validity))
निर्माण की वैधता (Construct validity)

Characteristics-Of-Good-Tool-Of-Evaluation-In-Hindi

सामग्री वैधता

(Content Validity)

मैक बर्नी एंड व्हाइट (Mc Burney and White) (2007) के अनुसार; सामग्री वैधता यह धारणा है कि एक परीक्षण को व्यवहार की सीमा का नमूना लेना चाहिए जिसे सैद्धांतिक अवधारणा द्वारा मापा जा रहा है।
यह एक गैर-सांख्यिकीय प्रकार की वैधता है | यह सुनिश्चित करने के लिए परीक्षण की सामग्री के मूल्यांकन में शामिल होना कि क्या इसमें उस व्यवहार का नमूना प्रतिनिधि शामिल है जिसे मापने का इरादा है।
जब एक परीक्षण में सामग्री वैधता होती है, तो परीक्षण पर आइटम उन संभावित वस्तुओं की पूरी श्रृंखला का प्रतिनिधित्व करते हैं जिन्हें परीक्षण में शामिल किया जाना चाहिए।
उदाहरण के लिए, यदि शोधकर्ता तीसरी कक्षा के बच्चों के लिए वर्तनी की उपलब्धि परीक्षण विकसित करना चाहता है, तो एक शोधकर्ता लगभग सभी संभावित शब्दों की पहचान कर सकता है जो तीसरी कक्षा के बच्चों को पता होने चाहिए।

उदाहरण: एक शोधकर्ता हाई स्कूल के छात्रों के लिए अमेरिकी इतिहास के ज्ञान को मापने के लिए एक परीक्षण विकसित करना चाहता है। सामग्री की वैधता स्थापित करने के लिए, शोधकर्ता पहले उन प्रमुख अवधारणाओं और घटनाओं की पहचान करेगा जो आमतौर पर हाई स्कूल अमेरिकी इतिहास के पाठ्यक्रमों में पढ़ाए जाते हैं। इसके बाद, शोधकर्ता उन परीक्षण मदों का निर्माण करेगा जो इन अवधारणाओं और घटनाओं के प्रतिनिधि नमूने को कवर करते हैं। इसमें जॉर्ज वाशिंगटन और अब्राहम लिंकन जैसे प्रमुख आंकड़ों के साथ-साथ अमेरिकी क्रांति और गृह युद्ध जैसी महत्वपूर्ण घटनाओं पर आइटम शामिल हो सकते हैं। यदि परीक्षण में इन अवधारणाओं और घटनाओं का एक प्रतिनिधि नमूना शामिल है, तो इसे विषयवस्तु वैधता वाला माना जा सकता है।

मानदंड से संबंधित वैधता

(Criterion-related Validity)

मानदंड से संबंधित वैधता को उस डिग्री के रूप में परिभाषित किया गया है जिस पर ब्याज का माप स्थापित वैधता के माप से संबंधित है।

सबसे बड़ी चुनौती हमें पहले तुलना करने के लिए एक मानक संदर्भ की आवश्यकता है।

यह प्रश्न का उत्तर देता है: “क्या यह परीक्षण क्षमताओं के एक निश्चित समूह को दर्शाता है?”
कसौटी से संबंधित वैधता का आकलन करने के सबसे सरल तरीकों में से एक इसकी तुलना एक ज्ञात मानक से करना है।
उदाहरण के लिए, एक मानक IQ परीक्षण के विरुद्ध एक नए बुद्धि परीक्षण का सांख्यिकीय विश्लेषण किया जा सकता है (व्यक्ति की बुद्धिमत्ता का पता लगाने की क्षमता के कारण यह एक बेहतर IQ परीक्षण है)
यदि नया बुद्धि परीक्षण मानक IQ परीक्षण के समान परिणाम उत्पन्न करता है, तो उच्च मानदंड वैधता है।
यह नैदानिक भविष्यवाणी नियमों और स्व-रिपोर्ट परिणाम उपकरणों पर लागू होता है।
समय सीमा के आधार पर दो अलग-अलग प्रकार की कसौटी वैधता है।

उदाहरण: एक शोधकर्ता टाइपिंग गति को मापने के लिए एक नया परीक्षण विकसित करना चाहता है। कसौटी से संबंधित वैधता स्थापित करने के लिए, शोधकर्ता पहले एक ज्ञात मानक की पहचान करेगा, जैसे कि कार्यालय के कर्मचारियों के नमूने के लिए औसत टाइपिंग गति। इसके बाद, शोधकर्ता कार्यालय के कर्मचारियों के एक नमूने के लिए नए परीक्षण का संचालन करेगा और परिणामों की तुलना ज्ञात मानक से करेगा। यदि नए परीक्षण के परिणाम ज्ञात मानक के साथ अत्यधिक सहसंबद्ध हैं, तो परीक्षण को उच्च मानदंड-संबंधी वैधता वाला माना जा सकता है।

एक और उदाहरण: रोगियों में हृदय रोग के जोखिम की भविष्यवाणी करने के लिए एक नया नैदानिक भविष्यवाणी नियम विकसित किया गया है। कसौटी से संबंधित वैधता स्थापित करने के लिए, शोधकर्ता पहले नए नियम के परिणामों की तुलना हृदय रोग के लिए एक अच्छी तरह से स्थापित, स्वर्ण मानक परीक्षण के परिणामों से करेंगे, जैसे कि एंजियोग्राफी। यदि नया नियम ऐसे परिणाम उत्पन्न करता है जो स्वर्ण मानक परीक्षण के परिणामों के साथ अत्यधिक सहसंबद्ध हैं, तो इसे उच्च मानदंड-संबंधी वैधता वाला माना जा सकता है।

समवर्ती वैधता (Concurrent Validity): इसकी घटना तब पाई जाती है जब कसौटी उपायों को उसी समय परीक्षण स्कोर के रूप में प्राप्त किया जाता है।

यह उस डिग्री को दर्शाता है जिस पर टेस्ट स्कोर का अनुमान है
मानदंड के संबंध में व्यक्ति की वर्तमान स्थिति।
उदाहरण के लिए, यदि कोई परीक्षण चिंता को मापता है, तो इसे समवर्ती वैधता कहा जाएगा यदि यह किसी व्यक्ति द्वारा अनुभव की गई चिंता के वर्तमान स्तर को सही ढंग से दर्शाता है।
परीक्षण वैधता का समवर्ती साक्ष्य आमतौर पर उपलब्धि परीक्षणों और नैदानिक नैदानिक परीक्षणों के लिए वांछनीय होता है।

उदाहरण: एक शोधकर्ता मरीजों में चिंता के स्तर को मापने के लिए एक नया परीक्षण विकसित करना चाहता है। समवर्ती वैधता स्थापित करने के लिए, शोधकर्ता पहले रोगियों के एक नमूने के लिए नए परीक्षण का संचालन करेगा और फिर परिणामों की तुलना राज्य-विशेषता चिंता सूची (STAI) जैसे चिंता के स्तर को मापने के लिए एक अच्छी तरह से स्थापित, स्वर्ण मानक परीक्षण से करेगा। शोधकर्ता रोगियों से उनकी चिंता के वर्तमान स्तर को रेट करने के लिए भी कहेंगे। यदि नए परीक्षण के परिणाम स्वर्ण मानक परीक्षण के परिणामों और स्व-रिपोर्ट किए गए चिंता स्तरों के साथ अत्यधिक सहसंबद्ध हैं, तो परीक्षण को समवर्ती वैधता वाला माना जा सकता है।

भविष्य कहनेवाला वैधता (Predictive Validity): भविष्य कहनेवाला वैधता तब होती है जब कसौटी के उपाय परीक्षण के बाद एक समय में प्राप्त होते हैं।

उदाहरण के लिए, योग्यता परीक्षण उपयोगी होते हैं
यह पहचानना कि किसी विशेष विषय में किसके सफल होने या असफल होने की संभावना अधिक होगी। भविष्यवाणिय वैधता विशेष रूप से प्रवेश परीक्षाओं और व्यावसायिक परीक्षणों के लिए प्रासंगिक है।

उदाहरण: एक शोधकर्ता एक विशिष्ट भूमिका में नौकरी आवेदकों की सफलता की भविष्यवाणी करने के लिए एक नया परीक्षण विकसित करना चाहता है। भविष्यवाणी की वैधता स्थापित करने के लिए, शोधकर्ता पहले नौकरी आवेदकों के नमूने के लिए परीक्षण का संचालन करेगा और फिर समय के साथ उनकी नौकरी के प्रदर्शन को ट्रैक करेगा। शोधकर्ता परीक्षा के अंकों की तुलना आवेदकों के कार्य प्रदर्शन से करेगा और सहसंबंध का निर्धारण करेगा। यदि परीक्षण के अंक नौकरी के प्रदर्शन के साथ अत्यधिक सहसंबद्ध हैं, तो परीक्षण को भविष्य कहनेवाला वैधता माना जा सकता है।

एक और उदाहरण: एक कॉलेज अपने संभावित छात्रों की अकादमिक सफलता की भविष्यवाणी करने के लिए प्रवेश परीक्षा का उपयोग करना चाहता है। भविष्य कहनेवाला वैधता स्थापित करने के लिए, कॉलेज पहले संभावित छात्रों के नमूने के लिए परीक्षा आयोजित करेगा और फिर समय के साथ उनके अकादमिक प्रदर्शन को ट्रैक करेगा। कॉलेज परीक्षा के अंकों की तुलना छात्रों के शैक्षणिक प्रदर्शन से करेगा और सहसंबंध का निर्धारण करेगा। यदि परीक्षा के अंक अकादमिक प्रदर्शन के साथ अत्यधिक सहसंबद्ध हैं, तो प्रवेश परीक्षा को भविष्य कहनेवाला वैधता माना जा सकता है।

निर्माण की वैधता

(Construct validity)

निर्माण वैधता की जांच में न केवल मापने के उपकरण की बल्कि इसके अंतर्निहित सिद्धांत की विश्वसनीयता और वैधता सत्यापन शामिल है।
यदि भविष्यवाणियों का समर्थन नहीं किया जाता है, तो अन्वेषक के पास कोई स्पष्ट मार्गदर्शक नहीं हो सकता है कि कमी मापने के उपकरण में है या सिद्धांत में |

उदाहरण: एक शोधकर्ता आत्म-सम्मान को मापने के लिए एक नया परीक्षण विकसित करना चाहता है। शोधकर्ता पहले एक सिद्धांत विकसित करता है कि आत्म-सम्मान दो उप-निर्माणों से बना है: आत्म-मूल्य और आत्म-करुणा (Self-worth and self-compassion)। निर्माण की वैधता स्थापित करने के लिए, शोधकर्ता पहले उन परीक्षण मदों का निर्माण करेगा जो इन उप-रचनाओं को मापते हैं। इसके बाद, शोधकर्ता प्रतिभागियों के एक नमूने का परीक्षण करेगा और परिणामों की तुलना आत्म-सम्मान के एक सुस्थापित माप से करेगा। शोधकर्ता परीक्षण के परिणामों की तुलना आत्म-मूल्य और आत्म-करुणा के स्थापित उपायों से भी करेगा। यदि परीक्षण स्कोर स्थापित उपायों के साथ अत्यधिक सहसंबद्ध हैं और इस सिद्धांत का समर्थन करते हैं कि आत्मसम्मान दो उप-निर्माणों से बना है, तो परीक्षण को वैधता का निर्माण माना जा सकता है।

निर्माण सत्यापन में तीन अलग-अलग चरण शामिल हैं:

स्वयं अवधारणाओं के बीच सैद्धांतिक संबंध निर्दिष्ट करें
अवधारणाओं के उपायों के बीच अनुभवजन्य संबंध की जांच करें
अनुभवजन्य साक्ष्य की व्याख्या इस संदर्भ में करें कि यह किसी विशेष माप की निर्माण वैधता को कैसे स्पष्ट करता है। वास्तव में कड़ाई से बोलना, इस अर्थ में किसी अवधारणा के माप को मान्य करना असंभव है जब तक कि कोई सैद्धांतिक नेटवर्क नहीं है जो अवधारणा को घेरता है।

निर्माण वैधता दो प्रकार की होती है –

अभिसरण वैधता (Convergent Validity)
भिन्न वैधता (या विभेदक वैधता) (Divergent Validity or discriminant validity)

1. अभिसरण वैधता (Convergent Validity)

इसका मतलब यह है कि जिस हद तक एक उपाय अन्य उपायों के साथ सहसंबद्ध होता है, जिसके साथ सैद्धांतिक रूप से सहसंबद्ध होने की भविष्यवाणी की जाती है।

उदाहरण: एक शोधकर्ता अवसाद का एक नया माप विकसित करना चाहता है। शोधकर्ता का मानना है कि अवसाद कम आत्मसम्मान और तनाव के उच्च स्तर से संबंधित है। अभिसरण वैधता स्थापित करने के लिए, शोधकर्ता पहले अवसाद को मापने वाले परीक्षण आइटम बनाएंगे। इसके बाद, शोधकर्ता आत्म-सम्मान और तनाव के सुस्थापित उपायों के साथ-साथ प्रतिभागियों के एक नमूने का परीक्षण करेगा। इसके बाद शोधकर्ता नए परीक्षण के परिणामों की स्थापित उपायों के साथ तुलना करेगा। यदि अवसाद के लिए परीक्षण स्कोर आत्म-सम्मान और तनाव के स्थापित उपायों पर स्कोर के साथ अत्यधिक सहसंबद्ध हैं, जैसा कि सिद्धांत द्वारा भविष्यवाणी की गई है, तो परीक्षण को अभिसरण वैधता माना जा सकता है।

2. पक्षपातपूर्ण वैधता (Discriminant Validity)

यह बताता है कि किस हद तक परिचालनकरण अन्य परिचालनों के साथ सहसंबद्ध नहीं है, जिसे सैद्धांतिक रूप से सहसंबद्ध नहीं किया जाना चाहिए।

उदाहरण: एक शोधकर्ता व्यायाम के लिए प्रेरणा का एक नया उपाय विकसित करना चाहता है। शोधकर्ता का मानना है कि व्यायाम के लिए प्रेरणा का अध्ययन या काम जैसी अन्य गतिविधियों के लिए प्रेरणा से कोई संबंध नहीं है। विवेकपूर्ण वैधता स्थापित करने के लिए, शोधकर्ता पहले टेस्ट आइटम बनायेंगे जो व्यायाम के लिए प्रेरणा को मापते हैं। इसके बाद, शोधकर्ता अध्ययन और कार्य के लिए प्रेरणा के सुस्थापित उपायों के साथ-साथ प्रतिभागियों के एक नमूने के लिए परीक्षण का संचालन करेगा। इसके बाद शोधकर्ता नए परीक्षण के परिणामों की स्थापित उपायों के साथ तुलना करेगा। यदि अभ्यास के लिए प्रेरणा के लिए परीक्षण स्कोर अध्ययन और कार्य के लिए प्रेरणा के स्थापित उपायों पर स्कोर के साथ अत्यधिक सहसंबद्ध नहीं हैं, जैसा कि सिद्धांत द्वारा भविष्यवाणी की गई है, तो परीक्षण को भेदभावपूर्ण वैधता माना जा सकता है।

चेहरा वैधता

(Face Validity)

चेहरे की वैधता से तात्पर्य है कि सतही तौर पर क्या मापना प्रतीत होता है।
यह शोधकर्ता के निर्णय पर निर्भर करता है।
प्रत्येक प्रश्न की छानबीन की जाती है और तब तक संशोधित किया जाता है जब तक कि शोधकर्ता संतुष्ट न हो जाए कि यह वांछित निर्माण का सटीक माप है।
चेहरे की वैधता का निर्धारण शोधकर्ता की व्यक्तिपरक राय पर आधारित है

उदाहरण: एक शोधकर्ता कार्य संतुष्टि को मापने के लिए एक नया परीक्षण विकसित करना चाहता है। शोधकर्ता परीक्षण आइटम बनाता है जो नौकरी के पहलुओं जैसे वेतन, लाभ और काम करने की स्थिति के बारे में पूछता है। प्रत्यक्ष वैधता स्थापित करने के लिए, शोधकर्ता प्रत्येक परीक्षण आइटम की समीक्षा करेगा और खुद से पूछेगा कि क्या आइटम नौकरी की संतुष्टि को मापने के लिए प्रतीत होता है। शोधकर्ता प्रतिभागियों के एक नमूने से परीक्षण मदों की समीक्षा करने और प्रतिक्रिया प्रदान करने के लिए भी कहेंगे कि क्या वे मानते हैं कि आइटम नौकरी की संतुष्टि को माप रहे हैं। यदि शोधकर्ता और प्रतिभागियों का मानना है कि परीक्षण आइटम नौकरी से संतुष्टि को माप रहे हैं, तो परीक्षण को वैधता माना जा सकता है।

आंतरिक वैधता

(Internal Validity)

आंतरिक वैधता सबसे मौलिक प्रकार की वैधता है क्योंकि यह स्वतंत्र चर और आश्रित चर के बीच संबंधों के तर्क से संबंधित है।
इस प्रकार की वैधता नियोजित उपायों और अनुसंधान डिजाइन के आधार पर कारण संबंधों के बारे में निष्कर्ष निकालने की डिग्री का एक अनुमान है।
उचित रूप से उपयुक्त प्रयोगात्मक तकनीकें, जहां अत्यधिक नियंत्रित स्थितियों के तहत आश्रित पर एक स्वतंत्र चर का प्रभाव देखा जाता है, आंतरिक वैधता के संभावित उच्च स्तर को बनाते हैं।

उदाहरण: एक शोधकर्ता अवसाद के लक्षणों को कम करने पर एक नई दवा के प्रभाव का अध्ययन करना चाहता है। शोधकर्ता बेतरतीब ढंग से प्रतिभागियों को या तो एक उपचार समूह (नई दवा प्राप्त करना) या एक नियंत्रण समूह (एक प्लेसबो प्राप्त करना) प्रदान करता है। शोधकर्ता तब उपचार से पहले और बाद में सभी प्रतिभागियों के अवसाद के लक्षणों को मापता है। आंतरिक वैधता स्थापित करने के लिए, शोधकर्ता को यह सुनिश्चित करने की आवश्यकता होगी कि अध्ययन में संभावित भ्रमित चर के लिए उचित प्रायोगिक डिजाइन और नियंत्रण हो। शोधकर्ता को यह भी दिखाना होगा कि अवसाद के लक्षणों में परिवर्तन दवा के कारण होता है न कि किसी अन्य कारक के कारण। यदि अध्ययन डिजाइन और परिणाम दवा और कम अवसाद के लक्षणों के बीच एक कारण संबंध का समर्थन करते हैं, तो अध्ययन को उच्च आंतरिक वैधता वाला माना जा सकता है।

वाह्य वैधता

(External Validity)

मैकबर्नी और व्हाइट (2007) के अनुसार, बाहरी वैधता इस बात से संबंधित है कि क्या शोध के परिणामों को किसी अन्य स्थिति, विभिन्न विषयों, सेटिंग्स, समय आदि के लिए सामान्यीकृत किया जा सकता है।
बाहरी वैधता में इस तथ्य का अभाव है कि मानव प्रतिभागियों का उपयोग करने वाले प्रयोग अक्सर किसी विशेष भौगोलिक स्थान से एकत्र किए गए छोटे नमूनों को या विशेष विशेषताओं (जैसे स्वयंसेवक) के साथ नियोजित करते हैं।
इस कारण यह सुनिश्चित नहीं किया जा सकता कि कारण-प्रभाव के बारे में निकाले गए निष्कर्ष-
रिश्ते वास्तव में अन्य भौगोलिक स्थानों में या इन सुविधाओं के अभाव में लोगों पर लागू होते हैं।

उदाहरण: एक शोधकर्ता अवसाद के इलाज के लिए एक नई चिकित्सा की प्रभावशीलता की जांच करने के लिए एक अध्ययन करता है। अध्ययन प्रतिभागियों के एक छोटे से नमूने के साथ आयोजित किया जाता है, जो सभी एक ही विश्वविद्यालय परामर्श केंद्र से भर्ती किए जाते हैं। प्रतिभागियों की उम्र 18 से 25 वर्ष के बीच है और उनमें मध्यम से गंभीर अवसाद है। बाहरी वैधता स्थापित करने के लिए, शोधकर्ता को यह विचार करने की आवश्यकता होगी कि क्या अध्ययन के परिणामों को अन्य आबादी, जैसे वृद्ध वयस्कों या हल्के अवसाद वाले व्यक्तियों के लिए सामान्यीकृत किया जा सकता है। इसके अतिरिक्त, शोधकर्ता को यह विचार करने की आवश्यकता होगी कि क्या अध्ययन के परिणामों को अन्य सेटिंग्स, जैसे सामुदायिक मानसिक स्वास्थ्य केंद्र या निजी प्रथाओं के लिए सामान्यीकृत किया जा सकता है। यदि शोधकर्ता यह दिखाने में सक्षम है कि चिकित्सा विभिन्न प्रकार की आबादी और सेटिंग्स के लिए प्रभावी है, तो अध्ययन को उच्च बाहरी वैधता वाला माना जा सकता है।

विश्वसनीयता

(Reliability)

एक परीक्षण को विश्वसनीय माना जाता है यदि इसे उन्हीं छात्रों द्वारा समान परिस्थितियों में फिर से लिया जाता है और स्कोरिंग औसत लगभग स्थिर रहता है, यह ध्यान में रखते हुए कि परीक्षा के बीच का समय परीक्षण और पुन: परीक्षण उचित लंबाई के हैं।

उदाहरण: एक शोधकर्ता छात्रों के एक समूह की पढ़ने की समझ को मापना चाहता है। शोधकर्ता छात्रों के लिए पढ़ने की समझ का परीक्षण करता है और फिर एक सप्ताह बाद उनका पुन: परीक्षण करता है। शोधकर्ता दो परीक्षणों पर स्कोर के बीच सहसंबंध की गणना करता है और पाता है कि यह उच्च है, जिसका अर्थ है कि छात्रों के स्कोर दो परीक्षणों में सुसंगत थे। यह इंगित करता है कि परीक्षण विश्वसनीय है। शोधकर्ता यह निष्कर्ष निकाल सकता है कि यदि उन्हीं परिस्थितियों में फिर से परीक्षा दी जाती है, तो छात्रों के समान अंक प्राप्त करने की संभावना होगी, और इस प्रकार परीक्षण विश्वसनीय है।

विश्वसनीयता ज्ञात करने की एक भिन्न विधि:-

टेस्ट-रीटेस्ट विधि (Test-retest method)
आधा भाग विधि (Split-half method)
समानांतर रूप विधि (Parallel form method)

Tests of Reliability

(विश्वसनीयता के परीक्षण)

Description

(विवरण)

A. Test and re-test

(परीक्षण और पुनः परीक्षण करें)

I. Delivering a questionnaire in two parts, separately, to a sample group.

एक नमूना समूह को अलग-अलग, दो भागों में एक प्रश्नावली वितरित करना।

B. Inter-rater

(अंतर-दर निर्धारित करने वाला)

II. Providing different versions of a questionnaire that are equivalent for respondents.

एक प्रश्नावली के विभिन्न संस्करण प्रदान करना जो उत्तरदाताओं के लिए समान हों।

C. Parallel forms

(समानांतर रूप)

Ill. The same test is conducted by different people.

एक ही परीक्षा अलग-अलग लोगों द्वारा आयोजित की जाती है।

D. Split-half

(विभाजन आधा)

IV. The same test over a period of time is repeated

समय की अवधि में एक ही परीक्षण दोहराया जाता है |

	A	B	C	D
1	I	II	III	IV
2	II	III	IV	I
3	III	IV	I	II
4	IV	III	II	I

Also Read: (Complete Notes) CTET Pedagogy Notes In Hindi Pdf Download

विश्वसनीयता और वैधता के बीच संबंध

(Relation between Reliability and Validity)

विश्वसनीयता एक माप की स्थिरता के बारे में है, और वैधता एक माप की सटीकता के बारे में है।

एक परीक्षण विश्वसनीय हो सकता है लेकिन वैध होने की आवश्यकता नहीं है। ऐसा इसलिए है क्योंकि यह लगातार स्कोर प्राप्त कर सकता है, लेकिन इन स्कोरों का प्रतिनिधित्व करने की आवश्यकता नहीं है कि वास्तव में हम मापक क्या चाहते हैं।
उच्च वैधता वाले परीक्षण को विश्वसनीय भी होना चाहिए। (स्कोर दोनों मामलों में संगत होंगे।
वैध परीक्षण भी एक विश्वसनीय परीक्षण है, लेकिन एक विश्वसनीय परीक्षण वैध नहीं हो सकता है।

उदाहरण: एक शोधकर्ता रचनात्मकता को मापने के लिए एक नया परीक्षण विकसित करना चाहता है। शोधकर्ता प्रतिभागियों के एक नमूने के लिए परीक्षण का संचालन करता है और फिर विश्वसनीयता स्थापित करने के लिए एक सप्ताह बाद उनका पुन: परीक्षण करता है। दोनों परीक्षणों के प्राप्तांकों के बीच सहसंबंध उच्च है, जो दर्शाता है कि परीक्षण विश्वसनीय है। हालांकि, आगे की परीक्षा में, शोधकर्ता ने पाया कि परीक्षण आइटम रचनात्मकता के बजाय सामान्य ज्ञान और रिकॉल को माप रहे हैं। इस प्रकार, परीक्षण विश्वसनीय हो सकता है, लेकिन यह रचनात्मकता को मापने में मान्य नहीं है। यह एक उदाहरण है कि कैसे एक परीक्षण विश्वसनीय हो सकता है लेकिन वैध नहीं।

विभेदकारी शक्ति

(Discriminating Power)

परीक्षण की विवेकशील शक्ति परीक्षा लेने वाले ऊपरी और निचले समूहों के बीच भेदभाव करने की शक्ति है।
परीक्षण में प्रश्नों के विभिन्न कठिनाई स्तर होने चाहिए।

उदाहरण: एक शोधकर्ता गणितीय क्षमता को मापने के लिए एक नया परीक्षण विकसित करना चाहता है। शोधकर्ता अलग-अलग कठिनाई स्तरों के परीक्षण आइटम बनाता है और छात्रों के नमूने के लिए परीक्षण का संचालन करता है। परीक्षण की विवेकशील शक्ति को स्थापित करने के लिए, शोधकर्ता परीक्षण के परिणामों की जांच करेगा और शीर्ष प्रदर्शन करने वाले छात्रों के स्कोर की तुलना कम प्रदर्शन करने वाले छात्रों के स्कोर से करेगा। यदि परीक्षण छात्रों के ऊपरी और निचले समूहों के बीच सटीक रूप से अंतर करने में सक्षम है, तो इसे अच्छी विवेक शक्ति वाला माना जा सकता है। इसके अतिरिक्त, शोधकर्ता स्कोर के प्रसार को भी देखेगा और यह सुनिश्चित करेगा कि परीक्षण विभिन्न क्षमताओं वाले छात्रों के बीच अंतर करने में सक्षम है।

कंपैरेबिलिटी

(Comparability)

एक परीक्षण में तुलनात्मकता होती है जब इसके उपयोग से प्राप्त अंकों की व्याख्या एक सामान्य आधार के संदर्भ में की जा सकती है जिसका एक स्वाभाविक या स्वीकृत अर्थ होता है। तुलना स्थापित करने की दो विधियाँ हैं।

परीक्षण के समतुल्य (समानांतर) रूप की उपलब्धता। (Availability of equivalent (parallel) form of test)
पर्याप्त मानदंडों की उपलब्धता। (Availability of adequate norms)

उदाहरण: एक शोधकर्ता शब्दावली ज्ञान को मापने के लिए एक नया परीक्षण विकसित करना चाहता है। शोधकर्ता परीक्षण आइटम बनाता है जो एक स्थापित, व्यापक रूप से उपयोग की जाने वाली शब्दावली परीक्षण के प्रारूप और सामग्री में समान हैं। तुलनात्मकता स्थापित करने के लिए, शोधकर्ता स्थापित परीक्षण के साथ-साथ प्रतिभागियों के एक नमूने के लिए नया परीक्षण करेगा। शोधकर्ता तब दो परीक्षणों के परिणामों की तुलना करेगा और निर्धारित करेगा कि वे समकक्ष हैं या नहीं। यह परीक्षण के समतुल्य या समानांतर रूपों की उपलब्धता के माध्यम से तुलनीयता स्थापित करने का एक तरीका है।

तुलनात्मकता स्थापित करने का एक अन्य तरीका पर्याप्त मानदंडों की उपलब्धता के माध्यम से है। इस पद्धति में, शोधकर्ता प्रतिभागियों के एक बड़े नमूने के लिए नए परीक्षण का संचालन करेगा और उनके अंकों पर डेटा एकत्र करेगा। शोधकर्ता तब इस डेटा का उपयोग मानदंडों को बनाने के लिए करेगा, जो स्कोर के सांख्यिकीय औसत हैं। इन मानदंडों का उपयोग नए परीक्षार्थियों के स्कोर की तुलना उस नमूने के स्कोर से करने के लिए किया जा सकता है जिसका उपयोग मानदंड बनाने के लिए किया गया था। यह एक प्राकृतिक या स्वीकृत अर्थ के साथ सामान्य आधार के संदर्भ में अंकों की व्याख्या करने की अनुमति देता है।

उपयोगिता

(Utility)

एक परीक्षण की उपयोगिता है यदि यह परीक्षण की स्थिति प्रदान करता है जो उस उद्देश्य की प्राप्ति की सुविधा प्रदान करेगा जिसके लिए यह अभिप्रेत है।

उदाहरण: एक शोधकर्ता गैर-देशी वक्ताओं की भाषा प्रवीणता को मापने के लिए एक नया परीक्षण विकसित करना चाहता है। शोधकर्ता टेस्ट आइटम बनाता है जो भाषा प्रवीणता के विभिन्न पहलुओं का आकलन करता है, जैसे कि व्याकरण, शब्दावली और पढ़ने की समझ। परीक्षण की उपयोगिता स्थापित करने के लिए, शोधकर्ता यह जांच करेगा कि भाषा प्रवीणता को मापने के उद्देश्य से परीक्षण आइटम कितनी अच्छी तरह संरेखित हैं। इसके अतिरिक्त, शोधकर्ता परीक्षण को प्रशासित करने के लिए आवश्यक लागत और समय, स्कोरिंग में आसानी और परिणामों की व्याख्या, और उपयुक्त संसाधनों की उपलब्धता, जैसे प्रशिक्षित स्कोरर या परीक्षण का विभिन्न भाषाओं में अनुवाद पर भी विचार करेगा। मान लीजिए कि परीक्षण आवश्यक परीक्षण स्थितियां प्रदान करने में सक्षम है जो भाषा प्रवीणता को मापने के उद्देश्य से संरेखित है और यह लागत प्रभावी है, स्कोर करना आसान है, और उपयुक्त संसाधन उपलब्ध हैं। ऐसे में इसकी उपयोगिता मानी जा सकती है।

मानदंड

(Norms)

विश्वसनीयता और वैधता के अलावा, एक अच्छे परीक्षण के लिए मानदंडों की आवश्यकता होती है। मानदंड उन प्राप्तांकों के समुच्चय हैं जिनके द्वारा परीक्षण का इरादा है। इन समूहों द्वारा प्राप्त अंक किसी भी व्यक्तिगत स्कोर की व्याख्या के लिए एक आधार प्रदान करते हैं।

उदाहरण: एक शोधकर्ता बच्चों में संज्ञानात्मक क्षमता को मापने के लिए एक नया परीक्षण विकसित करना चाहता है। शोधकर्ता इच्छित परीक्षार्थियों के समान आयु सीमा में बच्चों के नमूने के लिए परीक्षण का संचालन करता है। शोधकर्ता तब परीक्षण के लिए मानदंड स्थापित करने के लिए स्कोर के माध्य, औसत और मानक विचलन की गणना करता है। इन मानदंडों का उपयोग परीक्षण पर व्यक्तिगत अंकों की व्याख्या करने के लिए किया जा सकता है। उदाहरण के लिए, यदि कोई बच्चा परीक्षा में औसत से अधिक अंक प्राप्त करता है, तो बच्चे की संज्ञानात्मक क्षमता औसत से अधिक होने की संभावना है। यदि बच्चे का स्कोर औसत से कम है, तो बच्चे की संज्ञानात्मक क्षमता औसत से कम होने की संभावना है। मानदंड व्यक्तिगत स्कोर की व्याख्या करने और समूह के स्कोर के साथ उनकी तुलना करने के लिए एक आधार प्रदान करते हैं जिसके लिए परीक्षण को आदर्श बनाया गया था।

पक्षपात से मुक्त (Free from biasness)

निष्पक्षतावाद

(Objectivity)

एक परीक्षण को वस्तुनिष्ठ कहा जाता है यदि यह अपने दायरे की व्याख्या करने के साथ-साथ प्रतिक्रियाओं को स्कोर करने में व्यक्तिगत पक्षपात से मुक्त हो।

उदाहरण: एक शोधकर्ता महत्वपूर्ण सोच कौशल को मापने के लिए एक नया परीक्षण विकसित करना चाहता है। शोधकर्ता परीक्षण आइटम बनाता है जो समस्या समाधान और विश्लेषण जैसे महत्वपूर्ण सोच के विभिन्न पहलुओं का आकलन करता है। परीक्षण की निष्पक्षता सुनिश्चित करने के लिए, शोधकर्ता प्रत्येक परीक्षण आइटम के लिए स्पष्ट और विस्तृत स्कोरिंग मानदंड स्थापित करेगा। शोधकर्ता यह सुनिश्चित करने के लिए कई स्कोररों को प्रशिक्षित करेगा कि स्कोर व्यक्तिगत पूर्वाग्रहों से प्रभावित नहीं हैं। इसके अतिरिक्त, शोधकर्ता परीक्षार्थियों को किसी भी भ्रम से बचने और परीक्षण के दायरे की व्याख्या करने में व्यक्तिगत पक्षपात की संभावना को कम करने के लिए स्पष्ट निर्देश भी प्रदान करेगा। यदि परीक्षण अपने दायरे की व्याख्या करने और प्रतिक्रियाओं को स्कोर करने में व्यक्तिगत पक्षपात से मुक्त है, तो इसे वस्तुनिष्ठ माना जा सकता है।

व्यापकता

(Comprehensiveness)

एक परीक्षा को पूरी तरह से अध्ययन के पूरे क्षेत्र को कवर करना चाहिए जो कि छात्रों को पाठ्यक्रम के दौरान उजागर किया जाता है।

उदाहरण: एक शोधकर्ता अमेरिकी इतिहास के छात्र ज्ञान को मापने के लिए एक नया परीक्षण विकसित करना चाहता है। शोधकर्ता परीक्षण आइटम बनाता है जो औपनिवेशिक काल से लेकर वर्तमान तक विभिन्न ऐतिहासिक घटनाओं और आंकड़ों का आकलन करता है। परीक्षण की व्यापकता सुनिश्चित करने के लिए, शोधकर्ता यह सुनिश्चित करने के लिए परीक्षण वस्तुओं की समीक्षा करेगा कि वे अमेरिकी इतिहास के पूरे क्षेत्र को कवर करते हैं जो छात्रों को पाठ्यक्रम के दौरान उजागर होते हैं। इसमें विभिन्न ऐतिहासिक युगों और दृष्टिकोणों से प्रमुख घटनाएं, आंकड़े और विषय शामिल हैं। इसके अतिरिक्त, शोधकर्ता यह सुनिश्चित करने के लिए पाठ्यक्रम में उपयोग किए गए पाठ्यक्रम और पाठ्यपुस्तकों से भी परामर्श करेगा कि सभी महत्वपूर्ण विषय परीक्षण में शामिल हैं। यदि परीक्षण अमेरिकी इतिहास के पूरे क्षेत्र को कवर करता है जो पाठ्यक्रम के दौरान छात्रों के सामने आता है, तो इसे व्यापक माना जा सकता है।

Also read: