Machine Learning Algorithms: मशीन लर्निंग एल्गोरिदम क्या होती है, जानें इनके प्रकार और उपयोग

Safalta Experts Published by: Nikesh Kumar Updated Sat, 25 Dec 2021 04:05 PM IST

उच्च मांग और प्रौद्योगिकी में प्रगति के कारण हाल के वर्षों में मशीन लर्निंग का प्रचलन काफी बढ़ गया है। डेटा से मूल्य बनाने के लिए मशीन लर्निंग की क्षमता ने इसे कई अलग-अलग उद्योगों में व्यवसायों के लिए आकर्षक बना दिया है। अधिकांश मशीन लर्निंग उत्पादों को कुछ ट्यूनिंग और मामूली बदलावों के साथ ऑफ-द-शेल्फ मशीन लर्निंग एल्गोरिदम के साथ डिज़ाइन और कार्यान्वित किया जाता है।

Source: social media


 
 
मशीन लर्निंग एल्गोरिदम की निम्न तीन मुख्य श्रेणियों में बांटा जा सकता है:
 
सुपरवाइज्ड लर्निंग एल्गोरिदम सुविधाओं (स्वतंत्र चर) और एक लेबल (लक्ष्य) के बीच संबंधों को टिप्पणियों का एक सेट दिया गया है। फिर मॉडल का उपयोग सुविधाओं का उपयोग करके नए अवलोकनों के लेबल की भविष्यवाणी करने के लिए किया जाता है।

Free Demo Classes

Register here for Free Demo Classes


 
अनसुपरवाइज्ड लर्निंग एल्गोरिदम  गैर-लेबल वाले डेटा में संरचना को खोजने का प्रयास करते हैं।
 
रीइन्फोर्समेंट लर्निंग एक एक्शन-इनाम सिद्धांत पर आधारित काम करता है। एक एजेंट अपने कार्यों के इनाम की गणना करके एक लक्ष्य तक पहुंचना सीखता है।
 
The 10 लोकप्रिय मशीन लर्निंग एल्गोरिदम-
 
1. लिनियर रिग्रेशन-  लिनियर रिग्रेशन एक सुपरवाइज्ड लर्निंग एल्गोरिदम है और डेटा के लिए एक रैखिक समीकरण फिट करके एक सतत टारगेट वेरिएबल और एक या अधिक फ्री वेरिएबल के बीच संबंधों को मॉडल करने का प्रयास करता है। एक  लिनियर रिग्रेशन एक अच्छा विकल्प होने के लिए, फ्री वेरिएबल (ओं) और टारगेट वेरिएबल के बीच एक रैखिक संबंध होना चाहिए। चरों के बीच संबंधों का पता लगाने के लिए कई उपकरण हैं जैसे स्कैटर प्लॉट और सहसंबंध मैट्रिक्स का उपयोग किया जाता है।

फ्रंट एंड डेवलपर कैसे बनें और इसके लिए कौन से स्किल्स सीखें
 
2. सपोर्ट वेक्टर मशीन-
 
सपोर्ट वेक्टर मशीन (एसवीएम) एक पर्यवेक्षित शिक्षण एल्गोरिथम है और इसका उपयोग ज्यादातर वर्गीकरण कार्यों के लिए किया जाता है लेकिन यह प्रतिगमन कार्यों के लिए भी उपयुक्त है।
एसवीएम एक निर्णय सीमा खींचकर वर्गों को अलग करता है। एसवीएम एल्गोरिदम में निर्णय सीमा को कैसे खींचना या निर्धारित करना सबसे महत्वपूर्ण हिस्सा है। निर्णय सीमा बनाने से पहले, प्रत्येक अवलोकन (या डेटा बिंदु) को n-आयामी स्थान में प्लॉट किया जाता है। "एन" उपयोग की जाने वाली सुविधाओं की संख्या है। उदाहरण के लिए, यदि हम विभिन्न "कोशिकाओं" को वर्गीकृत करने के लिए "लंबाई" और "चौड़ाई" का उपयोग करते हैं, तो अवलोकन 2-आयामी स्थान में प्लॉट किए जाते हैं और निर्णय सीमा एक रेखा होती है। यदि हम 3 विशेषताओं का उपयोग करते हैं, तो निर्णय सीमा 3-आयामी अंतरिक्ष में एक विमान है। यदि हम 3 से अधिक सुविधाओं का उपयोग करते हैं, तो निर्णय सीमा एक हाइपरप्लेन बन जाती है जिसकी कल्पना करना वास्तव में कठिन है।
 
3. डिसीजन ट्री-
 
मशीन लर्निंग में डिसीजन ट्री एल्गोरिथम आज उपयोग में सबसे लोकप्रिय एल्गोरिथम में से एक है; यह एक पर्यवेक्षित शिक्षण एल्गोरिथम है जिसका उपयोग समस्याओं को वर्गीकृत करने के लिए किया जाता है। यह श्रेणीबद्ध और निरंतर आश्रित चर दोनों के लिए अच्छी तरह से वर्गीकृत करता है। इस एल्गोरिथम में, हम सबसे महत्वपूर्ण विशेषताओं / स्वतंत्र चर के आधार पर जनसंख्या को दो या दो से अधिक सजातीय सेटों में विभाजित करते हैं।

2022 में सीखने के लिए सर्वश्रेष्ठ प्रोग्रामिंग भाषाएँ

4. Naive Bayes-
 
Naive Bayes भविष्य कहनेवाला मॉडलिंग के लिए एक सरल लेकिन आश्चर्यजनक रूप से शक्तिशाली एल्गोरिथम है।
 
मॉडल में दो प्रकार की प्रायिकताएं शामिल होती हैं, जिनकी गणना सीधे आपके प्रशिक्षण डेटा से की जा सकती है: प्रत्येक वर्ग की प्रायिकता; और प्रत्येक वर्ग के लिए सशर्त संभाव्यता प्रत्येक x मान दी गई है। एक बार गणना करने के बाद, बेयस प्रमेय का उपयोग करके नए डेटा के लिए भविष्यवाणियां करने के लिए संभाव्यता मॉडल का उपयोग किया जा सकता है।
 
5. SVM (सपोर्ट वेक्टर मशीन) एल्गोरिथम-
 
SVM एल्गोरिथ्म वर्गीकरण एल्गोरिथ्म की एक विधि है जिसमें आप कच्चे डेटा को n-आयामी स्थान में बिंदुओं के रूप में प्लॉट करते हैं (जहाँ n आपके पास सुविधाओं की संख्या है)। प्रत्येक सुविधा का मूल्य तब एक विशेष समन्वय से जुड़ा होता है, जिससे डेटा को वर्गीकृत करना आसान हो जाता है। क्लासिफायर नामक लाइन का उपयोग डेटा को विभाजित करने और उन्हें एक ग्राफ पर प्लॉट करने के लिए किया जा सकता है।

2022 में सर्टिफाइड माइक्रोसॉफ्ट एक्सेल प्रोफेशनल कैसे बनें
 
6. केएनएन-
K-Nearest Neighbours एल्गोरिथम डेटा सेट को प्रशिक्षण सेट और परीक्षण सेट में विभाजित करने के बजाय प्रशिक्षण सेट के रूप में संपूर्ण डेटा सेट का उपयोग करता है।
 
जब एक नए डेटा इंस्टेंस के लिए एक परिणाम की आवश्यकता होती है, तो KNN एल्गोरिथम नए इंस्टेंस के k-निकटतम इंस्टेंस को खोजने के लिए पूरे डेटा सेट के माध्यम से जाता है, या k सबसे नए रिकॉर्ड के समान इंस्टेंस की संख्या, और फिर माध्य आउटपुट करता है परिणामों की (प्रतिगमन समस्या के लिए) या वर्गीकरण समस्या के लिए मोड (सबसे लगातार वर्ग)। k का मान उपयोगकर्ता द्वारा निर्दिष्ट है। उदाहरणों के बीच समानता की गणना यूक्लिडियन दूरी और हैमिंग दूरी जैसे उपायों का उपयोग करके की जाती है।
 
7. K- मींस-
 
यह एक अनुपयोगी शिक्षण एल्गोरिथम है जो क्लस्टरिंग समस्याओं को हल करता है। डेटा सेट को समूहों की एक विशेष संख्या में वर्गीकृत किया जाता है (चलिए उस नंबर को K कहते हैं) इस तरह से कि एक क्लस्टर के भीतर सभी डेटा बिंदु अन्य समूहों के डेटा से समरूप और विषम होते हैं।
K- मींस एल्गोरिथ्म प्रत्येक क्लस्टर के लिए k अंकों की संख्या चुनता है, जिसे सेंट्रोइड्स कहा जाता है। प्रत्येक डेटा बिंदु निकटतम सेंट्रोइड्स के साथ एक क्लस्टर बनाता है, अर्थात, K क्लस्टर। यह अब मौजूदा क्लस्टर सदस्यों के आधार पर नए सेंट्रोइड बनाता है।
इन नए केंद्रों के साथ, प्रत्येक डेटा बिंदु के लिए निकटतम दूरी निर्धारित की जाती है। यह प्रक्रिया तब तक दोहराई जाती है जब तक कि केन्द्रक नहीं बदलते।

एक सफल डेटा एनालिटिक्स करियर कैसे बनाएं

8. लॉजिस्टिक रिग्रेशन-
 
लॉजिस्टिक रिग्रेशन का उपयोग स्वतंत्र चर के एक सेट से असतत मूल्यों (आमतौर पर बाइनरी मान जैसे 0/1) का अनुमान लगाने के लिए किया जाता है। यह डेटा को लॉगिट फ़ंक्शन में फ़िट करके किसी घटना की संभावना की भविष्यवाणी करने में मदद करता है। इसे लॉगिट रिग्रेशन भी कहा जाता है।
 
नीचे सूचीबद्ध इन विधियों का उपयोग अक्सर लॉजिस्टिक रिग्रेशन मॉडल को बेहतर बनाने में मदद के लिए किया जाता है:  बातचीत की शर्तें शामिल करें, तकनीकों को नियमित करें, सुविधाओं को खत्म करें, एक गैर-रैखिक मॉडल का उपयोग करें।

Related Article

UPSC CSE Mains 2024 Interview Schedule out now; Personality tests from 7 January, Check full timetable here

Read More

Common Admission Test (CAT) 2024 Result out; 14 Students Score 100 Percentile, Read here

Read More

CAT Result: कैट परीक्षा के परिणाम जारी, इतने उम्मीदवारों ने 100 पर्सेंटाइल स्कोर किए हासिल; चेक करें रिजल्ट

Read More

CBSE: डमी प्रवेश रोकने के लिए सीबीएसई का सख्त कदम, 18 स्कूलों को जारी किया कारण बताओ नोटिस

Read More

Jharkhand Board Exam Dates 2025 released; Exams from 11 February, Check the full schedule here

Read More

JAC Board Exam 2025: झारखंड बोर्ड कक्षा 10वीं-12वीं की परीक्षाओं के लिए तिथियां जारी, 11 फरवरी से होंगे एग्जाम्स

Read More

Pareeksha Pe Charcha 2025: जनवरी में होगी पीएम मोदी के साथ परीक्षा पे चर्चा, इस तारीख तक करें पंजीकरण

Read More

NIACL Jobs 2024: न्यू इंडिया एश्योरेंस कंपनी में 500 पदों पर भर्ती, जानें कौन कर सकता है आवेदन; ऐसे होगा चयन

Read More

NEET UG 2025: क्या ऑनलाइन हो सकती है नीट यूजी परीक्षा? शिक्षा मंत्री ने बताया- 'जल्द आएगा फैसला'

Read More