
4.8 Convolutional Neural Networks in Machine Learning with examples convolutional layers stride
KnowledgeGATE Bytes
Overview
यह वीडियो कन्वोल्यूशनल न्यूरल नेटवर्क्स (CNNs) का एक बुनियादी परिचय प्रदान करता है, जो विशेष रूप से इमेज डेटा को प्रोसेस करने के लिए डिज़ाइन किए गए डीप लर्निंग मॉडल हैं। यह बताता है कि CNNs छवियों से फीचर्स को स्वचालित रूप से कैसे सीखते हैं, जिसमें कन्वोल्यूशनल लेयर्स, स्ट्राइड, पैडिंग और पूलिंग जैसी प्रमुख अवधारणाओं को समझाया गया है। वीडियो यह भी बताता है कि कैसे ये फीचर्स एक फ्लैट एरे में परिवर्तित हो जाते हैं और फिर क्लासिफिकेशन के लिए एक पारंपरिक न्यूरल नेटवर्क में फीड किए जाते हैं। अंत में, यह रेक्टिफाइड लीनियर यूनिट (ReLU) जैसे महत्वपूर्ण फंक्शन्स पर प्रकाश डालता है।
Save this permanently with flashcards, quizzes, and AI chat
Chapters
- कन्वोल्यूशनल न्यूरल नेटवर्क्स (CNNs) डीप लर्निंग का एक प्रकार हैं जो इमेज जैसे ग्रिड-जैसे डेटा को प्रोसेस करने के लिए डिज़ाइन किए गए हैं।
- ये मॉडल इनपुट इमेज से फीचर्स के पदानुक्रम को स्वचालित रूप से सीखते हैं।
- CNNs में आमतौर पर कन्वोल्यूशनल लेयर्स, पूलिंग लेयर्स और अंत में क्लासिफिकेशन के लिए फुली कनेक्टेड लेयर्स शामिल होती हैं।
- इनका उपयोग फेस रिकॉग्निशन, इमेज रिकॉग्निशन और स्पीच रिकॉग्निशन जैसे कार्यों में किया जाता है।
- कन्वोल्यूशनल लेयर्स का मुख्य उद्देश्य इनपुट डेटा से फीचर्स निकालना है।
- यह 'फिल्टर्स' या 'कर्नल्स' का उपयोग करके किया जाता है, जो इमेज पर स्लाइड करते हैं।
- प्रत्येक फिल्टर एक विशिष्ट फीचर (जैसे किनारे, कोने या बनावट) का पता लगाने के लिए डिज़ाइन किया गया है।
- डॉट प्रोडक्ट ऑपरेशन का उपयोग करके फिल्टर को इमेज पर मैप किया जाता है, जिससे फीचर मैप बनता है।
- स्ट्राइड (Stride) यह निर्धारित करता है कि कन्वोल्यूशन फिल्टर इमेज पर कितनी दूरी तक आगे बढ़ता है। बड़े स्ट्राइड से छोटा फीचर मैप बनता है।
- पैडिंग (Padding) इमेज के किनारों पर जीरो पिक्सेल जोड़ने की एक तकनीक है।
- पैडिंग का उपयोग आउटपुट फीचर मैप के आकार को बनाए रखने और किनारों पर मौजूद फीचर्स को अधिक महत्व देने के लिए किया जाता है।
- स्ट्राइड और पैडिंग का समायोजन फीचर एक्सट्रैक्शन प्रक्रिया और परिणामी फीचर मैप के आकार को प्रभावित करता है।
- पूलिंग लेयर्स का उपयोग फीचर मैप के डायमेंशन को कम करने और कम्प्यूटेशनल लागत को घटाने के लिए किया जाता है।
- यह इमेज से सबसे महत्वपूर्ण जानकारी को बनाए रखते हुए अनावश्यक डेटा को हटा देता है।
- मैक्स पूलिंग (Max Pooling) और एवरेज पूलिंग (Average Pooling) दो सामान्य प्रकार हैं।
- मैक्स पूलिंग एक क्षेत्र से अधिकतम मान लेता है, जबकि एवरेज पूलिंग औसत मान लेता है।
- रेक्टिफाइड लीनियर यूनिट (ReLU) एक सामान्य एक्टिवेशन फंक्शन है जो कन्वोल्यूशनल लेयर्स के बाद उपयोग किया जाता है।
- यह नेगेटिव वैल्यू को जीरो पर सेट करता है और पॉजिटिव वैल्यू को वैसे ही रखता है (max(0, x))।
- कन्वोल्यूशन और पूलिंग के बाद, फीचर्स को एक फ्लैट एरे में बदल दिया जाता है।
- यह फ्लैट एरे फिर क्लासिफिकेशन के लिए एक या अधिक फुली कनेक्टेड न्यूरल नेटवर्क लेयर्स में फीड किया जाता है।
Key takeaways
- CNNs इमेज डेटा को प्रोसेस करने के लिए विशेष रूप से डिज़ाइन किए गए हैं, जो फीचर्स को स्वचालित रूप से सीखते हैं।
- कन्वोल्यूशनल लेयर्स फिल्टर्स का उपयोग करके इमेज से महत्वपूर्ण फीचर्स निकालती हैं।
- स्ट्राइड और पैडिंग कन्वोल्यूशन ऑपरेशन को नियंत्रित करने और फीचर मैप के आकार को प्रबंधित करने के तरीके हैं।
- पूलिंग लेयर्स डायमेंशनलिटी को कम करती हैं और मॉडल को अधिक मजबूत बनाती हैं।
- ReLU एक्टिवेशन फंक्शन नॉन-लीनियरिटी जोड़ता है, जो जटिल पैटर्न सीखने के लिए आवश्यक है।
- CNN का अंतिम चरण आमतौर पर निकाले गए फीचर्स का उपयोग करके क्लासिफिकेशन करने के लिए फुली कनेक्टेड लेयर्स का उपयोग करना है।
Key terms
Test your understanding
- कन्वोल्यूशनल न्यूरल नेटवर्क इमेज डेटा को प्रोसेस करने के लिए विशेष रूप से क्यों उपयुक्त हैं?
- कन्वोल्यूशनल लेयर में फिल्टर का क्या कार्य है और यह फीचर एक्सट्रैक्शन में कैसे योगदान देता है?
- स्ट्राइड और पैडिंग का उपयोग कन्वोल्यूशन प्रक्रिया को कैसे प्रभावित करता है?
- पूलिंग लेयर्स का मुख्य उद्देश्य क्या है और यह मॉडल के प्रदर्शन को कैसे बेहतर बनाता है?
- ReLU एक्टिवेशन फंक्शन CNNs में क्या भूमिका निभाता है?