4.8 Convolutional Neural Networks in Machine Learning with examples convolutional layers stride

KnowledgeGATE Bytes

5 chapters6 takeaways12 key terms5 questions

Overview

यह वीडियो कन्वोल्यूशनल न्यूरल नेटवर्क्स (CNNs) का एक बुनियादी परिचय प्रदान करता है, जो विशेष रूप से इमेज डेटा को प्रोसेस करने के लिए डिज़ाइन किए गए डीप लर्निंग मॉडल हैं। यह बताता है कि CNNs छवियों से फीचर्स को स्वचालित रूप से कैसे सीखते हैं, जिसमें कन्वोल्यूशनल लेयर्स, स्ट्राइड, पैडिंग और पूलिंग जैसी प्रमुख अवधारणाओं को समझाया गया है। वीडियो यह भी बताता है कि कैसे ये फीचर्स एक फ्लैट एरे में परिवर्तित हो जाते हैं और फिर क्लासिफिकेशन के लिए एक पारंपरिक न्यूरल नेटवर्क में फीड किए जाते हैं। अंत में, यह रेक्टिफाइड लीनियर यूनिट (ReLU) जैसे महत्वपूर्ण फंक्शन्स पर प्रकाश डालता है।

How was this?

Save this permanently with flashcards, quizzes, and AI chat

Chapters

कन्वोल्यूशनल न्यूरल नेटवर्क्स (CNNs) डीप लर्निंग का एक प्रकार हैं जो इमेज जैसे ग्रिड-जैसे डेटा को प्रोसेस करने के लिए डिज़ाइन किए गए हैं।
ये मॉडल इनपुट इमेज से फीचर्स के पदानुक्रम को स्वचालित रूप से सीखते हैं।
CNNs में आमतौर पर कन्वोल्यूशनल लेयर्स, पूलिंग लेयर्स और अंत में क्लासिफिकेशन के लिए फुली कनेक्टेड लेयर्स शामिल होती हैं।
इनका उपयोग फेस रिकॉग्निशन, इमेज रिकॉग्निशन और स्पीच रिकॉग्निशन जैसे कार्यों में किया जाता है।

यह समझना महत्वपूर्ण है कि CNNs कैसे काम करते हैं क्योंकि वे आधुनिक AI में इमेज और वीडियो विश्लेषण के लिए मूलभूत हैं।

चेहरे की पहचान या जेब्रा की छवि को पहचानना।

कन्वोल्यूशनल लेयर्स का मुख्य उद्देश्य इनपुट डेटा से फीचर्स निकालना है।
यह 'फिल्टर्स' या 'कर्नल्स' का उपयोग करके किया जाता है, जो इमेज पर स्लाइड करते हैं।
प्रत्येक फिल्टर एक विशिष्ट फीचर (जैसे किनारे, कोने या बनावट) का पता लगाने के लिए डिज़ाइन किया गया है।
डॉट प्रोडक्ट ऑपरेशन का उपयोग करके फिल्टर को इमेज पर मैप किया जाता है, जिससे फीचर मैप बनता है।

फीचर एक्सट्रैक्शन CNNs का दिल है; यह मॉडल को इमेज के महत्वपूर्ण हिस्सों को पहचानने और समझने में सक्षम बनाता है।

एक बिल्ली के कान का पता लगाने के लिए एक फिल्टर का उपयोग करना, जहां फिल्टर इमेज पर स्लाइड करता है और डॉट प्रोडक्ट के माध्यम से मिलान की तलाश करता है।

स्ट्राइड (Stride) यह निर्धारित करता है कि कन्वोल्यूशन फिल्टर इमेज पर कितनी दूरी तक आगे बढ़ता है। बड़े स्ट्राइड से छोटा फीचर मैप बनता है।
पैडिंग (Padding) इमेज के किनारों पर जीरो पिक्सेल जोड़ने की एक तकनीक है।
पैडिंग का उपयोग आउटपुट फीचर मैप के आकार को बनाए रखने और किनारों पर मौजूद फीचर्स को अधिक महत्व देने के लिए किया जाता है।
स्ट्राइड और पैडिंग का समायोजन फीचर एक्सट्रैक्शन प्रक्रिया और परिणामी फीचर मैप के आकार को प्रभावित करता है।

स्ट्राइड और पैडिंग कन्वोल्यूशनल लेयर के आउटपुट को नियंत्रित करने के लिए महत्वपूर्ण पैरामीटर हैं, जो मॉडल की कम्प्यूटेशनल दक्षता और प्रदर्शन को प्रभावित करते हैं।

एक 3x3 फीचर मैप बनाने के लिए स्ट्राइड 1 का उपयोग करना, या इनपुट और आउटपुट आकार को समान रखने के लिए पैडिंग का उपयोग करना।

पूलिंग लेयर्स का उपयोग फीचर मैप के डायमेंशन को कम करने और कम्प्यूटेशनल लागत को घटाने के लिए किया जाता है।
यह इमेज से सबसे महत्वपूर्ण जानकारी को बनाए रखते हुए अनावश्यक डेटा को हटा देता है।
मैक्स पूलिंग (Max Pooling) और एवरेज पूलिंग (Average Pooling) दो सामान्य प्रकार हैं।
मैक्स पूलिंग एक क्षेत्र से अधिकतम मान लेता है, जबकि एवरेज पूलिंग औसत मान लेता है।

पूलिंग मॉडल को अधिक मजबूत बनाने में मदद करता है और ओवरफिटिंग को कम करता है, जिससे यह विभिन्न इनपुट पर बेहतर प्रदर्शन करता है।

एक 2x2 क्षेत्र से अधिकतम मान (जैसे 7) लेकर फीचर मैप को छोटा करना।

रेक्टिफाइड लीनियर यूनिट (ReLU) एक सामान्य एक्टिवेशन फंक्शन है जो कन्वोल्यूशनल लेयर्स के बाद उपयोग किया जाता है।
यह नेगेटिव वैल्यू को जीरो पर सेट करता है और पॉजिटिव वैल्यू को वैसे ही रखता है (max(0, x))।
कन्वोल्यूशन और पूलिंग के बाद, फीचर्स को एक फ्लैट एरे में बदल दिया जाता है।
यह फ्लैट एरे फिर क्लासिफिकेशन के लिए एक या अधिक फुली कनेक्टेड न्यूरल नेटवर्क लेयर्स में फीड किया जाता है।

ReLU नॉन-लीनियरिटी जोड़ता है, जिससे नेटवर्क अधिक जटिल पैटर्न सीख सकता है, और फुली कनेक्टेड लेयर्स अंतिम निर्णय लेने के लिए इन फीचर्स का उपयोग करती हैं।

ReLU फंक्शन का उपयोग करके नेगेटिव वैल्यू को जीरो करना, और फिर निकाले गए फीचर्स को एक लीनियर एरे में परिवर्तित करना।

Key takeaways

1CNNs इमेज डेटा को प्रोसेस करने के लिए विशेष रूप से डिज़ाइन किए गए हैं, जो फीचर्स को स्वचालित रूप से सीखते हैं।
2कन्वोल्यूशनल लेयर्स फिल्टर्स का उपयोग करके इमेज से महत्वपूर्ण फीचर्स निकालती हैं।
3स्ट्राइड और पैडिंग कन्वोल्यूशन ऑपरेशन को नियंत्रित करने और फीचर मैप के आकार को प्रबंधित करने के तरीके हैं।
4पूलिंग लेयर्स डायमेंशनलिटी को कम करती हैं और मॉडल को अधिक मजबूत बनाती हैं।
5ReLU एक्टिवेशन फंक्शन नॉन-लीनियरिटी जोड़ता है, जो जटिल पैटर्न सीखने के लिए आवश्यक है।
6CNN का अंतिम चरण आमतौर पर निकाले गए फीचर्स का उपयोग करके क्लासिफिकेशन करने के लिए फुली कनेक्टेड लेयर्स का उपयोग करना है।

Key terms

Convolutional Neural Networks (CNNs)Deep LearningFeature ExtractionConvolutional LayerFilter / KernelStridePaddingPooling LayerMax PoolingAverage PoolingReLU (Rectified Linear Unit)Fully Connected Layer

Test your understanding

1कन्वोल्यूशनल न्यूरल नेटवर्क इमेज डेटा को प्रोसेस करने के लिए विशेष रूप से क्यों उपयुक्त हैं?
2कन्वोल्यूशनल लेयर में फिल्टर का क्या कार्य है और यह फीचर एक्सट्रैक्शन में कैसे योगदान देता है?
3स्ट्राइड और पैडिंग का उपयोग कन्वोल्यूशन प्रक्रिया को कैसे प्रभावित करता है?
4पूलिंग लेयर्स का मुख्य उद्देश्य क्या है और यह मॉडल के प्रदर्शन को कैसे बेहतर बनाता है?
5ReLU एक्टिवेशन फंक्शन CNNs में क्या भूमिका निभाता है?