सोशल नेटवर्क डेटा का विश्लेषण करने के लिए श्रेणीबद्ध क्लस्टरिंग सबसे लोकप्रिय और व्यापक रूप से उपयोग की जाने वाली विधि है। इस पद्धति में, नोड्स की तुलना उनकी समानता के आधार पर एक दूसरे से की जाती है। नोड्स के समूहों को उनकी समानता के आधार पर जोड़कर बड़े समूह बनाए जाते हैं।
श्रेणीबद्ध क्लस्टरिंग बनाम K का अर्थ कब उपयोग करना है?
एक पदानुक्रमित क्लस्टरिंग नेस्टेड समूहों का एक समूह है जो एक पेड़ के रूप में व्यवस्थित होते हैं। K मीन्स क्लस्टरिंग अच्छी तरह से काम करने के लिए पाया जाता है जब क्लस्टर्स की संरचना हाइपर गोलाकार होती है (जैसे 2D में सर्कल, 3D में स्फीयर)। पदानुक्रमिक क्लस्टरिंग उतनी अच्छी तरह से काम नहीं करती है, k का अर्थ है जब क्लस्टर का आकार अति गोलाकार होता है।
मुझे पदानुक्रमित क्लस्टरिंग का उपयोग कब करना चाहिए?
श्रेणीबद्ध क्लस्टरिंग एक शक्तिशाली तकनीक है जो आपको डेटा समानताओं से ट्री संरचना बनाने की अनुमति देती है। अब आप देख सकते हैं कि विभिन्न उप-समूह एक-दूसरे से कैसे संबंधित हैं, और डेटा बिंदु कितनी दूर हैं।
आप पदानुक्रमित क्लस्टरिंग का उपयोग कब नहीं करेंगे?
कमजोरी यह है कि यह शायद ही कभी सबसे अच्छा समाधान प्रदान करता है, इसमें बहुत सारे मनमाने फैसले शामिल हैं, यह गायब डेटा के साथ काम नहीं करता, यह मिश्रित डेटा प्रकारों के साथ खराब काम करता है, यह बहुत बड़े डेटा सेट पर अच्छी तरह से काम नहीं करता है, और इसका मुख्य आउटपुट, डेंड्रोग्राम, आमतौर पर गलत व्याख्या किया जाता है।
श्रेणीबद्ध क्लस्टरिंग के क्या लाभ हैं?
श्रेणीबद्ध क्लस्टरिंग की ताकत
- यह हैसमझने और लागू करने के लिए।
- हमें किसी विशेष संख्या में समूहों को पूर्व-निर्दिष्ट करने की आवश्यकता नहीं है। …
- वे सार्थक वर्गीकरण के अनुरूप हो सकते हैं।
- केवल डेंड्रोग्राम को देखकर क्लस्टर की संख्या तय करना आसान है।