Clustering in Machine Learning - De flesta metoder och applikationer

Innehållsförteckning:

Anonim

Introduktion till Clustering in Machine Learning

Vi kommer först att förstå maskininlärning. Vi kan se data växa snabbt runt oss. Data finns i olika former som video, ljud, bilder etc. Clustering i maskininlärning använder dessa data för att besvara frågan. Till exempel (upptäcka hudsjukdom) kommer läkaren att använda maskininlärning för att förstå märket på huden och kommer att förutsäga vilken typ av sjukdom det är. Clustering är inget annat än att gruppera omärkta datauppsättningar. Låt oss ta ett exempel på din film (du vill titta på). Du kanske gillar romantiska filmer, men din syster gillar komediefilmer. Du kanske gillar Bollywood-romantiska filmer eller Hollywood-romantiska filmer. Men din syster gillar Telegu-komediefilmer, här kan du se dig och din syster har ett annat val av filmer. Ni båda har upptäckt djupinformation om filmer. Här har vi grupperat omärkta datauppsättningar (filmer) för att se filmen.

Hur fungerar Clustering i maskininlärning?

Vid gruppering grupperar vi omärkta datauppsättningar, som kallas icke-övervakat lärande. När vi först grupperar omärkta data måste vi hitta en liknande grupp. När vi skapar en grupp måste vi förstå funktionerna i datasätt, dvs liknande saker. Om vi ​​skapar en grupp efter en eller två funktioner är det lätt att mäta likheten.

  • Exempel 1: Filmer av regissören. När klustering har gjorts tilldelas varje kluster klusternummer som kallas ClusterID. Maskininlärningssystem som YouTube använder klusterID för att enkelt representera komplexa data.
  • Exempel 2: YouTube använder vår sökhistorik eller tittade historik och föreslår videor vi kanske gillar. Funktionsdata för Facebook innehåller är personer vi följer, sidor vi följer, kommentarer vi matar in, bilder eller videor vi gillar, bilder eller foton vi taggar på. Clustering Facebook video eller foto kommer att ersätta en uppsättning funktioner med en enda clusterID på grund av komprimering av data.

Topp 4 metoder för klustering i maskininlärning

Nedan följer metoderna för Clustering in Machine Learning:

1. Hierarkisk

Namnklustering definierar ett sätt att arbeta, denna metod bildar ett kluster på ett hierarkiskt sätt. Det nya klustret bildas med en tidigare formad struktur. Vi måste förstå skillnaderna mellan det splittrande tillvägagångssättet jämfört med aggregerativ strategi. Agglomerativ är en bottom-up-strategi, det börjar med enskilda punkter i ett kluster och kombinerar vissa godtyckliga. Divisive börjar med ett enda kluster, alla punkter i ett kluster och delar upp det i flera kluster.

2. Täthetsbaserad

I den här metoden betraktas tät region som ett kluster som har vissa likheter. Det skiljer sig från det nedre täta området i objektutrymmet. DBSCAN är känd som den densitetsbaserade rumsliga gruppering av applikationer med brus. För dataobjektorientering letar DBSCAN efter någon epsilon som vi ställer in en radie-epsilon och det minsta antalet poäng. Inom en radie, om vi överträffar ett visst minimum antal poäng, rangordnar vi en kluster med hög densitet. Så på detta sätt kan vi överväga data med en region med hög täthet. DBSCAN skiljer sig från centroid-klustermetoden eftersom det inte är ett strikt tillvägagångssätt. Bullerpunkter är punkter i områden med låg densitet som lämnas omärkta eller märkta som outliers. Det är därför vi inte behöver specifika K. Vi kan ange minimipoäng för högdensitetsregion och radie som vi vill att en region ska vara eller kluster ska vara.

3. Partitionering

När vi har ett dataset med N antal objekt. Denna metod konstruerar "K" som en partition av data. Denna partition är klustret dvs konstruktion K, partition (K <= N).

Krav som ska uppfyllas:

  • Varje grupp eller dataset måste innehålla minst ett objekt.
  • Varje objekt ska bara tillhöra en grupp.

Ett av exemplen på partitionering är K-betyder klustering.

4. Rasterbaserat

Objektutrymme, ett begränsat antal celler bildar en rutstruktur. Denna metod ger snabb klusterbearbetning. Dessa är oberoende av objektutrymme.

Användningar av Clustering in Machine Learning

Nedan följer applikationerna av Clustering in Machine Learning:

1. Medicinsk

Läkaren kan använda en klusteralgoritm för att hitta detektering av sjukdom. Låt oss ta ett exempel på sköldkörtelsjukdom. Sköldkörtel-datasätt kan identifieras med hjälp av klusteralgoritm när vi tillämpar oövervakad inlärning på en datasats som innehåller sköldkörtel- och icke-sköldkörteldatasats. Clustering identifierar orsaken till sjukdomen och ger en framgångsrik sökning.

2. Socialt nätverk

Vi är generationen av internetåldern, vi kan träffa vilken person som helst eller lär känna om någon individuell identitet via internet. Webbplatser med sociala nätverk använder kluster för att förstå innehållet, användarnas ansikte eller plats. När inlärning utan tillsyn används i sociala, är det användbart för översättning av språk. Till exempel ger Instagram och Facebook funktionen översättning av språk.

3. Marknadsföring

Vi kan se eller observera att olika tekniker växer bredvid oss ​​och människor lockar sig att använda den tekniken som moln, digital marknadsföring. För att locka ett större antal kunder utvecklar varje företag lättanvända funktioner och teknik. För att förstå kunden kan vi använda kluster. Clustering hjälper företaget att förstå användarsegmentet och sedan kategorisera varje kund. På detta sätt kan vi förstå kunden och hitta likheter mellan kunderna och gruppera dem.

4. Banking

Vi har observerat att bedrägeri med pengar händer runt omkring oss och företaget varnar kunderna om det. Med hjälp av kluster kan försäkringsbolag hitta bedrägerier, erkänna kunder om det och förstå policyer som kunden har tagit.

5. Google

Google är en av de sökmotorer som människor använder. Låt oss ta ett exempel när vi söker efter lite information som djuraffär i området, Google kommer att ge oss olika alternativ. Detta är resultatet av kluster, kluster av liknande resultat som tillhandahålls för dig.

Slutsats

Vi har lärt oss om kluster och maskininlärning. Sätt att klustera fungerar i maskininlärning. Information om inlärning utan tillsyn. Realtidsanvändning av okontrollerat lärande. Metoder för kluster och hur varje metod fungerar i maskininlärning.

Rekommenderad artikel

Detta är en guide till Clustering in Machine Learning. Här diskuterar vi de 4 bästa metoderna för kluster i maskininlärning tillsammans med applikationer. Du kan också gå igenom våra andra föreslagna artiklar för att lära dig mer -
  1. Maskininlärningsramar Topp 10
  2. K- betyder klusteralgoritm med fördelar
  3. Introduktion till maskininlärningstekniker
  4. Maskininlärningsmodeller | Topp 5 typer
  5. Machine Learning C ++ Library