Introduktion till oövervakad maskininlärning

Har du någonsin tänkt på hur ett barn kan skilja mellan äpplen och apelsiner när han inte vet vad de egentligen är, hur de smakar men baserat på färg och storlek kan han dela dem i två grupper utan föregående information? Kan vi förvänta oss samma segmentering som ett barn gör från maskiner om information om färg och storlek ges? Låt oss se hur vi kan göra det! I det här ämnet kommer vi att lära oss om Unsupervised Machine Learning.

”Maskininlärning” som termen föreslår att vi lär maskiner att utföra människoliknande uppgifter och hur lär människor, antingen från någon eller genom observation. Samma som människor, hur maskinen lär sig.

Maskininlärning kan delas in i tre delar: -

  1. Övervakad inlärning
  2. Oövervakat lärande
  3. Förstärkningslärande

Typer av maskininlärning

Förstärkningsinlärning är agentbaserat lärande som innebär belöning och straff vid åtgärder som vidtas av en agent. Slutmålet är att maximera den totala belöningen i processen att lära av miljön.

När du har input-output data, kort sagt, märkta data till exempel, angiven höjd och vikt för att avgöra om en person är manlig eller kvinna kan betraktas som en övervakad inlärningsuppgift (från någon i fallet med människor).

Men i många verkliga scenarier är denna märkta eller kommenterade data inte alltid tillgänglig. Många gånger möter vi problem med att segmentera objekt baserat på deras egenskaper som inte uttryckligen nämns. Hur löser du detta problem? Tja, oövervakat lärande är lösningen.

Wikipedia säger att oövervakat lärande är en typ av självorganiserat hebreiskt lärande som hjälper till att hitta tidigare okända mönster i datauppsättning utan befintliga etiketter. I undervisningsövervakning har vi ingen information om etiketter men ändå vill vi få insikter från data baserat på dess olika egenskaper.

Typer av maskinövervakning utan övervakning

Oövervakade inlärningsuppgifter kan i stort sett delas in i tre kategorier:

  1. Föreningens gruvdrift
  2. Clustering
  3. Rekommendationssystem

1. Föreningsregelbrytning

När vi har transaktionsdata för något, kan det vara för produkter som säljs eller någon transaktionsdata för det betyder, jag vill veta, finns det något doldt förhållande mellan köparen och produkterna eller produkten till produkten, så att jag på något sätt kan utnyttja denna information för att öka min försäljning. Att utvinna dessa relationer är kärnan i Association Rule Mining. Vi kan använda AIS, SETM, Apriori, FP tillväxtalgoritmer för att utvinna relationer.

2. Clustering

Clustering kan göras all data där vi inte har klass- eller etikettinformation. Vi vill gruppera data så att observationerna med liknande egenskaper tillhör samma kluster / grupp och inter-klusteravståndet bör vara maximalt. Medan klusteravståndet bör vara minimalt. Vi kan klustera väljarens data för att ta reda på yttrandet om regeringen eller klusterprodukter, baserat på deras funktioner och användning. Segmentpopulation baserat på inkomstfunktioner eller använda kluster i försäljning och marknadsföring.

Vi kan använda K-Means, K-Means ++, K-Medoids, Fuzzy C-medel (FCM),

Expectation-Maximization (EM), Agglomerative Clustering, DBSCAN, typer av hierarkisk clustering som enkel koppling, komplett koppling, medianlänkning, Ward's metodalgoritmer för kluster.

3. Rekommendationssystem

Rekommendationssystem är i grunden en förlängning av gruvförening av associeringsregel i den meningen, i ARM utvinner vi relationer och i rekommendationssystem använder vi dessa relationer för att rekommendera något som har högre acceptanschanser av slutanvändaren. Rekommendationssystem har vunnit popularitet efter att Netflix tillkännagav ett stort pris på 1 000 000 US-dollar 2009.

Rekommendationssystem fungerar på transaktionsdata, oavsett om det handlar om finansiell transaktion, e-handel eller livsmedelsbutikstransaktion. Nuförtiden lockar jättespelare inom e-handeln kunderna genom att göra en anpassad rekommendation för varje användare baserat på deras tidigare köphistorik och liknande uppköpsdata från andra användare.

Metoder för att utveckla rekommendationssystem kan i stort sett delas in i kollaborativ filtrering och innehållsbaserad filtrering. Vid samarbetsfiltrering igen har vi användar-användare Samarbetsfiltrering och Samarbetsfiltrering mellan objekt och objekt som är minnebaserade tillvägagångssätt och Matrix-faktorisering och Singular Value Decomposition (SVD) är modellbaserade tillvägagångssätt.

Applications of Unsupervised Learning

Eftersom världens data ökar enormt varje dag, har okontrollerat lärande många tillämpningar. Vi skapar alltid data genom att använda sociala medieplattformar eller något videoinnehåll på YouTube och många gånger gör vi inte ens medvetet. All denna information är ostrukturerad och märkning av dem för övervakade inlärningsuppgifter blir trött och dyr.

Följande är några coola tillämpningar av maskinövervakning utan tillsyn.

  1. Livsmedelsbutik eller e-handelsbutik / marknadsplats: Extraheringsregler från kunder transaktionsdata och rekommendationer för konsumenter att köpa produkter.
  2. Social Media Platform: Extrahera relationer med olika användare för att föreslå produkter eller tjänster. Rekommendera nya människor för social anslutning.
  3. Tjänster: Rekommendationer av resetjänster, en rekommendation av hus att hyra eller matchmakingtjänster.
  4. Banking: Clusterkunder baserade på sina finansiella transaktioner. Cluster bedräglig transaktion för bedrägeri upptäckt.
  5. Politik: Klusterväljarens åsikter om chanserna för en vinst för ett visst parti.
  6. Datavisualisering: Med klustering och t-distribuerad Stokastisk granninbäddning (t-SNE) kan vi visualisera högdimensionella data. Dessutom kan detta användas för att minska dimensionen.
  7. Underhållning: Rekommendationer för filmer, musik, som Netflix och Amazon gör.
  8. Bildsegmentering: Clusterbilder delar baserat på närmaste pixelvärden.
  9. Innehåll: personliga tidningar, rekommendationer från webbsidor, e-lärande applikationer och e-postfilter.
  10. Strukturell upptäckt: Med kluster kan vi upptäcka alla dolda strukturer i data. Cluster twitter-data för sentimentanalys.

Slutsats

Oövervakad maskininlärning är inte för kvantifierbar men kan lösa en hel del problem där övervakade algoritmer misslyckas. Det finns många applikationer för att inte övervaka inlärning i många domäner där vi har ostrukturerad och omärkt information. Vi kan använda undervisningstekniker utan övervakning för att lära våra maskiner att göra ett bättre jobb än oss. Under de senaste åren har maskiner överträffat människor när det gäller uppgifter som anses vara lösade av människor i århundraden. Jag hoppas att du med den här artikeln förstod vad som är och hur oövervakade maskininlärningstekniker kan användas för att lösa verkliga problem.

Rekommenderade artiklar

Detta är en guide till oövervakad maskininlärning. Här diskuterar vi typer av maskininlärning och typer av maskinövervakning utan tillsyn tillsammans med dess tillämpningar. Du kan också titta på följande artiklar för att lära dig mer -

  1. Maskininlärningsalgoritmer
  2. Vad är maskininlärning?
  3. Introduktion till maskininlärning
  4. Maskininlärningsverktyg
  5. Clustering in Machine Learning
  6. Hyperparameter-maskininlärning
  7. Hierarkisk klusteralgoritm
  8. Hierarkisk klustering Agglomerativ & delande kluster
  9. Topp 8 stadier av maskinlärande livscykel

Kategori: