Introduktion till lista över R-paket

Ett paket i programmeringsspråk R är en enhet som tillhandahåller nödvändiga funktioner som kan användas genom att ladda det i R-miljön. En lista med R-paket liknar ett bibliotek i C, C ++ eller Java. Så i princip kan ett paket ha många funktionaliteter som funktioner, konstanter etc. att vi låter användaren använda dem i samband med ett visst problem. I R kan ett nödvändigt paket laddas med funktionen bibliotek (). Om ett paket inte finns, kan det installeras med funktionen install.packages (). Paket gör till synes svåra uppgifter enkelt genom sina färdiga funktioner.

Vad är R-paket?

Det finns många paket i R, och valet av ett paket beror på dess tillämpning. Även om det finns vissa paket som används ofta på grund av funktionaliteten de tillhandahåller, är det inte så att andra paket är mindre viktiga. Olika paket har olika syften; vissa är relaterade till statistiska tekniker, andra avser visualiseringar etc.

I följande avsnitt kommer vi att titta på några av de viktiga paketen i R:

1. Bil

Detta paket är Companion to Applied Regression. Det är ett stort paket som tillhandahåller olika funktioner för statistisk analys. Importera detta paket till R-miljön importerar andra relaterade paket som MASS, statistik, grafik etc. Några av funktionerna i paketet inkluderar Anova, avPlots, Boxplot, carPalette, densitetsplott, infIndexPlot, linjär hypotes, logit, outlier test, qqPlot, restplott, scatterplot, scatterplot matrix etc. Paketets omfattande funktioner kan mätas utifrån antalet funktioner som det tillhandahåller.

2. Korrplott

Paketet ger en grafisk visning av en korrelationsmatris och ett konfidensintervall. Paketet tillhandahåller också algoritmer för att utföra matriseresortering. Många alternativ inkluderar att välja erforderliga färger, textetiketter, färgetiketter, layout osv. Olika visualiseringsmetoder eller parametermetoder i korrplotpaketet är "cirkel", "fyrkant", "ellips", "antal", "skugga", "färg" och "paj". Korrplotfunktionen som innehåller olika alternativ ger en visuellt tilltalande representation av korrelation mellan olika variabler, som i normala fall, som siffror, är svåra att tolka. Positiva korrelationer visas i blått och negativa korrelationer i rött. Färgintensiteten och cirkelns storlek är proportionella mot korrelationskoefficienterna.

3. DataExplorer

Detta paket behandlar automatiserad utforskning och behandling av data. Det tillhandahåller en automatiserad datautforskningsprocess avsedd för analytiska uppgifter och prediktiv modellering. Detta är avgörande eftersom det gör det möjligt för användaren att förstå data och extrahera insikter. Varje variabel i analysen skannas och analyseras av paketet. Vidare tillhandahåller paketet funktioner för visualisering av dessa variabler med hjälp av typiska grafiska tekniker. Det tillhandahåller också vanliga databehandlingsmetoder för behandling och format av data.

4. Gmodels

Paketet gmodels tillhandahåller olika verktyg i R för att plotta data. Den innehåller olika funktioner såsom glh.test som används för att testa, skriva ut eller sammanfatta en allmän linjär hypotes för en regressionsmodell. Funktionen gör. kontraster konverterar mänskliga läsbara kontraster till den form som R kräver för beräkning. Matrisen som returneras av make.contrasts kan användas som argument till kontrastargumentet för modellfunktioner. Funktionen coFFrame passar en modell till varje undergrupp som definieras av , och returnerar sedan en dataram med en rad för varje passning och en kolumn för varje parameter. Den uppskattade funktionen beräknar och testar kontraster och andra uppskattbara linjära funktioner för modellkoefficienter för lm, glm, etc. Funktionen fit.contrast beräknar och testar godtyckliga kontraster för regressionsobjekt.

5. Gplots

Detta paket tillhandahåller visualiseringsfunktionaliteter genom mångsidiga programmeringsverktyg. Funktionerna i paketet arbetar med begreppet beräkning och planering. De grafiska kapaciteterna för paketet demonstreras av olika funktioner såsom band plot, boxplot2, col2hex, ci2d, hist2d, text plot, sink plot, balloon pilot, plotCI, plot medel, etc. Dessa funktioner möjliggör arbete med inställningar relaterade till färg, text och andra intrikata grafiska aspekter av visualiseringen. De behandlar också komplexa element som är involverade i statistikbaserad visualisering, t.ex. lmplot2, restplotfunktioner som gör det möjligt för användaren att driva detaljerad regressdiagnos genom diagnostiska plott. Om flera data måste plottas i samma region, men med separata axlar, är detta möjligt med hjälp av över-plot-funktionen i paketet.

6. Ggplot2

Det är ett av de mycket berömda paketen i R som ger omfattande visuella förmågor och presenterar resultaten även av komplexa statistiska och matematiska tekniker. De många funktionaliteter som paketet tillhandahåller gör det möjligt för analytiker att få insikter från data på det mest interaktiva sättet. R-beskrivningen för funktionen är ”ett system för deklarativt skapande av grafik som är baserad på grammatiken för grafik”. Denna grammatik av grafik innebär att användaren måste berätta 'ggplot2' om hur variabler måste kartläggas till estetik, så detta betyder i huvudsak att specificera vilka grafiska aspekter att använda och ggplot2 kommer att fungera i enlighet med detaljerna.

7. Lubridat

Detta R-paket gör det enklare att arbeta med datum och tider. Smörjpaketet möjliggör enkel hantering av datum- och tidsdata. Den analyserar ett nummer och ger lämpligt datainriktning, i själva verket hanterar analysfunktionerna i paketet en mängd olika format och separatorer som förenklar parsningsprocessen. En av de anmärkningsvärda funktionerna är att paketet erbjuder funktioner för att hantera datum med olika tidszoner.

8. Hmisc

Hmisc-paketet heter Harrell Diverse och innehåller många funktioner som kan utnyttjas för dataanalys, grafik på hög nivå och verktyg. Det inkluderar också funktioner för att beräkna sampelstorlek och effekt, importera och kommentera datasätt, beräkna saknade värden, tillhandahålla avancerade tabellfunktioner, klustering av variabler, manipulation av karaktärsträngen, konvertering av R-objekt till HTML-kod etc.

9. Gitter

Paketet erbjuder ett dataanalyseringssystem på hög nivå som inspirerats av Trellis-grafik. Det betonar multivariata data. Paketets kraftfulla visualiseringsfunktioner ger den grafiska lösningen som behövs. Några av de anmärkningsvärda funktionerna i paketet är B_07_cloud som hjälper till att producera 3d-spridningsdiagram och wireframe-ytplott; D_level. färger, en funktion för att beräkna falska färger som representerar en numerisk eller kategorisk variabel; B_06_levelplot, en funktion som genererar nivådiagram och konturdiagram; A_01_Lattice, en funktion som ger grafikfunktioner för gitter. B_09_tmd är en funktion som genererar Tukey Mean - Difference Plot; B_11_oneway, en funktion som passar envägsmodellen. Paketet ger således omfattande funktioner för visualiseringar genom olika funktioner.

10. MatrixModels

Detta paket tillåter modellering med glesa och täta Matrix-matriser. För att uppnå detta använder den modulära förutsägelser och svar, modulklasser. Alla funktioner som paketet tillhandahåller är lika viktiga, varav några är lm.fit.sparse vilket är en montörfunktion för glesa linjära modeller, oplossCoef som löser för koefficienter och koefficientökning, modell. En matris som konstruerar eventuellt gles design eller modellmatriser, glm4 som passar generaliserade linjära modeller.

11. Multkomp

Paketet möjliggör flera jämförelser av k-grupper i generaliserade linjära modeller. En lista med nio standardförfaranden, nämligen. Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott och Tetrade tillhandahålls användaren och användaren väljer jämförelser baserat på kravet. Utöver detta tillhandahålls också ett fritt inmatningsgränssnitt för kontrastmatrisen som möjliggör speciella jämförelser. Den anmärkningsvärda egenskapen är att jämförelserna i sig inte är begränsade till någon speciell design såsom balanserad eller enkel, snarare är programmen utformade på ett sådant sätt att de passar flera jämförelser inom den allmänna linjära modellen som möjliggör kovariater, korrelerade medel, saknade värden, etc.

12. OpenMx

Detta paket handlar i princip om utökad strukturell ekvationsmodellering. Det ger funktioner för att skapa strukturella ekvationsmodeller. Dessa modeller kan manipuleras med programmering. Modellerna kan specificeras med matriser eller sökvägar som LISREL eller RAM. Några av modellerna inkluderar flera grupper, bekräftande faktor, blandningsfördelning, kategorisk tröskel, differentiell anpassningsfunktioner etc.

13. Plyr

Det är ett mycket viktigt paket som tillhandahåller funktioner för datamanipulation. Det ger verktyg för att dela, applicera och kombinera data. Den levereras med en uppsättning verktyg som hjälper till att lösa en gemensam uppsättning problem. Till exempel kan vi ibland behöva dela upp en stor uppgift i mindre uppgifter som är hanterbara, sedan arbetar vi på var och en av bitarna och sedan slutligen sätter vi tillbaka alla bitarna.

14. Qcc

Paketet får betydelse på grund av olika kvalitetsanalysfunktioner som det tillhandahåller. Det tillhandahåller Shewhart-kvalitetskontrolldiagram för kontinuerlig, attribut och räknar data. Bland andra viktiga diagram är Cusum- och EWMA-diagram och driftskaraktärskurvor. Det erbjuder också processfunktionsanalysfunktionalitet. Pareto-diagram och orsak-och-effekt-diagram och multivariate kontrolldiagram är användbara verktyg som tillhandahålls av paketet.

15. RandomForest

Som namnet antyder, används detta paket för att bygga en slumpmässig skogalgoritm. Paketet implementerar Breimans slumpmässiga skogsalgoritm, som är baserad på Beiman och Cutlers ursprungliga FORTRAN-kod. Algoritmen används för klassificering och regression. Paketet kan också användas i oövervakat läge för att bedöma närheten mellan datapunkter.

16. Psych

Det är ett paket som är avsett för ett speciellt syfte. Paketet ger en procedur för psykologisk, psykometrisk och personlighetsforskning. Funktioner är främst för multivariat analys med olika multivariate statistiska tekniker.

Slutsatslista över R-paket

Det finns många paket i R, och tillämpningen av ett paket beror på krav. Listan över R-paket-communityn har vuxit mycket snabbt, och varje dag läggs ett paket till. Flera paket kan ge liknande funktioner men valet av ett paket måste baseras på dess noggranna studie.

Rekommenderade artiklar

Detta är en guide till en lista över R-paket. Här diskuterar vi introduktionen till R-paket och några viktiga paket av R. Du kan också gå igenom våra andra föreslagna artiklar för att lära dig mer -

  1. Java-paket
  2. Vad är JNDI i Java?
  3. JColorChooser
  4. R-programmering mot Python

Kategori: