Introduktion till R-paket

Paketet är en samling funktioner och datasätt. Paket hjälper till att förbättra funktionaliteten på ett programmeringsspråk. Om vi ​​vill lagra och bearbeta databaser (dvs. SQL-liknande funktioner som använder dataramar) kan vi använda dplyr-paketet i R. Paket ger också dokumentation om hur man använder funktionerna och datasätten i ett givet paket.

Var hittar vi paket?

Paket finns tillgängliga på internet via olika källor. Det finns dock vissa betrodda förvar där vi kan ladda ner paketen.

Här är de två viktiga förvar som finns tillgängliga online.

  • CRAN (Comprehensive R Archive Network): Detta är den officiella R-gemenskapen med ett nätverk av FTP och webbservrar som innehåller den senaste koden och dokumentationen för R. Innan du publicerar dina paket online går det igenom en serie tester som följer CRAN-policyn .
  • GitHub: GitHub är ett annat berömt arkiv men inte specifikt för R.Nätverksgemenskapen kan dela sina paket med andra människor och det används för versionskontroll är bra. GitHub är en öppen källkod och har ingen granskningsprocess.

Lista över användbara R-paket

Det finns flera paket i R och kan laddas ner från CRAN eller GitHub. Nedan finns paketen som kan användas för specifika ändamål.

1. Laddar data från externa källor

  • Haven: R läser och skriver data från SAS.
  • DBI: O o upprätta kommunikation mellan relationsdatabasen och R.
  • RSQlite: Det används för att läsa data från relationsdatabaser.

2. Datamanipulation

  • Dplyr: Det används för datamanipulation som underinställning, ger genvägar för att komma åt data och genererar sql-frågor.
  • Tidyr - Det används för att konvertera data till små format.
  • stringr - manipulera stränguttryck och teckensträngar.
  • lubridat- Att arbeta med data och tid.

3. Datavisualisering

  • Rgl: Att arbeta med 3D-visualiseringar.
  • ggvis: Att skapa och bygga grammatik av grafik.
  • googlevis: Att använda Googles visualiseringsverktyg i R.

4. webbaserade paket

  1. XML: Att läsa och skriva XML-dokument i R.
  2. Httpr: Arbeta med http-anslutningar.
  3. Jsonlite: För att läsa json-datatabeller.

Få R-paket

Vi kan kontrollera tillgängliga paket som finns i R med hjälp av koden nedan.

  • available.packages (): Det finns cirka 5200 paket tillgängliga i CRAN-nätverket.

CRAN har uppgiftsvyer som grupperar paket under ett visst ämne.

Installera R-paket

Vi kan installera paket direkt via IDE eller genom kommandon. För att installera paket använder vi funktionen nedan och anger paketnamnet.

Syntax:

install.packages()

Koda:

install.packages(“ggplot2”)

Ovanstående kod installerar ggplot2-paketet och dess beroende paket om sådana finns.

Vi kan installera flera paket i taget genom att ange paketets namn under en teckenvektor.

Syntax:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Koda:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Installera med R Studio

Fördelen med att använda en R-studio är att det är GUI (grafiskt användargränssnitt). Vi kan välja paket som ska installeras och källan till det.

Vi kan gå till verktyg -> Installera paket.

Laddar R-paket

Efter att ha installerat R-paketet måste vi ladda dem i R, för att börja använda de installerade paketen.

Vi använder funktionen nedan för att ladda paketen.

Syntax:

library(package name)

Obs: Paketnamnet behöver inte anges i offert.

Koda:

library(ggplot2)

Det finns vissa paket som visar meddelanden när de laddas. Några av dem, inte. Vi kan se detaljerna om biblioteket installerat med hjälp av koden nedan.

Koda:

library(ggplot2)
search()

Produktion:

"Paket: gitter" "paket: ggplot2" "paket: märkglas"

"Paket: knitr" "paket: glida" "verktyg: rstudio"

Skapa ditt eget paket

Innan vi skapar vårt eget paket. Vi bör hålla nedanstående checklista i vårt sinne innan vi fortsätter att skapa ett paket.

  • Att organisera koden är en av de viktigaste sakerna när du skriver kod i paketet. Vi förlorar halva tiden på att söka efter kodplatsen istället för att förbättra koden. Lägg alla filer i en mapp som är lättillgänglig.
  • Att dokumentera koden hjälper dig att förstå syftet med koden. När vi inte besöker koden ofta glömmer vi varför vi har skrivit koden på ett visst sätt. Det kan också hjälpa människor att förstå din kod bättre när de delas med dem.
  • Att dela skript via e-post har blivit arkaiskt. Det enkla sättet är att ladda upp din kod och distribuera den på GitHub. Det är möjligt att du får feedback som kan hjälpa dig att förbättra koden.

För att skapa ditt eget paket måste vi installera devtools-paketet.

Koda:

install.packages("devtools")

För att hjälpa till med dokumentationen kan vi använda paketet nedan.

Koda:

install.packages("roxygen2")

Efter installationen av paketet devtools. Du kan skapa ditt eget paket.

Koda:

devtools::create ("packagename")

I stället för ”paketnamn” kan du ge det namn du önskar. Du kan nu lägga till dina funktioner under detta paket.

Du kan skapa samma filnamn som ditt funktionsnamn.

Syntax:

Devtools:create(“firstpackage”)

Distribuerande paket

Du kan distribuera ditt paket på github genom att använda devtools-paketet.

Vi använder koden nedan för att distribuera vårt paket på github.

Koda:

devtools::install_github("yourusername/firstpackage")

Du kan ge ditt github-användarnamn och paketnamn som du har skapat ovan.

Här är de obligatoriska filerna för ett paket

  • funktioner
  • Dokumentation
  • Data

När vi har alla ovanstående filer är vi bra att lägga upp dem i förvaret.

Rekommenderade artiklar

Detta är en guide till R-paket. Här diskuterar vi listan över användbara R-paket, installerar paket med R studio och skapar ditt eget paket, etc. Du kan också titta på följande artiklar för att lära dig mer -

  1. Vad är R-programmeringsspråk?
  2. Karriärer inom R-programmering
  3. R-programmering mot Python
  4. MySQL vs SQLite
  5. Lista över R-paket

Kategori: