Hur installerar NLTK?

Följande artikel Installera NLTK ger en översikt för installation av NLTK. NLTK är en uppsättning bibliotek för naturlig språkbearbetning. Det är en plattform för att bygga Python-program för att bearbeta naturligt språk. NLTK är skriven på Python-programmeringsspråk. Det utvecklades av Steven Bird och Edward Loper. Det stöder forskning och undervisning inom NLP eller nära besläktade områden, inklusive kognitiv vetenskap, empirisk lingvistik, informationssökning, artificiell intelligens och maskininlärning. NLTK ger ett lättanvänt gränssnitt.

NLTK (Natural Language Toolkit)

  • Naturligt språkbearbetning (NLP) är en del av konstgjord intelligens som bearbetar språket som talas av människor. Således hjälper det människor att interagera med datorer även om de inte har kunskap om hur man använder den. Med hjälp av NLP behöver människor bara diktera kommandot till datorer. Med kraften i maskininlärning blir Natural Language Processing populärt och lättare att genomföra. Det är i princip tekniken att interagera med människor och utföra åtgärder på röstkommandon.
  • Detta gör att enheter kan användas av även nybörjaren som inte har någon kunskap om teknik. Men implementeringen av naturligt språkbearbetning är inte lätt, eftersom ett språk som talas av människor har ingen bestämd struktur. Det är tvetydigt och beror på sammanhangsord som kan ha en annan betydelse.
  • NLTK har mer än 50 företag och lexikala källor som WordNet, Problem Report Corpus, Penn Treebank Corpus, etc. Det kommer också med en guidebok som förklarar begreppen språkbearbetning med verktygssatser och programmeringsgrunder i Python som gör det enkelt för människorna som inte har någon djup kunskap om programmering. Den har ett brett utbud av paket som gör det till en av de kraftfulla verktygssatserna för NLP. Tokenisering, Lemmatization, Stemming, Parsing, Character count, Punctuation, word count är några av dessa paket.

Installera NLTK för Windows

Nedan följer instruktionerna för att installera NLTK i Windows. Dessa är baserade på antagandet att Python inte är installerat i systemet. NLTK kräver Python versioner 2.7.3.5 och senare.

Steg 1: Ladda ner den senaste versionen av Python för Windows från länken nedan

https://www.python.org/downloads/

Steg 2: Klicka på nedladdat .exe för att köra det.

Steg 3: Välj anpassa installationen.

Steg 4: Kontrollera om alla funktioner är särskilt "pip" eftersom det hjälper till att installera NLTK och klicka på Nästa.

Steg 5: Välj avancerade alternativ i nästa skärm, välj sökvägen och klicka på installera.

Steg 6: När installationen har lyckats nära fönstret.

Steg 7: Kopiera sökvägen till mappen Skript för att installera NLTK i samma mapp.

NLTK kan enkelt installeras med ett "pip" -installatör. Vi måste också installera “numpy” också.

Steg 8: För att installera NLTK, öppna kommandotolken och skriv kommandot nedan.

Se till att installationen är framgångsrik.

Efter en lyckad installation är det nu dags att använda NLTK för naturlig språkbearbetning.

Steg9: Öppna Python Shell och skriv kommandot nedan.

Om det importeras utan något fel betyder det att NLTK är korrekt installerat.

Installera NLTK för Mac / Linux

Till skillnad från i Windows kommer Linux-system med Python installerat i det. För att installera NLTK i Linux / Mac används Pythons Pip-paketinstallatör. För att installera pip eller uppdatera skriver du nedan kommandon i kommandotolken.

För att installera python i Linux använd kommandona nedan.

Steg 1: För att uppdatera paketindexet använder du kommandot nedan.

Steg2: Använd nedan för att installera Python i Linux-systemet.

Steg 3: Skriv in kommandot nedan för att installera “pip” för Python 3.

Steg 4: När "Pip" har installerats framgångsrikt använder du följande kommandon för att installera NLTK.

NLTK Dataset

NLTK har många datasätt tillgängliga för behandling av naturligt språk, till exempel WordNet, WikiCorpus, Gutenberg, Opinion Lexicon, Tweebank, etc. Dessa datasätt kallas corpora. I grund och botten innehåller NLTK-datasatsen en uppsättning filer eller dokument. Varje fil / dokument innehåller en samling ord, bokstäver eller text på ett enda språk. Således är ett korpus främst bibliotek för att förstå / lära sig ett språk. Det har grammatikregler och strukturer för ett språk.

När du har installerat NLTK kan du importera den och även ladda ner dess korpora med följande kommando.

NLTK-nedladdaren öppnar ett fönster för att ladda ner datasätten. Storleken på datasättet är stort, därför kommer det att ta tid. För att testa om datasätt är korrekt installerade, prova att importera datasatsen och använda den.

Bearbetning av NLTK

Det finns fem huvudprocesser för Natural Language Processing. Det här är de steg som ingår i behandlingen av text.

  1. EOS-upptäckt : Avslutning av taldetektering delar upp texten i en samling meningsfulla meningar. Den delar upp den långa texten i delar som har viss mening.
  2. Tokenisering : Detta steg delar upp meningarna i tokens. Tokens innehåller inte bara ord utan innehåller även blanksteg, meningsbrytningar.
  3. POS-taggning : POS betyder tal-tal. Här tilldelas information till token. Denna information antyder vilken typ av tal det är som spänd, verb, adjektiv, substantiv etc.
  4. Chunking : Chunking betyder att samla textbaserat på taggar.
  5. Extraktion: Extraktion är en pågående process att gå igenom bitar och tagga dem som namngivna enheter som människor, platser, organisationer etc.

Slutsats:

NLTK används för textklassificering, bildtexter, taligenkänning, frågesvar, språkmodellering, dokumentöversikt och många andra operationer. Det finns många andra verktyg för naturlig språkbearbetning. Men NLTK har ett brett utbud av bibliotek som gör det till ett av de kraftfulla naturliga språkverktyg. Det är mer exakt än något annat verktyg men på grund av ett stort antal bibliotek är det lite långsamt. Så det beror på användarens krav. Om användaren vill ha hastighet, kan de också föredra andra verktyg, men då måste de kompromissa med innehållets noggrannhet. Men om noggrannhet är en prioriterad bör de definitivt gå för NLTK.

Rekommenderade artiklar:

Detta har varit en guide för att installera NLTK. Här diskuterar vi det grundläggande konceptet och olika steg för att installera NLTK på Windows och Linux \ Mac. Du kan också titta på följande artiklar för att lära dig mer-

  1. Installera Kubernetes instrumentbräda
  2. Hur man installerar JDK
  3. Installera Docker
  4. Hur installerar du Magento?
  5. Magento-versioner | Funktioner i Magento-versioner

Kategori: