Introduktion till polynomial regression

Regression definieras som metoden för att hitta förhållandet mellan de oberoende och beroende variablerna för att förutsäga resultatet. Den första polynomregressionsmodellen användes 1815 av Gergonne. Den används för att hitta den bästa passningslinjen med regressionslinjen för att förutsäga resultaten. Det finns många typer av regressionstekniker, polynomregression är en av dem. Innan du förstår detta är det lämpligt att ha korrekt kunskap om linjär regression, så det kommer att vara lätt att markera skillnaderna mellan dem.

Varför polynomregression?

  • Detta är en av regressionstekniken som används av proffsen för att förutsäga resultatet. Det definieras som förhållandet mellan de oberoende och beroende variablerna när den beroende variabeln är relaterad till den oberoende variabeln med en nth grad. Det kräver inte att förhållandet mellan beroende och oberoende variabler är linjära, så om linjen är en kurva än den kan ha någon polynomisk term.
  • Huvudskillnaden mellan linjär och polynom regression är att linjär regression kräver att de beroende och oberoende variablerna är linjärt relaterade medan detta bättre kan passa linjen om vi inkluderar någon högre grad till den oberoende variabla termen i ekvationen. Ekvationen för polynomregressionen med en nth grad kan skrivas som:

Y = b0 + a1x + a2x 2 + a3x 3 +…. anx n

  • Om vi ​​lägger till högre grader som kvadratisk, förvandlar den linjen till en kurva som bäst passar uppgifterna. Generellt används det när punkterna i datauppsättningen är spridda och den linjära modellen inte kan beskriva resultatet tydligt. Vi bör alltid hålla ett öga på Overfitting och Underfitting medan vi överväger dessa grader till ekvationen.
  • Det är bättre att ta hänsyn till graden som passerar genom alla datapunkter men ibland kan högre grad som 10 eller 20 passera genom alla datapunkter och minska felet men det fångar också upp bullret från de data som passar över modellen och det kan undvikas genom att lägga till fler prover i träningsdatauppsättningen. Så det är alltid lämpligt att välja en optimal grad som passar modellen.

Det finns två tekniker som används för att avgöra ekvationsgraden:

  • Val av framåt: Det är metoden att öka graden tills den är tillräckligt betydande för att definiera modellen.
  • Val bakåt: Det är metoden att minska graden tills den är tillräckligt betydande för att definiera modellen.

Förfarande för tillämpning av polynomregression

Vänligen hitta nedanstående steg eller procedur för att tillämpa polynomregression på alla datasätt:

Steg 1: Importera respektive dataset till valfri plattform (R eller Python) och installera de paket som krävs för att tillämpa modellen.

Steg 2: Dela upp datasatsen i tränings- och testuppsättningar så att vi kan tillämpa algoritmen på träningsdatauppsättningen och testa den med testdatauppsättningen.

Steg 3: Tillämpa förklarande dataanalysmetoder för att studera bakgrunden till data som medelvärde, median, läge, första kvartil, andra kvartil etc.

Steg 4: Använd den linjära regressionsalgoritmen på datasättet och studera modellen.

Steg 5: Använd den polynomiala regressionsalgoritmen på datasatsen och studera modellen för att jämföra resultaten antingen RMSE eller R-kvadrat mellan linjär regression och polynomregression.

Steg 6: Visualisera och förutsäga både resultaten av linjär och polynomregression och identifiera vilken modell som förutsäger datasatsen med bättre resultat.

Polynomregression använder

  • Det används i många experimentella förfaranden för att producera resultatet med hjälp av denna ekvation.
  • Det ger en stor definierad relation mellan de oberoende och beroende variablerna.
  • Det används för att studera sedimentens isotoper.
  • Det används för att studera ökningen av olika sjukdomar inom vilken befolkning som helst.
  • Det används för att studera genereringen av vilken syntes som helst.

Funktioner av polynomial regression

  • Det är en typ av olinjär regressionsmetod som berättar förhållandet mellan den oberoende och beroende variabeln när den beroende variabeln är relaterad till den oberoende variabeln i nth graden.
  • Den bästa passningslinjen bestäms av graden av den polynomiska regressionsekvationen.
  • Modellen härrörande från polynomregressionen påverkas av utläggarna, så det är alltid bättre att behandla utfallare innan algoritmen appliceras på datasättet.
  • Polynomialfeature () -funktionen konverteras till en funktion i matrisen beroende på ekvationsgraden.
  • Kurvens natur kan studeras eller visualiseras med hjälp av en enkel spridningsdiagram som ger dig en bättre uppfattning om linjäritetsförhållandet mellan variablerna och bestämmer därefter.

Slutsats

Polynomial regression används i många organisationer när de identifierar ett olinjärt samband mellan de oberoende och beroende variablerna. Det är en av de svåra regressionsteknikerna jämfört med andra regressionsmetoder, så att ha djupgående kunskap om tillvägagångssättet och algoritmen hjälper dig att uppnå bättre resultat.

Rekommenderade artiklar

Detta är en guide till ett polynomregression. Här diskuterar vi funktionerna och användningen av polynomial regression. Du kan också gå igenom våra andra artiklar som föreslås för att lära dig mer–

  1. SVM-algoritm
  2. Kärnmetoder
  3. LINST Excel-funktion
  4. Maskininlärningsalgoritmer
  5. Linjär regression vs logistisk regression | Topp skillnader

Kategori: