Introduktion om Talend Tools

Talend open studio har mer än 700 komponenter inom områden som big data, databaser, moln, etc. Talend open studio kan delas in i många som Talend open studio for Data Integration och Talend open studio för big data, etc. I den här artikeln kommer att se de olika verktygen i talend i detalj.

Talend Open Studio Components / Tools

Talend Open Studio for Data Integration täcker följande områden / teknologier med några inbyggda komponenter som hjälper till att bearbeta enkelt.

  • Big Data-komponenter
  • Affärsdelar
  • Business Intelligence-komponenter
  • Molnkomponenter
  • Anpassade kodkomponenter
  • Komponenter för datakvalitet
  • Databaser - traditionella komponenter
  • Databaser - apparater / datalagerkomponenter
  • Databaser - andra komponenter
  • DotNET-komponenter
  • ELT-komponenter
  • ESB-komponenter
  • Filkomponenter
  • Internetkomponenter
  • Loggar & felkomponenter
  • Övriga gruppkomponenter
  • Orkestrationskomponenter
  • Bearbetning av komponenter
  • Systemkomponenter
  • Talend MDM-komponenter
  • Tekniska komponenter
  • XML-komponenter

Här kommer vi att diskutera några komponenter från Talend Open Studio for Data Integration.

1. tS3-anslutning: Den här komponenten används för anslutning med amazon s3. Komponenter kan använda den här anslutningen för enkel inställning av anslutning till amazon s3.

2. tS3Input: Detta används för att läsa en fil från S3-filsystemet. Den har vissa funktioner som liknar tfileinputdelimited men använder Amazon Simple Storage-tjänst.

3. tS3Output: Detta används för att skriva data till ett S3-filsystem. Den har vissa funktioner som liknar tfileoutputdelimited men använder Amazon Simple Storage-tjänst.

4. ts3Put: Detta används för att lägga in en fil i ett S3-filsystem från ett lokalt system.

5. ts3Get: Den här komponenten används för att hämta en fil från S3 till ett lokalt system.

6. tS3BucketCreate: Den här komponenten används för att skapa en hink på S3.

7. tS3BucketDelete: Den här komponenten används för att ta bort en hink på S3.

8. tS3BucketExist: Denna komponent används för att kontrollera om den givna hinken finns på S3. Det returnerar resultatet i sant eller falskt booleskt värde som kan användas som en global karta.

9. tS3BucketList: Den här komponenten används för att lista alla skopor på S3.

10. tS3Copy: Den här komponenten används för att kopiera S3-objektet från en hink till en annan hink. Det liknar tFileCopy.

11. tS3Delete: Den här komponenten används för att ta bort S3-objektet från en hink. Det liknar tFileDelete.

12. tS3Close: Den här komponenten används för att stänga S3-anslutningen som skapas med tS3Connection.

13. tCreateTemporaryFile: Denna komponent skapar en tillfällig fil som tFileOutputDelimited men denna tillfälliga fil kan antingen raderas automatiskt efter att jobbet är avslutat eller så kan det bevaras.

14. tFileArchive: Den här komponenten används för att skapa en komprimerad fil från en eller flera filer. Kryptering kan också tillämpas i komprimering.

15. tFileCompare: Den här komponenten används för att jämföra två filer och returnerar jämförelsedata.

16. tFileUnarchive: Den här komponenten används för att komprimera en zippad fil.

17. tFileCopy: Den här komponenten används för att kopiera en fil eller mapp till en målkatalog.

18. tFileDelete: Den här komponenten används för att ta bort en fil eller mapp.

19. tFileExist: Den här komponenten används för att kontrollera om en fil finns eller inte. Det returnerar resultatet i sant eller falskt booleskt värde som kan användas som global karta.

20. tFileInputExcel: Den här komponenten används för att läsa en Excel-fil baserad på det definierade schemat.

21. tMsgBox: Den här komponenten används för att visa en dialogruta med en OK-knapp.

22. tRowGenerator: Denna komponent används för att skapa valfritt antal rader med kolumner med specifika värden eller slumpmässiga värden. Det används mest för teständamål och för att skapa provtestfiler.

23. tIterateToFlow: Den används för att omvandla en lista över flöden till huvudflödet vilket betyder iterate-> rad-> main.

24. tFlowToIterate: Det används för att förvandla huvudflödet till en lista med flöden som betyder huvud-> rad-> iterat.

25. tLoop: Det används för att slinga en viss uppgift.

26. tReplicate: Det används för att replikera det inkommande schemat i två utgångsflöden.

27. tRunJob: Det används för att köra ett annat talendjobb inom det aktuella jobbet efter subjob ok.

28. tSleep: Det används för att göra jobbet utförande eller en viss subjob paus under en viss tid på några sekunder.

29. tWaitForFile: Den kommer att titta på en viss katalog och utlöser nästa komponent baserat på villkor.

30.tMysqlBulkExec: Den här komponenten används för att erbjuda vinster i prestanda när du utför Insert-operationerna i en Mysql-databas.

31. tMysqlClose: Den här komponenten används för att stänga mysql-anslutningen som skapas av tMysqlConnection.

32. tMysqlRow: Den här komponenten används för att köra SQL-frågan direkt på MySQL-databasen.

33. tMysqlTableList: Denna komponent används för att lista namnen på en tabell.

34. tMysqlColumnList: Denna komponent används för att iterera alla kolumner i en tabell.

35. tMysqlCommit: Den här komponenten används för att utföra ändringarna i Mysql-databasen.

36. tMysqlLastInsertId: Denna komponent används för att få det senaste insatta nyckelvärdet

37. tMysqlOutputBulk: Denna komponent används för att skriva en fil med kolumner baserade på avgränsaren

38. tMysqlOutputBulkExec: Den här komponenten används för att skriva en fil med kolumner baserade på avgränsaren och kör sedan filen i Mysql-databasen.

39. tContextLoad: Denna komponent används för att ladda värden i kontext från ett ingångsflöde. Kontextvariablerna bör skapas innan värdena laddas i kontextvariabler. Om kontextvariablerna inte skapas visar det en varning.

40. tHiveClose: Den här komponenten används för att stänga anslutningen som skapats med tHiveConnection.

41. tHiveConnection: Denna komponent används för att skapa en Hive-anslutning och kan återanvändas av andra Hive-komponenter.

42. tHiveRow: Den här komponenten används för att köra Hive-frågor direkt.

Slutsats

  • HDFS-komponenter kan ses i den öppna studion Talend för Big data.
  • thdfsinput, thdfsoutput är några av komponenterna och de liknar filkomponenter.
  • tHDFSInput - Läser fil som finns på ett givet Hadoop distribuerat filsystem (HDFS). Den har vissa funktioner som liknar tfileinputdelimited men använder ett Hadoop distribuerat filsystem.
  • tHDFSOutput- Skriver fil till Hadoop distribuerade filsystem (HDFS).
  • Den har vissa funktioner som liknar tfileoutputdelimited men använder ett Hadoop distribuerat filsystem.
  • tHDFSPut- Detta används för att lägga in en fil i HDFS-filsystem från ett lokalt system.
  • tHDFSGet- Den här komponenten som används för att hämta en fil från HDFS till ett lokalt system.

Rekommenderade artiklar

Detta är en guide till Talend Tools. Här diskuterar vi introduktionen och talend öppna studiokomponenter eller verktyg för dataintegration som inkluderar, tS3Connection, tS3Input, tS3Output och ts3Put, etc. Du kan också titta på följande artiklar för att lära dig mer -

  1. Talend Data Integration
  2. Gratis dataanalysverktyg
  3. Talend vs Mulesoft
  4. Typer av datavisualisering
  5. Datalagerdesign
  6. Typer och hanteringsfel i JavaScript
  7. Vad är dataintegration?

Kategori: