Welcome to Scribd!

Skip carousel

Bigdata: What Is Pig?

Uploaded by

Karthikkumar

0% found this document useful (0 votes)

6 views16 pages

Hadoop_PIG

Original Title

Hadoop_PIG

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Hadoop_PIG

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

6 views16 pages

Bigdata: What Is Pig?

Uploaded by

Karthikkumar

Hadoop_PIG

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 16

Search inside document

BIGDATA

PIG
What is Pig?

 It is another hadoop framework for Non Java Developers

 It is using Pig Latin Language
 It is a data-flow language
 It is Intermediate language between java and hive
 Translates script to Map Reduce program under the hood
 Originally developed at Yahoo! (2007)
 PIG can eat anything that means it can handle structured and semi-structured

Why Pig?

 Map Reduce requires programmers.

 For pig only less programming
 No Java knowledge
 Development time is very less
 Can process any kind of data (structured, semi-structured, un-structured)
 good for Ad-hoc queries
 Extensible by UDF by Java , Python, Java script and Ruby

1 sairavi.bigdata@gmail.com
99520 29030
BIGDATA
Use case

 Suppose you have user data in one file, website data in another, and you need to find the top 5
most visited pages by users aged 18 - 25.

ETL
 Processing large amount of log data.
 Clean bad data.
Research of Raw data:
 User audit logs.
 Schema may be unknown or inconsistent.

2 sairavi.bigdata@gmail.com
99520 29030
BIGDATA

Pig Data Types

 Atom - A field is piece of data/A Simple variable format

 Example: Sai

 Tuple - Ordered set of fields. Tuple is represented by braces.

 Example: (Sai,20)

 Bag - Collection of tuples. Bag is represented by flower or curly braces.

 Example: {(1,2),(3,4)}

 Map – A set of Key Value Pairs. Map is represented in a square bracket. The # is used to
separate key and value.

 Example: [ ‘name’#’Ravi’, ‘age’#30]

3 sairavi.bigdata@gmail.com
99520 29030
BIGDATA
Pig Program Structure

Script

 Pig can run a script that contains pig commands. Example -->pig pig1.pig

Grunt

 Grunt is an interactive shell for running Pig Commands..

Embedded

 Embedded can run Pig programs from Java

Pig Execution mode:

Local mode

 Executes in single JVM

 Works exclusively on local system.

 There is no need of Hadoop or HDFS.

 This mode is generally used for testing purpose.

 pig -x local Sample_script.pig

Map/Reduce Mode

 In this mode, whenever we execute the Pig Latin statements to process the data, a MapReduce
job is invoked in the back-end to perform a particular operation on the data that exists in the
HDFS.

 pig -x mapreduce Sample_script.pig

4 sairavi.bigdata@gmail.com
99520 29030
BIGDATA

Pig Architecture

5 sairavi.bigdata@gmail.com
99520 29030
BIGDATA
Pig Latin Relational Operators

Loading and Storing

 LOAD

 STORE

 DUMP

Filtering

 FILTER

 DISTINCT

 FOREACH...GENERATE

 STREAM

Grouping and Joining

 JOIN

 COGROUP (groups the data in two or more relations)

 GROUP (groups the data in a single relation)

 CROSS - Creates the cross product of two or more relations

Sorting

 ORDER

 LIMIT

Combining and Splitting

 UNION (Combine two or more relation into one)

 SPLIT (Splits a relation into two or more )

6 sairavi.bigdata@gmail.com
99520 29030
BIGDATA

7 sairavi.bigdata@gmail.com
99520 29030
BIGDATA

8 sairavi.bigdata@gmail.com
99520 29030
BIGDATA

9 sairavi.bigdata@gmail.com
99520 29030
BIGDATA

10 sairavi.bigdata@gmail.com
99520 29030
BIGDATA

11 sairavi.bigdata@gmail.com
99520 29030
BIGDATA

12 sairavi.bigdata@gmail.com
99520 29030
BIGDATA

13 sairavi.bigdata@gmail.com
99520 29030
BIGDATA

14 sairavi.bigdata@gmail.com
99520 29030
BIGDATA

15 sairavi.bigdata@gmail.com
99520 29030
BIGDATA

16 sairavi.bigdata@gmail.com
99520 29030

Getting Started with Greenplum for Big Data Analytics
From Everand
Getting Started with Greenplum for Big Data Analytics
Gollapudi Sunila
No ratings yet
Learning Pandas 2.0: A Comprehensive Guide to Data Manipulation and Analysis for Data Scientists and Machine Learning Professionals
From Everand
Learning Pandas 2.0: A Comprehensive Guide to Data Manipulation and Analysis for Data Scientists and Machine Learning Professionals
Matthew Rosch
No ratings yet
S6 Understand
Document28 pages
S6 Understand
suhasshinde88
No ratings yet
14 Work With Big Data
Document74 pages
14 Work With Big Data
El inocente
No ratings yet
Map Reduce Concepts Explained
Document5 pages
Map Reduce Concepts Explained
Namma ooru
No ratings yet
Hadoopadministarrtion 190305091001
Document9 pages
Hadoopadministarrtion 190305091001
martinez
No ratings yet
Jigsaw Beginners Guide To Big Data 2014
Document36 pages
Jigsaw Beginners Guide To Big Data 2014
Karthik Roiyan
No ratings yet
3.SAP MII 12.2 + Plant Connectivity 2
Document37 pages
3.SAP MII 12.2 + Plant Connectivity 2
Sai Vellanki
No ratings yet
Bis Rmit Business Research Report
Document13 pages
Bis Rmit Business Research Report
SQisnvwnrc
No ratings yet
00 - 5-Day Bootcamp Curiculum
Document21 pages
00 - 5-Day Bootcamp Curiculum
John
No ratings yet
Sai - Spark Architecture
Document10 pages
Sai - Spark Architecture
Namma ooru
No ratings yet
PEGASUS Scope of Work
Document4 pages
PEGASUS Scope of Work
Joyel Dsouza
No ratings yet
GTD Todoist Sample LTR
Document11 pages
GTD Todoist Sample LTR
Scrib De
No ratings yet
Workshop On Big Data Analytics: Welcome To Rathinam Technical Campus & Rathinam Enthusia 2020
Document64 pages
Workshop On Big Data Analytics: Welcome To Rathinam Technical Campus & Rathinam Enthusia 2020
rammit2007
No ratings yet
GTD Microsoft Outlook Windows-EDIT
Document54 pages
GTD Microsoft Outlook Windows-EDIT
selçuk önder
No ratings yet
Research Paper On Pandas
Document5 pages
Research Paper On Pandas
cam5hkr3
100% (1)
Hadoop Interview Questions - HDFS
Document19 pages
Hadoop Interview Questions - HDFS
g17_ram
No ratings yet
Student Support Material For All Students - Class - XII - IP - 0
Document173 pages
Student Support Material For All Students - Class - XII - IP - 0
yashraj sikarwar
No ratings yet
Fast-Version-Control: Search Entire Site..
Document9 pages
Fast-Version-Control: Search Entire Site..
Awin
No ratings yet
Enterprise Architecture Designer
Document22 pages
Enterprise Architecture Designer
VENKAT
No ratings yet
12 SparkAggregatingData
Document47 pages
12 SparkAggregatingData
Petter P
No ratings yet
GTD Todoist LTR Compress
Document43 pages
GTD Todoist LTR Compress
teniarosetn
100% (2)
Prepared by Richa Btech (Cse) 6 Sem Dav University Jalandhar
Document30 pages
Prepared by Richa Btech (Cse) 6 Sem Dav University Jalandhar
Richa
No ratings yet
Daloradius manual guide
Document2 pages
Daloradius manual guide
Abraham Avila
No ratings yet
Big Data
Document63 pages
Big Data
Memes Instagram
No ratings yet
Cloud Big Data Online Training
Document22 pages
Cloud Big Data Online Training
giannis moraes
No ratings yet
DataStage Vs Informatica
Document3 pages
DataStage Vs Informatica
vkaturiLS
No ratings yet
Formato Condicional 1
Document95 pages
Formato Condicional 1
dieg
No ratings yet
GDG Details
Document34 pages
GDG Details
api-27095622
No ratings yet
PowerBI - AdvModeling - ClassSlides Attendee
Document161 pages
PowerBI - AdvModeling - ClassSlides Attendee
Mara Gomez
No ratings yet
Data Visualization Using Seaborn - Towards Data Science
Document31 pages
Data Visualization Using Seaborn - Towards Data Science
uda
No ratings yet
Unit 01
Document36 pages
Unit 01
BARATH
No ratings yet
GTD Series Part 7:getting Things Done® Using 2do For Iphone: Appigo Todo Action Lis
Document19 pages
GTD Series Part 7:getting Things Done® Using 2do For Iphone: Appigo Todo Action Lis
hansiscribd
No ratings yet
GETTING THINGS DONE Things Sample LETTER
Document11 pages
GETTING THINGS DONE Things Sample LETTER
Vikas Ruparelia
80% (5)
Druid Io
Document12 pages
Druid Io
dionisye
No ratings yet
Solutions: Week 2 Unit 1: SAP Big Data
Document51 pages
Solutions: Week 2 Unit 1: SAP Big Data
Rajeshvaramana Venkataramana
No ratings yet
Green Belt Analyse Phase
Document71 pages
Green Belt Analyse Phase
Aarav Mishra
No ratings yet
PHD Thesis Github
Document8 pages
PHD Thesis Github
fc2g5tmd
100% (2)
Am (131-140) Analisis Multinivel
Document10 pages
Am (131-140) Analisis Multinivel
maximal25
No ratings yet
Article1 How Big Is Big Data
Document5 pages
Article1 How Big Is Big Data
Ladines Clarisse
No ratings yet
Just Go With The Flow! With SAS® Data Integration Studio
Document16 pages
Just Go With The Flow! With SAS® Data Integration Studio
ryan maulana
No ratings yet
Nursery Plant Management
Document29 pages
Nursery Plant Management
Ferocis OG
No ratings yet
LINKEDIN Vs XING Vs GLASSDOOR
Document5 pages
LINKEDIN Vs XING Vs GLASSDOOR
Daksh Aneja
No ratings yet
SAP-TCodes Module MDM-EN
Document8 pages
SAP-TCodes Module MDM-EN
Mariya
No ratings yet
Big Data Analytics Platform Features
Document89 pages
Big Data Analytics Platform Features
SUNIDHI GARG
No ratings yet
Roland Berger Impact of ChatGPT 20230207
Document15 pages
Roland Berger Impact of ChatGPT 20230207
Haiyun Chen
No ratings yet
Several Projects, Including Iu60, And, After Approved, Then Ux62 and zv2
Document1 page
Several Projects, Including Iu60, And, After Approved, Then Ux62 and zv2
390942959
No ratings yet
Big Data
Document4 pages
Big Data
Pranshik Warrior
No ratings yet
PIG Interview Qusetions
Document15 pages
PIG Interview Qusetions
spsoftspsoft
No ratings yet
BIG DATA ANALYSIS
Document6 pages
BIG DATA ANALYSIS
shahab qureshi
No ratings yet
r-3-data
Document67 pages
r-3-data
dia
No ratings yet
DMBOK
Document32 pages
DMBOK
octoni
No ratings yet
Pig Exercise 1
Document10 pages
Pig Exercise 1
smitanair143
No ratings yet
Seminar Big Data Hadoop
Document28 pages
Seminar Big Data Hadoop
Moeenuddin
No ratings yet
Big Data: Internal
Document16 pages
Big Data: Internal
Hari Sampathirao
No ratings yet
Big Data: Submitted By-Rajashree Rashmita Reg - No-1825209016 Mca 4 Sem
Document27 pages
Big Data: Submitted By-Rajashree Rashmita Reg - No-1825209016 Mca 4 Sem
Rajsree Rasmita
No ratings yet
Command Line Git - Everything You Need To Know To Get Started
From Everand
Command Line Git - Everything You Need To Know To Get Started
Maksim Ivanov
No ratings yet
Monitoring Hadoop
From Everand
Monitoring Hadoop
Gurmukh Singh
No ratings yet
SAP Lumira Essentials
From Everand
SAP Lumira Essentials
Dmitry Anoshin
Rating: 4.5 out of 5 stars
4.5/5 (3)
Learning Tableau 2019 - Third Edition: Tools for Business Intelligence, data prep, and visual analytics, 3rd Edition
From Everand
Learning Tableau 2019 - Third Edition: Tools for Business Intelligence, data prep, and visual analytics, 3rd Edition
Joshua N. Milligan
No ratings yet
S4HANA IT L1 v8
Document23 pages
S4HANA IT L1 v8
rajankthomas
No ratings yet
Power House Rev2 Plan View
Document1 page
Power House Rev2 Plan View
Kelvin
No ratings yet
Trace Back
Document2 pages
Trace Back
palemerald
No ratings yet
SoftX3000 Technical Manual-System Description
Document115 pages
SoftX3000 Technical Manual-System Description
Soma Arun
No ratings yet
Dcs-932l Reva Releasenotes 1.10.03 en Us
Document4 pages
Dcs-932l Reva Releasenotes 1.10.03 en Us
arrw666
No ratings yet
Air Cooled HVAC BOQ
Document8 pages
Air Cooled HVAC BOQ
Designer Forever
100% (1)
Abu Dhabi - A Pictorial Souvenir
Document11 pages
Abu Dhabi - A Pictorial Souvenir
booksarabia
100% (1)
Vti Fpxploitation
Document52 pages
Vti Fpxploitation
Moshe Zioni
No ratings yet
Tekla Structural Detailing Expert with 10+ Years Experience
Document4 pages
Tekla Structural Detailing Expert with 10+ Years Experience
GeorgeEdward
0% (1)
Security Considerations For IEEE 802.15.4 Networks
Document11 pages
Security Considerations For IEEE 802.15.4 Networks
gabo2005
No ratings yet
Heating Systems for Pig Production
Document4 pages
Heating Systems for Pig Production
Gabriel Raica
No ratings yet
Anchor Bolt Requirements
Document15 pages
Anchor Bolt Requirements
shaimenne
No ratings yet
IA-32 Crash Dump Analysis Overview
Document47 pages
IA-32 Crash Dump Analysis Overview
achilles7
No ratings yet
Translation of Architecture, Production of Babel - Mark Wigley
Document17 pages
Translation of Architecture, Production of Babel - Mark Wigley
tadija5
No ratings yet
Manual Placa de Baza ASUS
Document64 pages
Manual Placa de Baza ASUS
hype22
No ratings yet
CIT 215 Intro To Programming Languages - 1 PDF
Document196 pages
CIT 215 Intro To Programming Languages - 1 PDF
justin onaga
No ratings yet
Analysis and Design of Shear Wall For An Earthquake Resistant Building Using ETABS
Document7 pages
Analysis and Design of Shear Wall For An Earthquake Resistant Building Using ETABS
IJIRST
No ratings yet
Talend DataIntegration Studio UG 6.0.1 en
Document652 pages
Talend DataIntegration Studio UG 6.0.1 en
sinanovic_ismar
100% (1)
Cafco FENDOLITE MII
Document8 pages
Cafco FENDOLITE MII
Nello
No ratings yet
Tutorial Socket Programming
Document30 pages
Tutorial Socket Programming
Saad Iqbal
No ratings yet
Fire Door Specifications
Document20 pages
Fire Door Specifications
Gopal
No ratings yet
Evolution of Urban Forms in India
Document10 pages
Evolution of Urban Forms in India
Mohana Ganesan
No ratings yet
Venkatarao Lella Resume
Document2 pages
Venkatarao Lella Resume
Sistla567
No ratings yet
Example. A Reinforced Concrete Spandrel Beam Has Overall Dimensions of 250 X 460 and Is Joined
Document4 pages
Example. A Reinforced Concrete Spandrel Beam Has Overall Dimensions of 250 X 460 and Is Joined
James Neo
No ratings yet
Pneumatic Structures
Document7 pages
Pneumatic Structures
Micah Europa
No ratings yet
Floating Load Calculation (Tributary Loading Method)
Document9 pages
Floating Load Calculation (Tributary Loading Method)
IDAMAKANTI JASWANTH REDDY
No ratings yet
Chapter 4 Hotel Reservation
Document61 pages
Chapter 4 Hotel Reservation
Eni Syafina Roslan
No ratings yet
Integral Bridge Design To EN 1992-2
Document58 pages
Integral Bridge Design To EN 1992-2
Dem Hasi
No ratings yet
2162 Mac Don
Document3 pages
2162 Mac Don
ladione
No ratings yet
Design of Rectangular Water Tank
Document212 pages
Design of Rectangular Water Tank
JEFFY JACOB
No ratings yet