IPL Data Analysis | Apache Spark End-To-End Data Engineering Project

แชร์
ฝัง
  • เผยแพร่เมื่อ 24 ก.ค. 2024
  • Enroll in the Apache Spark Course Here - datavidhya.com/courses/apache
    USE CODE: EARLYSPARK for 50% off
    ➡️ Combo Package Python + SQL + Data warehouse (Snowflake) + Apache Spark: com.rpy.club/pdp/yYnEMzLOX?pl...
    USE CODE: COMBO50 for 50% off
    In this video, we are going to analyze IPL data by building a data pipeline, main focus of this video is to focus on writing Apache Spark code and different functions to perform transformation,
    Code used in the video: github.com/darshilparmar/ipl-...
    Dataset Link - data.world/raghu543/ipl-data-...
    Timestamps
    0:00 Introduction
    0:31 Architecture Diagram and Spark Basic Concepts
    13:26 Understand the Dataset
    21:07 Complete Project Execution
    01:18:32 Final Words
    👦🏻 My Linkedin - / darshil-parmar
    📷 Instagram - / datawithdarshil
    🎯Twitter - / parmardarshil07
    🌟 Please leave a LIKE ❤️ and SUBSCRIBE for more AMAZING content! 🌟
    3 Books You Should Read
    📈Principles: Life and Work: amzn.to/3HQJDyP
    👀Deep Work: amzn.to/3IParkk
    💼Rework: amzn.to/3HW981O
    Tech I use every day
    💻MacBook Pro M1: amzn.to/3CiFVwC
    📺LG 22 Inch Monitor: amzn.to/3zk0Dts
    🎥Sony ZV1: amzn.to/3hRpSMJ
    🎙Maono AU-A04: amzn.to/3Bnu53n
    ⽴Tripod Stand: amzn.to/3tA7hu7
    🔅Osaka Ring Light and Stand: amzn.to/3MtLAEG
    🎧Sony WH-1000XM4 Headphone: amzn.to/3sM4sXS
    🖱Zebronics Zeb-War Keyboard and Mouse: amzn.to/3zeF1yq
    💺CELLBELL C104 Office Chair: amzn.to/3IRpiL2
    👉Data Engineering Complete Roadmap: • Data Engineer Complete...
    👉Data Engineering Project Series: • Data Engineering Proje...
    👉Become Full-Time Freelancer: • Best Freelancer Series...
    👉Data With Darshil Podcast: • Podcast Series - Data ...
    ✨ Tags ✨
    ✨ Hashtags ✨
    #dataengineering #apachespark #databricks

ความคิดเห็น • 117

  • @DarshilParmar
    @DarshilParmar  3 หลายเดือนก่อน +11

    LIKE LIKE LIKE LIKE!!!!!
    Interested in Learning Apache Spark in-depth with Databricks, I have created a detailed course here: datavidhya.com/courses/apache
    You can directly enroll in the best combo package Python, + SQL + Data Warehouse Snowflake + Apache Spark with Databricks
    Get it here: Combo Package: com.rpy.club/pdp/yYnEMzLOX?plan=6607b619c69cf00b7b934479…
    USE CODE: COMBO50 for 50% off

    • @abhishekbatham5588
      @abhishekbatham5588 7 วันที่ผ่านมา

      Can you create a weither analising with python please provide that want to learn

  • @kunal4557
    @kunal4557 2 หลายเดือนก่อน +3

    I am so relieved that there is someone who depicts a “complete” pipeline for projects that are not just real-world but also easy to comprehend, without loosing their innate complexity. Thanks alot for your contribution

  • @shrutijain1628
    @shrutijain1628 2 หลายเดือนก่อน +2

    Such an amazing project to learn Apache Spark with Databricks! I learned so much, and the clarity of concepts was incredible. Thank you so much, Darshil!
    Totally going for your Combo Course!! 🙌

  • @TamizhanTrend
    @TamizhanTrend 3 หลายเดือนก่อน

    Amazing... This architecture is applied in more real-time projects

  • @phanindrarao881
    @phanindrarao881 2 หลายเดือนก่อน

    Hi @DarshilParmar thank you for all these videos. It's too good!!!!. I am a beginner, I really love it. I just started yesterday. You never let me blink my eye.

  • @muhammadhaseeb229
    @muhammadhaseeb229 หลายเดือนก่อน +1

    Wow, this video is incredibly informative! I really appreciate how clearly it explains complex concepts. The visuals are engaging and make it easy to follow along. I'm excited to dive deeper into Spark after watching this. Keep up the great work!

  • @AsHiShChAuHaN-yd7dn
    @AsHiShChAuHaN-yd7dn 3 หลายเดือนก่อน +1

    A very good project in a small project alot of learning ,this is called project based learning ❤🎉

  • @Moon01-ru5my
    @Moon01-ru5my 29 วันที่ผ่านมา +3

    If youve done Sql very well then all you need here is just learning the few syntax differences in spark and Sql.

  • @kanhashukla6265
    @kanhashukla6265 2 หลายเดือนก่อน

    Thanks a lot man. Much needed video.

  • @sayemhaque6737
    @sayemhaque6737 2 หลายเดือนก่อน

    I just love all your videos. Take love from Bangladesh❤

  • @tesseract_d
    @tesseract_d หลายเดือนก่อน

    Thanks Darshil this was very imformative and a Good learning Project journey for me as Data Engineer! Kudos please keep posting such Projects!

  • @munnieswaroop
    @munnieswaroop 3 หลายเดือนก่อน

    Wonderful insights into the Spark, never got distracted and fully engaging.

  • @snehalthorat9416
    @snehalthorat9416 17 วันที่ผ่านมา

    Great explaination!! Thank you.

  • @user-ue8ut8uu2g
    @user-ue8ut8uu2g 3 หลายเดือนก่อน

    Loved the Project Darshil Bhaiya
    I'm a Beginner and I'm loving it

  • @bharathbn9225
    @bharathbn9225 2 หลายเดือนก่อน

    thankyou Darshil

  • @TrainWithShubham
    @TrainWithShubham 3 หลายเดือนก่อน +3

    Amazing work Darshil bhai
    Loved the project

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      Thank you so much 😀

  • @aritra1414
    @aritra1414 3 หลายเดือนก่อน

    This was a nice project. Thanks!

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      Glad you liked it!

  • @moheezawan8011
    @moheezawan8011 3 หลายเดือนก่อน

    Right video at right time. Thanks @darshil bai🤩

  • @adityajha2054
    @adityajha2054 3 หลายเดือนก่อน +1

    Now this is what data enthusiasts need most people build the project directly on power bi or SQL without giving complete understanding.

  • @RahulBaghel-ib4lz
    @RahulBaghel-ib4lz 3 หลายเดือนก่อน

    its a great project!

  • @souvik5560
    @souvik5560 3 หลายเดือนก่อน

    Great initiative . Thank you so much.
    Please take care of the audio. It's too low !!

  • @vamshipula8367
    @vamshipula8367 3 หลายเดือนก่อน

    Thank you bro❤

  • @Kings07.
    @Kings07. 3 หลายเดือนก่อน +3

    one thing in your explanation i observed is you are crisp and right to the point interms of explanation sir....if you ask me to explain analytically ...more value delivered in the least amount of time without any deviation.....great work sir... will learn more from you

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      Thank you very much :)

  • @CaptionThisChallenge_
    @CaptionThisChallenge_ 17 ชั่วโมงที่ผ่านมา

    Amazing!

  • @pradeesh2031
    @pradeesh2031 2 หลายเดือนก่อน

    Wonderful video

  • @user-zm1ng8zh6r
    @user-zm1ng8zh6r 3 หลายเดือนก่อน

    Amazing content

  • @pavanparvathanenii4471
    @pavanparvathanenii4471 3 หลายเดือนก่อน

    Amazing content as usual.

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      Much appreciated!

  • @daminigupta1
    @daminigupta1 2 หลายเดือนก่อน

    We can do the same thing in sql as well. Why to use spark?

  • @TalhaKhan-1996
    @TalhaKhan-1996 3 หลายเดือนก่อน

    Is Amazon s3 used for data modelling?

  • @sukritisachan5773
    @sukritisachan5773 2 หลายเดือนก่อน

    How can we round off pin pyspark(liek if I want to round off a value to two decimal places) how is that possible?

  • @syedhashir5014
    @syedhashir5014 2 หลายเดือนก่อน +1

    56:57
    correction
    when (col("batting_hand").contains("Left"), "Left-Handed").otherwise ("Right-Handed")

  • @jeevanmegavath9370
    @jeevanmegavath9370 3 หลายเดือนก่อน

    Bro, could you please provide us this obsidian whole notes link for this project……..

  • @BishanTamang-rk5ji
    @BishanTamang-rk5ji 3 หลายเดือนก่อน

    Thank you brother ❤❤ love from Nepal 💗💗

  • @hafizadeelarif3415
    @hafizadeelarif3415 3 หลายเดือนก่อน

    Hi Sir
    How are you?
    Sir, it is possible to fetch datasets from Kaggle using Azure Data Factory.?
    with azure function
    it is possible. Here's how?

  • @fbravoc9748
    @fbravoc9748 2 หลายเดือนก่อน

    Hello, really nice videos. I really like how you teach, and I am interested in starting the spark databricks course. I have knowledge of SQL and Python but no previous knowledge of Snowflake. Can I still do the spark and databricks course without snowflake??

  • @user-wk2xy2vo6w
    @user-wk2xy2vo6w 3 หลายเดือนก่อน +1

    how to get a data enginner internship and how much do i get to know for internship ?

  • @sateeshkumar2698
    @sateeshkumar2698 2 หลายเดือนก่อน

    Hi Darshil, Can i get a notes for python if i buy course, please answer

  • @Santhosh-jk7nm
    @Santhosh-jk7nm 3 หลายเดือนก่อน

    Nice work brother

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      Thank you! Cheers!

  • @ranjansrivastava9256
    @ranjansrivastava9256 3 หลายเดือนก่อน

    Hi Darshil, Could you please share your Data Vidhya Notes as a pdf. While enrolling it's asking more amount. Please help me on this. Excellent video.

  • @shivamchandan50
    @shivamchandan50 2 หลายเดือนก่อน

    Plz create video on pyspark unittesting and debugging

  • @AmanKumar-sr5wj
    @AmanKumar-sr5wj 3 หลายเดือนก่อน +1

    How much python is needed ?
    I am just starting 🙏

  • @Abhijitdelhi
    @Abhijitdelhi 2 หลายเดือนก่อน

    how can i use your bucket??

  • @selmibilel2994
    @selmibilel2994 17 วันที่ผ่านมา

    How can i create an aws account without a credit card please reply

  • @anupamkumarsinha0
    @anupamkumarsinha0 3 หลายเดือนก่อน

    Bhai aap kha rhte ho milna h aapse

  • @joseluisdominguez8687
    @joseluisdominguez8687 3 หลายเดือนก่อน +1

    Nice video!!, what is the software you're using in your iPad for this presentation?

  • @pritamkabiraj7691
    @pritamkabiraj7691 2 หลายเดือนก่อน

    Date columns are appearing as null.
    BoolType columns are also appearing as null.
    Can you resolve that?

  • @gautamagrawal9279
    @gautamagrawal9279 2 หลายเดือนก่อน

    how do i create a account if i am still a student

  • @cittafactshow
    @cittafactshow 2 หลายเดือนก่อน +4

    Bhaiya your courses are too expensive I also want to learn can you take down the price of the combo package course......pls....!!!!

  • @rajanthakur6586
    @rajanthakur6586 หลายเดือนก่อน

    can you provide me your s3 bucket url of ipl analysis so i can use in my project, because i donot have aws account

  • @lisitashamatutu1140
    @lisitashamatutu1140 3 หลายเดือนก่อน

    Hi Darshil, thanks for the insightful videos, is it okay to use Macbook Air for data engineering?

  • @atharvadumre2502
    @atharvadumre2502 3 หลายเดือนก่อน

    Bro in Olympic data analysis config code in data bricks gave me error saying null value exception

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน +1

      Issue might be with keys, lot of people copy secretID but you need to copy SecretValue

  • @adilmajeed8439
    @adilmajeed8439 3 หลายเดือนก่อน +1

    Thanks for sharing such a lovely course on EDA using Apache Spark.
    Please could you correct the code at 56:13 where the "batting_hand" contains "left" rather it should be "Left" as the batting_hand column contains like "Left-xxxxx".

    • @adilmajeed8439
      @adilmajeed8439 2 หลายเดือนก่อน

      @DarshilPamar Thanks again for sharing the project along with the solution. I was able to convert the same project to Microsoft Fabric. Lots of learning ...

  • @devmanimaurya
    @devmanimaurya 2 หลายเดือนก่อน

    Hii.. Is there any way to contact you?

  • @karthiksundaram544
    @karthiksundaram544 10 วันที่ผ่านมา

  • @RaghulS-nl6wx
    @RaghulS-nl6wx 2 หลายเดือนก่อน

    can i make this project using jupyter notebook as well or there any particular reason for using Databricks (just asking) ?

    • @DarshilParmar
      @DarshilParmar  2 หลายเดือนก่อน

      You can, you need to configure spark with jupyter notebook

  • @giridharbasanaboina
    @giridharbasanaboina 3 หลายเดือนก่อน

    I loved your content thanks for sharing and I confused to choose which database is good MySQL or PostgreSQL to learn. Can Anyone suggest me

    • @aviatorifeanyi4239
      @aviatorifeanyi4239 3 หลายเดือนก่อน

      I will recommend PostgreSQL, MySQL is also cool. Little difference in syntax between the two

  • @BigDataEngineerSchool
    @BigDataEngineerSchool 2 หลายเดือนก่อน

    Hey @DarshilParmar,
    I didnt get why you consider only 'run_scored'
    column while calculate
    #Aggregation :Calculate the total and avg runs
    scored in each match and inning.
    In our dataframe, 'ball_by_ball_df', we record details like this:
    1. When a bowler bowls a no-ball and the batsman scores 4 runs on that ball, it results in a 'run_scored' entry of (4) and an 'extra_runs' entry of (1) in the respective columns.
    2. If a bowler bows wide, it's marked as (0) in the 'run_scored' column and (1) in the 'extra_runs' column.
    Now, when calculating the total runs for a match and innings, we need to add up both the 'run_scored' and 'extra_runs' columns to get the accurate total."

    • @DarshilParmar
      @DarshilParmar  2 หลายเดือนก่อน +3

      I kept saying in the video, goal of the video is not to get business logic right but to teach how to use tech

    • @BigDataEngineerSchool
      @BigDataEngineerSchool 2 หลายเดือนก่อน

      @@DarshilParmar Ya I forget..thanks to rply❤❤

  • @akshaydubey.57.a75
    @akshaydubey.57.a75 3 หลายเดือนก่อน

    how to copy address of the ball_by_ball table from dataset ?

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      Just use s3 path

  • @sandhyaejji9025
    @sandhyaejji9025 3 หลายเดือนก่อน

    @ Darshil Parmar Thank you. As a fresher, Can I try the jobs in the data engineering field in USA?

  • @potatofarmer2099
    @potatofarmer2099 2 หลายเดือนก่อน

    Once you’ve built a portfolio project, how do you store and present it?

  • @techxball
    @techxball 21 วันที่ผ่านมา

    What do you use to build the Architecture Diagrams?

    • @DarshilParmar
      @DarshilParmar  21 วันที่ผ่านมา +1

      Google Slides

    • @techxball
      @techxball 21 วันที่ผ่านมา

      @@DarshilParmar Thank you

  • @MuhammedSavadkv
    @MuhammedSavadkv 3 หลายเดือนก่อน

    Great
    Thank you

  • @RishiRajxtrim
    @RishiRajxtrim 3 หลายเดือนก่อน

    👍

  • @KVenomPoison
    @KVenomPoison 3 หลายเดือนก่อน

    Spark isnt distributed rather than parallel?

  • @arunramanathan8214
    @arunramanathan8214 3 หลายเดือนก่อน

    Can we replicate this project in GCP entirely? Please advice Darshil.

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      Yes use GCS, DataProc, BigQuery

  • @nomannazir4579
    @nomannazir4579 3 หลายเดือนก่อน

    Do we have its source code available?

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      Check description

  • @adityatomar9820
    @adityatomar9820 3 หลายเดือนก่อน

    Hey Im getting error while reading form s3

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      What's the error?

    • @adityatomar9820
      @adityatomar9820 3 หลายเดือนก่อน

      @@DarshilParmar hey , I solved it ! It was access denied error...made my bucket public and it works now🤗

  • @ayxxnshxrif
    @ayxxnshxrif 3 หลายเดือนก่อน

    this looksk like a basic projects i dont think this is enought ot put it in resume!

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      You can never put TH-cam projects on resume, 100k+ people do these project do you think you can stand out by doing these project?
      These projects are for learning and upskilling, only project you put in your resume is something that you create by yourself

  • @yahyashaikhworld
    @yahyashaikhworld หลายเดือนก่อน

    Why Having Count is > 120

  • @AmanKumar-sr5wj
    @AmanKumar-sr5wj 3 หลายเดือนก่อน +1

    Math bhi kuch Ani chiye ka ? 🤔

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      Basic college level

  • @avinash7003
    @avinash7003 3 หลายเดือนก่อน

    bring Airflow course

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      Next on the pipeline

  • @sateeshkumar2698
    @sateeshkumar2698 3 หลายเดือนก่อน

    Can you please share your notes?

    • @DarshilParmar
      @DarshilParmar  3 หลายเดือนก่อน

      Notes are part of my courses, internal document, used in video to explain basic stuff

    • @sateeshkumar2698
      @sateeshkumar2698 3 หลายเดือนก่อน

      @@DarshilParmar Oh ok, If possible can you sell notes alone please

    • @phaddu7737
      @phaddu7737 3 หลายเดือนก่อน

      @@DarshilParmar Hey, interested in the standalone Python course Darshil. Discounts coming any time soon.

    • @sateeshkumar2698
      @sateeshkumar2698 2 หลายเดือนก่อน

      Mr also bro, are u purchased?​@@phaddu7737

  • @noob_2377
    @noob_2377 3 หลายเดือนก่อน +1

    First comment 🎉❤

  • @iampiyushparida7
    @iampiyushparida7 3 หลายเดือนก่อน

    DARSHIL = 7 letters #Thalaforareason