Data Engineering Studies
Data Engineering Studies
  • 88
  • 29 986
Apache Spark Deployment Modes
Spark runs in several modes, ranging from a single machine to a large-scale cluster of machines.
Offers three primary deployment modes
Client mode
Cluster mode
Local mode
#apachespark #dataengineering #pyspark
มุมมอง: 31

วีดีโอ

Apache Spark Architecture
มุมมอง 9714 วันที่ผ่านมา
Apache Spark Architecture #spark #pyspark #bigdata #dataengineering
Leetcode 62 - Unique Paths - Python Solution
มุมมอง 3828 วันที่ผ่านมา
In this video I solved the Leetcode 62 - Unique Paths using Python programming language. Refer the solution in the below link github.com/faitusjelinej/Algorithms/blob/main/62_Unique_Paths.py #leetcode #dataengineering #python
Leetcode 647 - Palindromic Substrings - Python Solution
มุมมอง 71หลายเดือนก่อน
In this video I solved the Leetcode 647 - Palindromic Substrings using Python programming language. Refer the solution in the below link github.com/faitusjelinej/Algorithms/blob/main/647_PalindromicSubstings.py
Leetcode 670 - Maximum Swap - Python Solution
มุมมอง 76หลายเดือนก่อน
In this video I solved the Leetcode 670 - Maximum Swap using Python programming language. Refer the solution in the below link github.com/faitusjelinej/Algorithms/blob/main/670MaximumSwap.py
Leetcode 243 - Shortest Word Distance - Python Solution
มุมมอง 136หลายเดือนก่อน
In this video I solved the Leetcode 243 - Shortest Word Distance using Python programming language. Refer the solution in the below link github.com/faitusjelinej/Algorithms/blob/main/243ShortestWordDistance.py
Leetcode 165 - Compare Version Numbers - Python Solution
มุมมอง 46หลายเดือนก่อน
In this video I solved the Leetcode 165 - Compare Version Numbers using Python programming language. Refer the solution in the below link github.com/faitusjelinej/Algorithms/blob/main/165_CompareVersionNumbers.py
Leetcode 844 Backspace String Compare - Python Solution
มุมมอง 812 หลายเดือนก่อน
In this video I solved the Leetcode Leetcode 844 Backspace String Compare using Python programming language. Refer the solution in the below link github.com/faitusjelinej/Algorithms/blob/main/844BackspaceStringCompare.py
Leetcode 150 Evaluate Reverse Polish Notation - Python Solution
มุมมอง 452 หลายเดือนก่อน
In this video I solved the Leetcode 150 Evaluate Reverse Polish Notation using Python programming language. Refer the solution in the below link github.com/faitusjelinej/Algorithms/blob/main/150_Evaluate_RPN.py
Join Strategies in Apache Spark
มุมมอง 1753 หลายเดือนก่อน
In this video, you will learn about the different Join Strategies in Apache Spark. Apache Spark has the following five algorithms to choose from 1. Broadcast Hash Join 2. Shuffle Hash Join 3. Shuffle Sort Merge Join 4. Broadcast Nested Loop Join 5. Cartesian Product Join
Azure SQL Managed Instance - Introduction
มุมมอง 754 หลายเดือนก่อน
Azure SQL Managed Instance - Introduction #azure #bigdata #azuretutorials #dataengineering
Leetcode 2053 Kth Distinct String in an Array - Python Solution
มุมมอง 314 หลายเดือนก่อน
In this video I solved the Leetcode 2053 Kth Distinct String in an Array using Python programming language. #dataengineering #leetcode #leetcodechallenge #leetcodethehardway #python
Leetcode 7 Reverse Integer - Python Solution
มุมมอง 1144 หลายเดือนก่อน
In this video I solved the Leetcode 7 Reverse Integer using Python programming language.
Schedule Trigger in Azure Pipelines
มุมมอง 794 หลายเดือนก่อน
This video provides detailed information about the schedule trigger and the steps to create, start, and monitor a Schedule Trigger in Azure Pipelines.
Unzip files, dynamically create folders and load files into respective folders using Azure Pipeline
มุมมอง 2334 หลายเดือนก่อน
Use Case: Unzip the files, dynamically create folders, and load the files into the respective folders using Azure Pipeline
Final Account Balance - SQL Interview Question
มุมมอง 444 หลายเดือนก่อน
Final Account Balance - SQL Interview Question
Dynamically ingest data from Azure SQL DB to Storage account using Azure Synapse Pipeline.
มุมมอง 1344 หลายเดือนก่อน
Dynamically ingest data from Azure SQL DB to Storage account using Azure Synapse Pipeline.
Azure DevOps - Introduction
มุมมอง 3055 หลายเดือนก่อน
Azure DevOps - Introduction
Data Processing with PySpark and SparkSQL
มุมมอง 2235 หลายเดือนก่อน
Data Processing with PySpark and SparkSQL
Nested forEach activity in Azure Data factory
มุมมอง 9975 หลายเดือนก่อน
Nested forEach activity in Azure Data factory
Leetcode 130 Surrounded Regions - Python Solution
มุมมอง 626 หลายเดือนก่อน
Leetcode 130 Surrounded Regions - Python Solution
Leetcode 64 Minimum Path Sum - Python Solution
มุมมอง 376 หลายเดือนก่อน
Leetcode 64 Minimum Path Sum - Python Solution
Leetcode 228 - Summary Ranges - Python Solution
มุมมอง 646 หลายเดือนก่อน
Leetcode 228 - Summary Ranges - Python Solution
Leetcode 205 - Isomorphic Strings - Python Solution
มุมมอง 866 หลายเดือนก่อน
Leetcode 205 - Isomorphic Strings - Python Solution
Leetcode 35 - Search Insert Position - Python Solution
มุมมอง 397 หลายเดือนก่อน
Leetcode 35 - Search Insert Position - Python Solution
Depth First Search (DFS) - Graph Traversal using Python
มุมมอง 387 หลายเดือนก่อน
Depth First Search (DFS) - Graph Traversal using Python
HackerRank - Decorators 2 - Name Directory - Python Solution
มุมมอง 2787 หลายเดือนก่อน
HackerRank - Decorators 2 - Name Directory - Python Solution
Leetcode 241 - Different Ways to Add Parentheses - Python Solution
มุมมอง 3718 หลายเดือนก่อน
Leetcode 241 - Different Ways to Add Parentheses - Python Solution
Tweets' Rolling Averages - SQL Interview Question
มุมมอง 768 หลายเดือนก่อน
Tweets' Rolling Averages - SQL Interview Question
Create Cosmos DB database, container, items and read items using Python
มุมมอง 3338 หลายเดือนก่อน
Create Cosmos DB database, container, items and read items using Python

ความคิดเห็น

  • @chandrasingh1184
    @chandrasingh1184 14 วันที่ผ่านมา

    Very simple and clear explanation

  • @chandrasingh1184
    @chandrasingh1184 หลายเดือนก่อน

    Very descriptive.

    • @dataenggstudies
      @dataenggstudies หลายเดือนก่อน

      Glad you found it helpful!

  • @chandrasingh1184
    @chandrasingh1184 หลายเดือนก่อน

    Nice

    • @dataenggstudies
      @dataenggstudies หลายเดือนก่อน

      Thanks, glad you liked it!

  • @Александр-ъ3о1щ
    @Александр-ъ3о1щ 2 หลายเดือนก่อน

    is it possible to add XML extension to pyspark-jupyter installation or is this extension only available for databrics?

    • @dataenggstudies
      @dataenggstudies 2 หลายเดือนก่อน

      To add XML extension to your PySpark-Jupyter installation, you'll need to install the spark-xml library. Open your Jupyter Notebook and run the following command !pip install spark-xml Now, you can use the library in your PySpark code

  • @serdalaslantas
    @serdalaslantas 3 หลายเดือนก่อน

    Hi, installling failed due to pemisssion deniel. It says permission denied! What am I doing wrong? Appreciate if you can help!

    • @dataenggstudies
      @dataenggstudies 2 หลายเดือนก่อน

      Run docker compose with sudo if you don't have permission sudo docker compose up

  • @Александр-ъ3о1щ
    @Александр-ъ3о1щ 3 หลายเดือนก่อน

    Hi! I can't to save file (csv from example) through dataframe.write into local docker folder. How I can deal with it?

    • @dataenggstudies
      @dataenggstudies 3 หลายเดือนก่อน

      I will get back on this shortly.

    • @Александр-ъ3о1щ
      @Александр-ъ3о1щ 3 หลายเดือนก่อน

      @@dataenggstudies thnx, I will be waiting!

    • @dataenggstudies
      @dataenggstudies 2 หลายเดือนก่อน

      Step 1: Mount a Volume When you run your Docker container, you need to mount a volume that will act as a bridge between the container's filesystem and your local filesystem. Step 2: Write the CSV File in Your Code Within your Python code running inside the Docker container, use the DataFrame's to_csv() method to write the CSV file to the mounted volume. df.to_csv("/path/in/container/your_file.csv", index=False) I will create a video on this steps.

  • @user-qv6dz8un5q
    @user-qv6dz8un5q 3 หลายเดือนก่อน

    the goat

  • @thanushsivasai9909
    @thanushsivasai9909 4 หลายเดือนก่อน

    Thanks!

  • @hasanrazashaikh421
    @hasanrazashaikh421 4 หลายเดือนก่อน

    thanks nice explanation

  • @chandrasingh1184
    @chandrasingh1184 4 หลายเดือนก่อน

    Useful

  • @midhunskani
    @midhunskani 4 หลายเดือนก่อน

    This is a very good and easy solution

    • @dataenggstudies
      @dataenggstudies 4 หลายเดือนก่อน

      Thank you. Glad it helped.

  • @vinoda3480
    @vinoda3480 4 หลายเดือนก่อน

    Need end to end project demo. Video

    • @dataenggstudies
      @dataenggstudies 4 หลายเดือนก่อน

      Glad it helped. Sure,thank you for the suggestion. I will work on end to end project demo. 👍

  • @hanpanBR
    @hanpanBR 4 หลายเดือนก่อน

    Thanks for the video! It was so simple and yet I was very confused till I got here.

  • @maureenwaitherero8373
    @maureenwaitherero8373 4 หลายเดือนก่อน

    Could you create tables in dedicated sql pool fro these files dynamically

    • @dataenggstudies
      @dataenggstudies 4 หลายเดือนก่อน

      Sure I will create a video for this scenario.

  • @HannekeDebie
    @HannekeDebie 4 หลายเดือนก่อน

    This was very helpful in getting my csv files into dataframes!

    • @dataenggstudies
      @dataenggstudies 4 หลายเดือนก่อน

      Glad it helped! Keep learning.

  • @saddamhussain9975
    @saddamhussain9975 5 หลายเดือนก่อน

    learn many things from this video...waiting for more videos

    • @dataenggstudies
      @dataenggstudies 5 หลายเดือนก่อน

      Good. Keep learning! I am glad it helped!

  • @julietruong2059
    @julietruong2059 5 หลายเดือนก่อน

    Really good explanation! Thanks for this!

    • @dataenggstudies
      @dataenggstudies 5 หลายเดือนก่อน

      You are welcome! Glad it helped.

  • @vinoda3480
    @vinoda3480 5 หลายเดือนก่อน

    Nice explanation. Expecting more videos like this. Requesting to do video how to load both files and SQL into azure folder using single dedicated pipeline.

    • @dataenggstudies
      @dataenggstudies 5 หลายเดือนก่อน

      Thanks for the idea! Noted. I will upload soon.

    • @RajashekharKumbar-gj8wz
      @RajashekharKumbar-gj8wz 4 หลายเดือนก่อน

      It can be one more approach for this senario using copy behavior

    • @dataenggstudies
      @dataenggstudies 4 หลายเดือนก่อน

      @@RajashekharKumbar-gj8wz you are correct.

  • @alayareddymeka7721
    @alayareddymeka7721 5 หลายเดือนก่อน

    Hello sir... Thank you for the solution.. can you please explain the same solution if XML file has varying nested data types

    • @dataenggstudies
      @dataenggstudies 5 หลายเดือนก่อน

      Sure. I will!

    • @alayareddymeka7721
      @alayareddymeka7721 5 หลายเดือนก่อน

      ​@@dataenggstudiesThank you...Also the nested data types may contain various depth level. So, flattening should be a dynamic logic. Is that possible?

    • @dataenggstudies
      @dataenggstudies 5 หลายเดือนก่อน

      Based on what I research dynamic flattening is not possible. I will share if I find any details

  • @Ajaybchaudhari
    @Ajaybchaudhari 5 หลายเดือนก่อน

    These videos are so helpful, simple yet so informative

  • @varmauppalapati7556
    @varmauppalapati7556 5 หลายเดือนก่อน

    thanks for the video bro, but local host 4040 is not working

    • @dataenggstudies
      @dataenggstudies 5 หลายเดือนก่อน

      Local host 4040 might have been already used by another application in your device. Try using a different port.

    • @varmauppalapati7556
      @varmauppalapati7556 5 หลายเดือนก่อน

      @@dataenggstudies have tried using different ports, it didn't work

    • @dataenggstudies
      @dataenggstudies 5 หลายเดือนก่อน

      @@varmauppalapati7556 Could you please share the error you are getting.

  • @aswathis5902
    @aswathis5902 5 หลายเดือนก่อน

    Tqqqq so much bro❤

  • @QuantizedFields
    @QuantizedFields 6 หลายเดือนก่อน

    I think you misspelled, as it should be a square of a number, not square-root of a number. But this is a very smart approach, thanks for sharing this work.

    • @dataenggstudies
      @dataenggstudies 6 หลายเดือนก่อน

      That is correct. Thank you for the correction. I am glad it help ❤

  • @supriyakushwaha21
    @supriyakushwaha21 6 หลายเดือนก่อน

    NICE EXPLAINATION.

  • @chandrasingh1184
    @chandrasingh1184 6 หลายเดือนก่อน

    Great

  • @MrMaiio123
    @MrMaiio123 6 หลายเดือนก่อน

    Great explanation! Thank you

  • @mnikhil8491
    @mnikhil8491 6 หลายเดือนก่อน

    thanks for the explanation .... it helped a lot..

  • @shatirdimag1011
    @shatirdimag1011 7 หลายเดือนก่อน

    Best solution thanks💯💯💯

  • @nitishrawat9391
    @nitishrawat9391 8 หลายเดือนก่อน

    Great to see clear instructions and simple approach

    • @dataenggstudies
      @dataenggstudies 7 หลายเดือนก่อน

      Glad it was helpful!

  • @manderb1684
    @manderb1684 8 หลายเดือนก่อน

    Amazing content , Thanks

  • @avilateresa1486
    @avilateresa1486 9 หลายเดือนก่อน

    Well explained, very interesting scenario!

  • @vinoda3480
    @vinoda3480 9 หลายเดือนก่อน

    Good Explanation. Expecting more scenarios from you

    • @dataenggstudies
      @dataenggstudies 9 หลายเดือนก่อน

      Thank you. I am glad it helped you!

  • @peterodedeyi3366
    @peterodedeyi3366 9 หลายเดือนก่อน

    Very straightforward and clear tutorial. Thank you, Joseph.

    • @dataenggstudies
      @dataenggstudies 9 หลายเดือนก่อน

      Glad it was helpful!

  • @dhp106
    @dhp106 9 หลายเดือนก่อน

    Can you demonstrate how to pgp encrypt a file in azure storage blob, using synapse notebooks where the public key is also in storage blob

    • @dataenggstudies
      @dataenggstudies 9 หลายเดือนก่อน

      Sure, I will, thank you for letting me know.

  • @prabhatgupta6415
    @prabhatgupta6415 10 หลายเดือนก่อน

    u can use unpivot functions

    • @dataenggstudies
      @dataenggstudies 10 หลายเดือนก่อน

      Yes looks like it is a new feature in spark version 3.4.0. Thank you for sharing. When recording this video this functionality was not available.

  • @tinashechinyati6823
    @tinashechinyati6823 10 หลายเดือนก่อน

    great content

    • @dataenggstudies
      @dataenggstudies 10 หลายเดือนก่อน

      Thank you. I am glad you liked.

  • @nikhilrothe3419
    @nikhilrothe3419 11 หลายเดือนก่อน

    Very helpful

    • @dataenggstudies
      @dataenggstudies 11 หลายเดือนก่อน

      Thank you. I am glad that it helped.

  • @vinoda3480
    @vinoda3480 11 หลายเดือนก่อน

    Good Content very much helpful. But please parameterize the target folder and Input folder

    • @dataenggstudies
      @dataenggstudies 11 หลายเดือนก่อน

      Thank you for the suggestion. I will incorporate in the upcoming videos.

  • @abduljaweed8131
    @abduljaweed8131 11 หลายเดือนก่อน

    Hi bro I have one scenario like i have a documents in cosmosdb for nosql and i want to create a pipeline to triggered it if certain value is updated in cosmosdb document like age=21then trigger the event and then perform some transformation using python and then send that changes to new cosmosdb container If you make one video on that scenario that could be great helpful

    • @dataenggstudies
      @dataenggstudies 11 หลายเดือนก่อน

      Sure, I will create a video for this scenario. Thank you for sharing

  • @lutherlusk2975
    @lutherlusk2975 11 หลายเดือนก่อน

    youre writing while inside for , doesnt that incrase the time complexity from n to m * n or something like that ?

    • @dataenggstudies
      @dataenggstudies 11 หลายเดือนก่อน

      This solution looks like O(n*m) but it is actually not because we are iterating over the while loop only for the numbers that are 'first' numbers, in other words the numbers that satisfy the condition (if n-1 not in nums:) not for all the numbers. Hence the time complexity is O(n).

  • @mrunknown69692
    @mrunknown69692 11 หลายเดือนก่อน

    bhai thanks for the python solution. there are not much resources available for dsa with python. keep going

    • @dataenggstudies
      @dataenggstudies 11 หลายเดือนก่อน

      Sure, I will upload more. Glad it helped.

  • @JosephGeorge-pt3hd
    @JosephGeorge-pt3hd ปีที่แล้ว

    Well done.thank you

  • @JosephGeorge-pt3hd
    @JosephGeorge-pt3hd ปีที่แล้ว

    Good informative. Keep it up

  • @JosephGeorge-pt3hd
    @JosephGeorge-pt3hd ปีที่แล้ว

    Well explained😊