Descomplicando o Warehouse no Microsoft Fabric (Parte Teórica)

Microsoft Fabric: Data Warehouse vs Lakehouse vs KQL Database

Learn How to Become a Healthcare Data Analyst with This Guide

Live!🔴 เวียดนาม VS ไทย เชียร์สดฟุตบอลอุ่นเครื่อง FIFA DAY | 10 ก.ย. 67 #ทีมชาติไทย

ที่แท้ตำรวจ! รู้ตัวทีมฉุดสาวขี่ จยย.หนี | 9 ก.ย. 67 | ข่าวใหญ่ช่อง8

สาริกาลิ้นทอง - Paper Planes x โจอี้ ภูวศิษฐ์ (genie 100x100)「Official MV」

Desvendando a Ingestão de Dados no Microsoft Fabric com Apache Spark (Parte Prática)

Elemento Tecnologia e Desenvolvimento

มุมมอง 37

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 10 ก.ย. 2024
Neste vídeo, vou mostrar na prática como fazer a ingestão de dados usando um notebook Apache Spark dentro do Microsoft Fabric . Esta é uma ferramenta poderosa para processar grandes volumes de dados de forma eficiente.
Link do módulo na Microsoft:
learn.microsof...
Benefícios e Funcionalidades:
- Processamento Rápido: Apache Spark processa dados muito mais rápido que as ferramentas tradicionais.
- Análise em Tempo Real: Permite analisar dados em tempo real, essencial para decisões rápidas.
- Escalabilidade: Facilmente escalável para lidar com grandes quantidades de dados.
- Integração Simples: Integra-se facilmente com outras ferramentas e serviços do Microsoft Fabric.
Se você está começando e quer entender como essas ferramentas podem ajudar sua organização a lidar com dados de forma eficiente, este vídeo é para você!
Não se esqueça de se inscrever e deixar seu like!
Links extras:
learn.microsof...
#apachespark #microsoftfabric #dataengineering #dataprocessing #bigdata #análisededados #datascience
Código faltante no material da microsoft:
from pyspark.sql.functions import col, to_timestamp, current_timestamp, year, month
Read the parquet data from the specified path
raw_df = spark.read.parquet(output_parquet_path)
Add dataload_datetime column with current timestamp
opt_df = raw_df.withColumn("dataload_datetime", current_timestamp())
Filter columns to exclude any NULL values in storeAndFwdFlag
opt_df = opt_df.filter(opt_df["storeAndFwdFlag"].isNotNull())
Enable V-Order
spark.conf.set("spark.sql.parquet.vorder.enabled", "true")
Enable automatic Delta optimized write
spark.conf.set("spark.microsoft.delta.optimizeWrite.enabled", "true")
Load the filtered data into a Delta table
table_name = "yellow_taxi_opt" # New table name
opt_df.write.format("delta").mode("append").saveAsTable(table_name)
Display results
display(opt_df.limit(1))

ความคิดเห็น •

ต่อไป

เล่นอัตโนมัติ

Descomplicando o Warehouse no Microsoft Fabric (Parte Teórica)

Descomplicando o Warehouse no Microsoft Fabric (Parte Teórica)

Microsoft Fabric: Data Warehouse vs Lakehouse vs KQL Database

Microsoft Fabric: Data Warehouse vs Lakehouse vs KQL Database

Learn How to Become a Healthcare Data Analyst with This Guide

Learn How to Become a Healthcare Data Analyst with This Guide

Live!🔴 เวียดนาม VS ไทย เชียร์สดฟุตบอลอุ่นเครื่อง FIFA DAY | 10 ก.ย. 67 #ทีมชาติไทย

Live!🔴 เวียดนาม VS ไทย เชียร์สดฟุตบอลอุ่นเครื่อง FIFA DAY | 10 ก.ย. 67 #ทีมชาติไทย

ที่แท้ตำรวจ! รู้ตัวทีมฉุดสาวขี่ จยย.หนี | 9 ก.ย. 67 | ข่าวใหญ่ช่อง8

ที่แท้ตำรวจ! รู้ตัวทีมฉุดสาวขี่ จยย.หนี | 9 ก.ย. 67 | ข่าวใหญ่ช่อง8

สาริกาลิ้นทอง - Paper Planes x โจอี้ ภูวศิษฐ์ (genie 100x100)「Official MV」

สาริกาลิ้นทอง - Paper Planes x โจอี้ ภูวศิษฐ์ (genie 100x100)「Official MV」

เหมือนวิวาห์ (Rain Wedding) | Keng | DMD COVER

เหมือนวิวาห์ (Rain Wedding) | Keng | DMD COVER

Atualize Seus Relatórios Power BI com Eficiência e Rapidez

Atualize Seus Relatórios Power BI com Eficiência e Rapidez

Como conectar seu Azure DevOps com o Power BI📊📅

Como conectar seu Azure DevOps com o Power BI📊📅

Data pipeline vs Dataflow vs Shortcut vs Notebook in Microsoft Fabric

Data pipeline vs Dataflow vs Shortcut vs Notebook in Microsoft Fabric

Data Warehouse vs Data Lake vs Data Lakehouse

Data Warehouse vs Data Lake vs Data Lakehouse

Azure Data Factory, Azure Databricks, or Azure Synapse Analytics? When to use what.

Azure Data Factory, Azure Databricks, or Azure Synapse Analytics? When to use what.

From Power BI to Microsoft Fabric: your ULTIMATE transition guide (FULL SERIES)

From Power BI to Microsoft Fabric: your ULTIMATE transition guide (FULL SERIES)

Google vs IBM Data Analyst Certificate - Become a Data Analyst Fast

Google vs IBM Data Analyst Certificate - Become a Data Analyst Fast

Microsoft Dataverse Intro in 20 Minutes #Dataverse

Microsoft Dataverse Intro in 20 Minutes #Dataverse

Understanding OneLake within Microsoft Fabric

Understanding OneLake within Microsoft Fabric

Reaction บะหมี่คุณป้าNetflix คนเกาหลีต้องอึ้ง!!! | PEACH EAT LAEK

Reaction บะหมี่คุณป้าNetflix คนเกาหลีต้องอึ้ง!!! | PEACH EAT LAEK

สรุปงาน Apple Event 2024 เปิดตัว iPhone 16, Apple Watch Series 10, AirPods 4

สรุปงาน Apple Event 2024 เปิดตัว iPhone 16, Apple Watch Series 10, AirPods 4

สรุปหลังงานเปิดตัว iPhone 16 - ไม่ต้องแข่งกับใคร แข่งกับตัวเองก็พอ 🤨

สรุปหลังงานเปิดตัว iPhone 16 - ไม่ต้องแข่งกับใคร แข่งกับตัวเองก็พอ 🤨

คุณคะ แอดเสียอาการตามพี่มี่ค่ะ ดูไปยิ้มไปเฉยเลยอ่ะ แกรเค้าปลื้มกันนนน #ต่ายอรทัย #palmy #ปาล์มมี่

คุณคะ แอดเสียอาการตามพี่มี่ค่ะ ดูไปยิ้มไปเฉยเลยอ่ะ แกรเค้าปลื้มกันนนน #ต่ายอรทัย #palmy #ปาล์มมี่

เด็กคนนี้เอาเกมมาอวด

เด็กคนนี้เอาเกมมาอวด

irl stream in Thailand 🇹🇭

irl stream in Thailand 🇹🇭

เตรียมรับเงินดิจิทัลงวดแรก : ขีดเส้นใต้เมืองไทย | 10 ก.ย. 67 | ข่าวเที่ยงไทยรัฐ

เตรียมรับเงินดิจิทัลงวดแรก : ขีดเส้นใต้เมืองไทย | 10 ก.ย. 67 | ข่าวเที่ยงไทยรัฐ

จบกันกามิน ลำบากหนักเมื่อไร้ แน็กชาลี

จบกันกามิน ลำบากหนักเมื่อไร้ แน็กชาลี