Power BI — Large Dataset Handling Techniques (Import, DirectQuery, Dual, Partitioning, Incremental Refresh) (Tamil)

 



இந்த வீடியோல நம்ம Power BI-ல Large Dataset Handling எப்படி செய்ய வேண்டும் என்று விவாதிப்போம்.
Power BI reports slow ஆகிறதா, memory சிக்கல்கள் இருக்கிறதா, refresh time மிக நீண்டு போவதா — இவற்றுக்கு காரணமான design choices-ஐ நாம புரிந்து கொண்டு சரியான storage mode, partitioning மற்றும் incremental refresh போன்ற techniques-ஐ practical examples உடன் போடறோம்.


🔍 இந்த வீடியோவில் நீங்கள் கற்றுக்கொள்ளவிருக்கீர்கள்

  • Import Mode vs DirectQuery vs Dual Mode — difference மற்றும் when to use each
  • எந்த storage mode எப்ப பயன்படுத்தணும்னு decision-making tips
  • Partitioning என்றால் என்ன; அது dataset performance-ஐ எப்படி boost பண்ணும்
  • Incremental Refresh setup எப்படி செய்ய வேண்டும் (basic steps & best practices)
  • Common mistakes & limitations when handling big datasets


Storage Modes — எது எதுக்காக?

1. Import Mode

  • Data model-ல data நம்ம local memory (VertiPaq)க்கு load ஆகும்.
  • Visuals super-fast, queries mostly in-memory.
  • சிறந்தது small-to-medium datasets அல்லது aggregated data-க்கு.
  • Cons: Big datasets உதவச்செய்யாது — memory requirement அதிகம்; refresh நேரம் நீண்டு போகும்.

2. Direct Query

  • Data எப்போதும் source-இலிருந்து query ஆகும்; data local-ல சேமிக்கப்படாது.
  • பெரிய datasets மற்றும் real-time requirements இருந்தா உபயோகபடுத்தலாம்.
  • Cons: Visuals slower ஆகலாம்; source system performance மட்டுமே நம்பிக்கையாக இருக்க வேண்டும்; DAX limitations இருக்கலாம்.

3. Dual Mode (Composite Model)

  • சில tables Import, சில tables Direct Query என்று mixed ஆக வைத்திருக்கலாம்.
  • Aggregation tables Import ஆக வைத்து detailed tables Direct Query வச்சு best of both worlds achieve பண்ணலாம்.
  • Use case: summary tables வேகமாக வேண்டும், detailed drill-through வேண்டும்னா.


Partitioning — dataset-ஐ சின்ன சின்ன பகுதியாக பிரிக்குவது

  • Partitioning என்பது ஒரு பெரிய table-ஐ பல partitions-ஆப் பிரிக்குறது (e.g., year/month level).
  • இது refresh time குறைக்க உதவும் — ஒரு partition மட்டும் refresh பண்ணி மற்றவை untouched இருக்கலாம்.
  • Power BI Premium/PPU environment-ல் partitioning support இருக்கு; Import mode datasets-க்கும் فائدா.
  • Partitioning-ஐ 잘 design பண்ணியாலே refresh parallelism, incremental refresh வசதிகள் நல்லா work ஆகும்.


Incremental Refresh — எப்படி மற்றும் ஏன்?

  • Incremental Refresh மூலம் எல்லா data-ஐ ஒவ்வொழுதும் reload பண்ணாமல், new or changed partitions மட்டும் refresh பண்ணலாம்.
  • Typical setup steps:

    Date column உருவாக்கு (e.g., OrderDate)
  • Power Query level-ல range parameters (RangeStart, RangeEnd) add பண்ணு
  • Power BI Desktop-ல table-க்கு Incremental Refresh policy apply பண்ணு (e.g., store 5 years, refresh last 1 month)
  • Benefits: Refresh time குறையும், gateway/network load குறையும், cost savings (especially big models).

Common mistakes & limitations

  • Automatic decision without measuring: முதலில் measurement இல்லாமா mode select பண்ணுவது. (Measure refresh times, query times, source capability first.)
  • All Import always: மிக பெரிய datasets-ஐ எல்லாம் import பண்ணுவது memory issues-க்கு cause ஆகும்.
  • Blind DirectQuery: source DB fast இல்லானா visuals தனி load ஆகும்.
  • Not using aggregations: large detailed tables-ஐ மட்டும் தனியாக வைத்திருக்கும்போதும் aggregations இல்லாமா performance பாதிக்கப்படும்.
  • Incorrect Incremental setup: RangeStart/RangeEnd parameters சரியாக அமைக்காமல் incremental fail ஆகலாம்.


Practical recommendations (Quick checklist)

  • Start with measuring dataset size, refresh time, query patterns.
  • If data fits memory comfortably and real-time not required → Import mode.
  • If dataset huge and source is optimized for queries → DirectQuery or Composite model.
  • Use aggregations & summary tables for frequent analytics.
  • Enable Incremental Refresh for large historical data (store long, refresh recent).
  • Partition where supported (Premium/PPU) for massive tables.
  • Monitor & test after changes — measure visual load times and refresh durations.


Business demo (what I showed in the video)

Video-ல நான் ஒரு retail/project dataset எடுத்துக் கொண்டு:

  • Import vs DirectQuery மாதிரி models build பண்ணி compare பண்ணினேன்.
  • Aggregation table add பண்ணி composite model-ல performance improvement demonstrate பண்ணினேன்.
  • Incremental Refresh setup basic demo மற்றும் partitioning concept explain பண்ணினேன்.


Large datasets handle பண்ணக்கூடிய சரியான approach-களை தேர்வு பண்ணினா Power BI reports நீங்கவே கவலைபடாமா துரிதமாக வேலை பண்ணும்.

Storage mode decision, partitioning, incremental refresh, aggregations — இவнера ஒரே நேரத்தில் சரியாக கட்டமைத்தால் performance, refresh time, and maintenance எல்லாம் improve ஆகும்.

வீடியோ முழு length-ல பாக்குங்க; practical demo-ல இருந்து உங்களுக்கு எது எப்படி செய்யணும் என்று தெளிவாக தெரியும். வீடியோ பிடிச்சிருந்தா channel-க்கு subscribe பண்ணுங்க — இன்னும் optimization episodes வருகிறோம்!




கருத்துரையிடுக

0 கருத்துகள்