Jak fungují agregační funkce v jazyku DAX

Jazyk DAX obsahuje celou řadu agregačních funkcí, jejichž používání je v případě jednoduchých výpočtů relativně intuitivní. V některých složitějších vzorcích, zejména pak pokud používáme agregační funkce v kontextu řádku, mohou být výsledky těchto funkcí překvapivé. V tomto příspěvku si proto na jednoduchých příkladech vysvětlíme, jak agregační funkce fungují.

K tomuto tématu je k dispozici také video:

(článek byl aktualizován 14. 2. 2026)

V příkladech budeme pracovat s velmi jednoduchým modelem, který má pouze tři tabulky.

Tabulka 'Sales' je faktová tabulka, která obsahuje informace o prodejích produktů. K této tabulce jsou pak připojeny dimenzní tabulky 'Product' a 'Date', pomocí kterých můžeme faktovou tabulku 'Sales' filtrovat.

Jak fungují agregační funkce

Mezi běžně používané agregační funkce v jazyku DAX patří funkce jako SUM(), COUNT(), DISTINCTCOUNT(), MAX(), MIN(), AVERAGE() a mnohé další. Všechny tyto funkce mají několik společných jmenovatelů. Jako argumenty uvedených funkcí můžeme používat pouze existující sloupce nahrané v modelu, a výsledkem těchto funkcí je vždy agregovaná hodnota z použitého sloupce. Způsob agregace je pak odvozen od názvu funkce. Jak si vysvětlíme později, všechny agregační funkce, které přijímají jeden argument ve formě sloupce nahraného v modelu, jsou pouze syntaktickou zkratkou pro pokročilejší agregační funkce.

Mezi agregační funkce totiž řadíme také funkce, ve kterých můžeme v prvním argumentu použít tabulku, a ve druhém argumentu výraz určený k agregaci. Mezi tyto funkce patří všechny funkce s X na konci v jejich názvu. Jedná se například o funkce SUMX(), COUNTX(), MAXX(), MINX(), AVERAGEX() atd.

V tomto příspěvku nebudeme rozebírat každou agregační funkci, protože význam a způsob použití těchto funkcí je dostupný v oficiální dokumentaci. My se zaměříme na něco, co se z oficiální dokumentace nedozvíme, a to jak se agregační funkce chovají v kontextu řádku a jak se chovají v kontextu filtru. Tato znalost je totiž základem pro jejich správné použití.

Protože se všechny agregační funkce chovají v kontextu řádku a v kontextu filtru stejně, zaměříme se pro zjednodušení pouze na dvě funkce, a to na funkci SUM() a SUMX(). Všechny popsané principy ale budou platit i pro ostatní agregační funkce. Rozdíl je pak pouze v typu agregace, podle toho, kterou funkci aktuálně potřebujeme použít.

Kompletní výpis všech agregačních funkcí je dostupný v oficiální dokumentaci. Příklady a vysvětlení některých vybraných DAX funkcí můžete najít v samostatných článcích na stránce DAX funkce.

Rozdíl mezi funkcí SUM a SUMX

Ačkoliv to při pohledu na syntaxi funkcí SUM() a SUMX() nemusí být úplně zřejmé, obě funkce fungují velmi podobně. Ve skutečnosti je totiž funkce SUM() pouze syntaktickou zkratkou pro funkci SUMX(). Uvažujme například následující měřítko, které bude vracet sumu za prodeje produktů v aktuálním kontextu vyhodnocení.

Měřítko:

Prodeje = SUM(Sales[Sales Amount])

Pomocí měřítka [Prodeje] sčítáme všechny hodnoty ze sloupce Sales[Sales Amount] dostupné v aktuálním kontextu vyhodnocení. Jak se chovají agregační funkce v kontextu řádku a v kontextu filtru si vysvětlíme později. Nejdříve si ale ukážeme druhou verzi měřítka [Prodeje], která bude vracet za všech okolností stejné hodnoty, nyní ale s použitím funkce SUMX().

Měřítko:

Prodeje (2) = SUMX(Sales, Sales[Sales Amount])

Pokud obě verze výpočtů vložíme do jakéhokoliv vizuálu s jakýmikoliv atributy, vždy budou vracet stejné výsledky.

Měřítko [Prodeje] i měřítko [Prodeje (2)] vrací stejné hodnoty, protože na pozadí je funkce SUM() vyhodnocena pomocí funkce SUMX(), stejným způsobem jak je znázorněno u měřítka [Prodeje (2)].

Rozdíl mezi funkcí SUM() a funkcí SUMX() je v tom, že pomocí funkce SUM() můžeme sčítat pouze hodnoty z jednoho konkrétního sloupce nahraného v modelu. Na druhou stranu, pomocí funkce SUMX() můžeme sčítat jakékoliv hodnoty nebo výrazy, které jsou vyhodnoceny v kontextu řádku tabulky zadané v prvním argumentu.

Pomocí funkce SUMX() tak můžeme tvořit pokročilejší výpočty. Například můžeme násobit hodnoty ze dvou nebo více sloupců, které pocházejí z tabulky zadané v prvním argumentu, a výsledky těchto mezivýpočtů následně sčítat. Dále, pomocí funkcí s X na konci můžeme agregovat také hodnoty ze sloupců, které jsou dostupné pouze v rámci DAX výpočtu, a nejsou nahrané přímo v tabulkách v modelu. Příklad takového výpočtu si ukážeme později.

Při rozhodování, zda použít funkci SUM() nebo funkci SUMX() pak platí jednoduché pravidlo. Pokud sčítáme hodnoty z jednoho sloupce, který je nahraný v existující tabulce v modelu, použijeme funkci SUM(), protože se jedná o jednodušší zápis než při použití funkce SUMX() pro stejný účel.

Pokud ale potřebujeme sečíst hodnoty, které jsou výsledkem nějakého výpočtu, použijeme funkci SUMX(). Tím se můžeme vyhnout neustálému přidávání počítaných sloupců s jednoduchými mezivýpočty do tabulek v modelu, což zná asi každý z nás, protože to je typická praxe v začátcích práce s jazykem DAX.

Protože je chování funkcí SUM() i SUMX() při agregaci hodnot z jednoho sloupce shodné, v další části příspěvku budeme pro zjednodušení pracovat pouze s funkcí SUM(). Detailnější informace o funkcích SUM() a SUMX(), včetně dalších příkladů můžete najít v samostatném příspěvku.

Agregační funkce v kontextu řádku

Všechny agregační funkce ignorují kontext řádku. Kontext řádku vzniká automaticky při vytvoření počítaného sloupce v existující tabulce v modelu, nebo programově v iteračních funkcích. Tuto vlastnost si můžeme znázornit právě na příkladu vytvoření počítaného sloupce, ve kterém budeme v tabulce 'Sales' sčítat hodnoty ze sloupce 'Sales'[Sales Amount].

Počítaný sloupec:

Součet prodejů = SUM(Sales[Sales Amount])

Nový počítaný sloupec vrací v každém řádku tabulky stejnou hodnotu, která odpovídá součtu všech hodnot ze sloupce 'Sales'[Sales Amount].

Důvod, proč vrací funkce SUM() součet všech hodnot ze sloupce 'Sales'[Sales Amount] najdeme v kontextu vyhodnocení.

Kontext vyhodnocení v počítaném sloupci je dán aktuálním kontextem řádku. Na druhou stranu, na výpočet v počítaném sloupci nepůsobí žádný kontext filtru. Protože agregační funkce ignorují kontext řádku a kontext filtru je v počítaném sloupci prázdný, funkce SUM() jednoduše sečte všechny hodnoty ze sloupce 'Sales'[Sales Amount].

Jiná situace ale nastane, pokud použijeme funkci SUM() v měřítku, které bude vyhodnoceno v reportu, ve kterém na výpočet běžně působí filtry z různých vizuálů.

Agregační funkce v kontextu filtru

Pro znázornění chování agregačních funkcí v kontextu filtru můžeme použít již dříve vytvořené měřítko [Prodeje], které má následující definici.

Měřítko:

Prodeje = SUM(Sales[Sales Amount])

V měřítku [Prodeje] používáme funkci SUM() pro sečtení všech hodnot ze sloupce 'Sales'[Sales Amount]. Jedná se o stejný výpočet, který jsme použili pro vytvoření počítaného sloupce 'Sales'[Součet prodejů], kde jsme mohli vidět, že výsledek tohoto počítaného sloupce byl v každém řádku tabulky stejný, a vracel součet za všechny hodnoty ze sloupce 'Sales'[Sales Amount].

Pokud měřítko [Prodeje] vložíme do vizuálu v reportu, a pokud na měřítko nebudou působit žádné filtry z řádků nebo os vizuálů nebo z panelu filtrů, výsledkem bude opět součet všech hodnot ze sloupce 'Sales'[Sales Amount].

Pokud přidáme do řádků použitého vizuálu hodnoty ze sloupce s kategoriemi produktů, měřítko [Prodeje] bude vyhodnoceno v kontextu filtru každé kategorie.

Funkce SUM() použitá v měřítku [Prodeje] je nyní vyhodnocena v kontextu filtru každé kategorie, a vrací proto sumu za prodeje pouze těch produktů, které patří do kategorie zobrazené v aktuálním řádku vizuálu. V řádku souhrnů Celkem již na funkci SUM() nepůsobí žádné filtry, a výsledek měřítka [Prodeje] v řádku souhrnů odpovídá opět součtu všech hodnot ze sloupce 'Sales'[Sales Amount]. Obdobným způsobem by na funkci SUM() působily také filtry z jiných vizuálů na aktuální stránce v reportu, například z Průřezů a podobně.

Pokud přidáme do reportu například vizuál Průřez s roky z kalendářní tabulky, a vybereme jeden rok, hodnoty měřítka [Prodeje] se opět změní.

Jak můžeme vidět na obrázku výše, tak měřítko [Prodeje] nyní vrací nižší hodnoty, než tomu bylo v reportu bez Průřezu s roky a vybraného roku 2020.

Nyní vrací měřítko [Prodeje] sumu za prodeje produktů v roce 2020 a pro aktuální kategorii produktů v aktuálním řádku vizuálu Matice. V řádků souhrnů Celkem působí na výpočet pouze filtr z Průřezu, a v tomto řádku tedy vidíme prodeje za celý rok 2020.

Velmi důležité je, zejména pokud s jazykem DAX začínáme, nezaměňovat pojem aktuální řádek ve vizuálu s kontextem řádku. Každý vizuál tvoří kontext filtru, který, v případě vizuálu Tabulka nebo Matice, může pocházet z aktuálního řádku vizuálu, ale jedná se stále o kontext filtru. Je jedno, zda použijeme vizuál Matice, Tabulka, nebo jakýkoliv graf atd. Každý bod vizuálu je tvořen souborem filtrů. Na druhou stranu, kontext řádku vzniká pouze v počítaných sloupcích nebo v programově v rámci iteračních funkcí, které můžeme přirozeně používat také v definici měřítka.

Agregační funkce a změna kontextu řádku na kontext filtru

Existují situace, kdy potřebujeme vyhodnotit agregační funkci v kontextu řádku způsobem, kdy hodnoty aktuálního řádku chceme použít jako filtr. K tomuto účelu se používá funkce CALCULATE() nebo CALCULATETABLE(). Prostřednictvím těchto dvou funkcí můžeme programově změnit kontext řádku na kontext filtru.

Změně kontextu řádku na kontext filtru jsou věnované samostatné příspěvky, Změna kontextu řádku na kontext filtru a Změna kontextu řádku na kontext filtru a na co si dát pozor.

V tomto příspěvku si pouze znázorníme efekt změny kontextu řádku na kontext filtru, bez detailů popsaných ve výše uvedených příspěvcích.

Uvažujme dimenzní tabulku 'Product', do které chceme přidat sloupec obsahující celkové částky za prodeje jednotlivých produktů.

Jak už jsme si řekli dříve, v počítaném sloupci je aktivní kontext řádku, který agregační funkce ignorují. Následující počítaný sloupec tak bude opět vracet celkovou částku prodejů za všechny produkty.

Počítaný sloupec:

Celkové prodeje = SUM(Sales[Sales Amount])

Výsledkem nového počítaného sloupce je stejná hodnota v každém řádku tabulky 'Product'.

Pokud ale funkci SUM() vložíme do funkce CALCULATE(), vyvoláme změnu kontextu řádku na kontext filtru.

Počítaný sloupec:

Prodeje produktu = CALCULATE(SUM(Sales[Sales Amount]))

Takto vytvořený počítaný sloupec již bude vracet sumu za prodeje aktuálního produktu v aktuálním řádku tabulky, protože funkce CALCULATE() vyvolá změnu kontextu řádku na kontext filtru, a díky tomu dojde k použití všech hodnot z každého sloupce v aktuálním řádku tabulky k zafiltrování modelu při vyhodnocení funkce SUM().

Stejného efektu pak dosáhneme použitím měřítka [Prodeje] v rámci počítaného sloupce, protože každé měřítko je na pozadí skrytě vyhodnoceno ve funkci CALCULATE(). Následující počítaný sloupec proto bude vracet také částku prodejů každého produktu v aktuálním řádku tabulky 'Product'.

Počítaný sloupec:

Prodeje produktu 2 = [Prodeje]

Výsledky nového počítaného sloupce můžeme vidět na následujícím obrázku.

Více informací o změně kontextu řádku na kontext filtru je k dispozici v samostatném příspěvku dostupném pod tímto odkazem.

Použití agregačních funkcí uvnitř iteračních funkcí

Asi nejčastější chyba při použití agregačních funkcí nastává, pokud tyto funkce používáme uvnitř iteračních funkcí. Většina iteračních funkcí funguje na podobném principu. Prvním argumentem iteračních funkcí je tabulka, za kterou následují jeden nebo více dalších argumentů, které jsou vyhodnoceny v kontextu řádku tabulky zadané v prvním argumentu. Kontext řádku ale agregační funkce ignorují.

Na následujícím obrázku je zachycen jednoduchý vizuál, s roky v řádcích a měřítkem [Prodeje] v hodnotách.

Uvažujme nyní situaci, kdy bychom chtěli získat nejvyšší prodeje uskutečněné v rámci jednoho dne. Abychom získali nejvyšší denní hodnotu prodejů, musíme pro každý rok v každém řádku vizuálu načíst všechny dny v daném roce, a řádek po řádku pro každý den zjistit denní prodeje, ze kterých následně vybereme nejvyšší hodnotu. První, nefunkční varianta takto popsaného výpočtu může vypadat například následovně.

Měřítko:

Nejvyšší denní prodeje (špatně) = 
VAR DnyAProdeje = 
    ADDCOLUMNS
    (
        VALUES('Date'[Date]),
        "@Prodeje",
        SUM(Sales[Sales Amount])
    )
VAR Vypocet = 
    MAXX
    (
        DnyAProdeje,
        [@Prodeje]
    )
RETURN
    Vypocet

Pokud nové měřítko vložíme do původního vizuálu matice, výsledek bude vypadat následovně.

Měřítko [Nejvyšší denní prodeje (špatně)] vrací stejné hodnoty jako měřítko [Prodeje], což určitě není očekávaný výsledek. Problém s měřítkem [Nejvyšší denní prodeje (špatně)] je v proměnné DnyAProdeje, ve které je virtuální tabulka se dvěma sloupci, kde v prvním sloupci budou dny dostupné v aktuálním kontextu vyhodnocení načtené pomocí funkce VALUES(), a ve druhém sloupci suma za prodeje produktů, tedy součet hodnot ze sloupce Sales[Sales Amount].

Problém ale je, že v takto vytvořené tabulce neuvidíme prodeje za aktuální den v aktuálním řádku tabulky vytvořené funkcí ADDCOLUMNS(), ale prodeje za všechny dny, protože funkce SUM() ignoruje kontext řádku vytvořený funkcí ADDCOLUMNS().

Pokud jsme například v řádku souhrnů celkem, první řádky virtuální tabulky v proměnné DnyAProdeje budou vypadat následovně.

V řádku s rokem 2017 budou první řádky virtuální tabulky v proměnné DnyAProdeje vypadat následovně.

Jak můžeme vidět, ve sloupci [@Prodeje] vidíme vždy stejné hodnoty, bez ohledu na aktuální den, protože funkce SUM() ignoruje kontext řádku, a reaguje pouze na kontext filtru, který je v našem případě v řádku souhrnů prázdný, a v řádcích s roky je tvořen aktuálním rokem.

Pokud bychom chtěli získat v každém řádku naší virtuální tabulky se dny prodeje za aktuální den, musíme změnit kontext řádku generovaný iterační funkcí ADDCOLUMNS() na kontext filtru, což jak už víme, můžeme udělat buď pomocí funkce CALCULATE() nebo použitím měřítka.

Jakmile dojde ke změně kontextu řádku na kontext filtru, funkce SUM() bude vyhodnocena nově také v kontextu filtru aktuálního dne.

Funkční definice měřítka [Nejvyšší denní prodeje] tak může vypadat například následovně.

Měřítko:

Nejvyšší denní prodeje = 
VAR DnyAProdeje = 
    ADDCOLUMNS
    (
        VALUES('Date'[Date]),
        "@Prodeje",
        CALCULATE(SUM(Sales[Sales Amount]))
    )
VAR Vypocet = 
    MAXX
    (
        DnyAProdeje,
        [@Prodeje]
    )
RETURN
    Vypocet

Stejného výsledku dosáhneme také použitím měřítka [Prodeje] ve třetím argumentu funkce ADDCOLUMNS(), protože každé měřítko implicitně mění kontext řádku na kontext filtru.

Měřítko:

Nejvyšší denní prodeje (2) = 
VAR DnyAProdeje = 
    ADDCOLUMNS
    (
        VALUES('Date'[Date]),
        "@Prodeje",
        [Prodeje]
    )
VAR Vypocet = 
    MAXX
    (
        DnyAProdeje,
        [@Prodeje]
    )
RETURN
    Vypocet

Pokud nová měřítka vložíme do vizuálu matice s roky v řádcích, uvidíme v obou případech stejné výsledky, a to nejvyšší denní prodeje v daném roce.

Pro úplnost, stejného výsledku můžeme dosáhnout i bez tvorby virtuální tabulky v proměnné DnyAProdeje.

Měřítko:

Nejvyšší denní prodeje (3) = 
MAXX
(
    VALUES('Date'[Date]),
    [Prodeje]
)

I zde ale platí, že druhý argument funkce MAXX() je vyhodnocen v kontextu řádku tabulky zadané v prvním argumentu, a pro správnou funkci musíme v tomto konkrétním měřítku vyvolat změnu kontextu řádku na kontext filtru, a to buď pomocí funkce CALCULATE(), nebo použitím měřítka [Prodeje].

Mezikrok s vytvořením virtuální tabulky v proměnné DnyAProdeje v předcházejících variantách výpočtů tedy nebyl nezbytně nutný. Tento postup byl ale použit z edukativních důvodů, abychom si mohli virtuální tabulku materializovat v rámci DAX dotazů a zobrazit si její obsah.

Shrnutí

Při používání agregačních funkcí musíme vždy přemýšlet o tom, v jakém kontextu bude vybraná funkce vyhodnocena. Všechny agregační funkce totiž ignorují kontext řádku, ale respektují kontext filtru. V pokročilejších výpočtech je pak zcela běžné, že v určité části výpočtu působí na konkrétní funkci jeden nebo více filtrů a jeden nebo více kontextů řádků současně. V těchto případech již vyžaduje pochopení chování jednotlivých funkcí určitou praxi. Relativně často také nastává situace, kdy potřebujeme v určité části výpočtu změnit kontext řádku na kontext filtru. K tomuto účelu pak můžeme použít funkci CALCULATE().

Stáhnout soubor s řešením.

č. 12

TKADLCIKPETR.cz

Prohledat tento blog

Jak fungují agregační funkce v jazyku DAX

Jak fungují agregační funkce

Rozdíl mezi funkcí SUM a SUMX

Agregační funkce v kontextu řádku

Agregační funkce v kontextu filtru

Agregační funkce a změna kontextu řádku na kontext filtru

Použití agregačních funkcí uvnitř iteračních funkcí

Komentáře

Okomentovat

Kam dále: