středa 26. února 2014

Aféra Big Data - odhalení (retail)

Potenciální využití big data v retail segmentu

Úvod

V retailu jsem již před nějakým časem tvořil datový sklad pro jeden velký řetězec. Protože už to je hodně let zpět, oživil jsme trošku své paměťové buňky a zkusil dát dohromady, a pobavil se i s pár zajímavými lidmi a níže uvádím oblasti, kde vidím potenciál využití big data pro retailové řetězce. V dalším textu se snažím o srozumitelnost i pro čtenáře, kteří jsou spíše kupujícími. Předem upozorňuji, že nejsem expert na procesy retailu, resp. je to už delší dobu.

Co je retail ?

Doporučuji projít si trošku Google, ale v principu - chodíme tam všichni, někteří z donucení, někteří za zábavou a "lákavými" slevami. Dost lidí v oboru i pracuje. Retail je v podstatě rychloobrátkový prodej ve velkém množství, s nízkými maržemi, ale velkým objemem prodejů, i proto se o něm mluví jako o rychloobrátkovém businessu - FMCG (fast moving cunsumer goods) - zkrátka potraviny, drogérie, část spotřební elektronicky (nosiče), ale z našeho pohledu můžeme do tohoto segmentu zahrnout i prodejce elektronicky, ať v kamenné podobě, ale i internetové.

Činnosti v retailu

Základní činnosti v retailu:
1. Obchod by měl vědět, co chce/bude prodávat - v běžném supermarketu najdete v databázi i desítky tisíc produktů (artiklů) - je poměrně těžké namíchat mix nákupů, který bude zajímavý a prodejný. znamená to průzkumy u lidí, tak konkurence, tak i výrobců.  
2. Obchod resp. jeho majitel musí dobře nakoupit - centralizované nákupy, jak říkal hlavní hrdina básníku - levně nakoupit, draze prodat. A nejlepší je, když mu ještě výrobce přispěje na to, aby byly jeho produkty ve velkých obchodech. Dříve listovné, zalistovací poplatek per artikl, dnes příspěvny na společnou propagaci produktů.
3. Dobrý obchod má snahu poznat své zákazníky - čím víc o zákazníkovi vím, tím lépe dokážu ovlivňovat jeho nákupní potřeby a chování
4. Samotný nákup  - stovky metrů a hledání oblíbených nebo akčních výrobků - ideálně pro prodejce, co nejdelší nákup, zoufalství, nakonec nakoupíte mnohem víc, než jste pvodně chtěli, a ideálně i pár prémiových produktů - váš prodejce Vás budemilovat
5. Pokladna - fronta - poslední příležitost Vám něco vnutit...pak nekonečné pípání a na závěr platba. Ideální zákazník je takový, který má zákaznickou kartu, proč vysvětlíme za chvilku
6. Správa zásob - ležáky a zboží, které se blíží spotřebě je nutné identifikovat, kvantifikovat, oblepit slevovými psákami a rychle prodat. Po překročení data spotřeby hrozí ztráta  a náklady na kafilerii 
7. Marketing - spousta analýz, co dát za zboží do reklamních letáků, a za jakou cenu, aby to přitáhlo lidičky, samozřejmě v kombinaci s potenciálmě splnění bodu 2 - jendím slovem je to alchymie na základě dat, průzkumů, sezóny atd
8. Logistika - zákazník musí najít svůj jogurt s danou příchutí, či oblíbené ovoce, protože jinak hrozí, že přístě půjde ke konkurenci. Cesta od výrobce na pult obchodu je poměrně dlouhá, trvá několik dní, při zahrnutí objednávky a času výroby jsme v rozmezí od několika dnů po několik týdnů. Na transportu a meziskladech se u nadnárodních řetězců podílí spousta poslečností = v kombinaci s počasím a odbory ideální kombinace sloužící jako generátor problémů  
9. Problematika householdu - opět poznání zákazníka resp. skupiny zákazníků  - stejné jméno a stejná adresa při registraci zákaznické karty Vás předurčuje k zařazení do householdu (skupina osob, které obývají stejný prostor, resp. vyjídají stejnou lednici a ideálně nakupují společně) 
10. Clustering produktů - statistické vyhodnocení nákupních košů a nákupního chování - asi nejzprofanovanější případ společného nákupu dětsých plenek a piva - opravdu to funguje za přepdokladu dostatečných vstupních dat
11. Rozmístění zboží na prodejně - čerpá informace z přechozích činností - primárním cílem je udržet zákazníka na "prodejním parketu" co nejdéle---jeho odhodlání neutrácet se postupně snižuje pod záplavou akcí...narůstá únava...už nebudu hledat mé oblíbené špagety, ale koupím ty, co jsou vystavené z čela regálů, což je typicky nejvýnosnější pro obchodníka...až se najde řetězec, kde bude zboží logicky uspořádáno s cílem minimalizovat čas potřebný k nákupu, budu jeho věrným zákazníkem...na druhou stranu asi dlouho nevydrží...

Data v retailu

Zdroje dat:
1.  Zákaznické karty = opakovatelná identifikace nakupujícího - relativně  maličko dat, ale obrovský význam pro výše uvedené činnosti - pověstná třešnička na dort
2. Záznamy o prodeji - konečně kandidát pro big data -  účtenky - představují obrovský objem dat, v současnosti společnosti moc nevyhodnocují, prodeje jsou typicky agregovány na úroveň den, prodejna, artikl, kusy. Přitom clustering produktů (nákupní košík) resp. vyhodncení korelac mezi produkty může být velmi cenný z pohledu, s rozšíření o segment zákazníka (household x příjmová skupina) v kombinaci s posledním střípkem - zákaznická karta...a máme Vás :). Záznamy o prodejích resp. účtenkách jsou doufejme někde archivovány, přeci jen, když už se dělá agregace, tak musí být z čeho. Předpokládejme, že data nejsou v centrále, ale lokalizovány na prodejnách
3. Zásoby - naskladňování - objednávka - naskladnění na prodejnu - zboží "na place" - relativně málo dat, protiváha k účtenkám - ale protože se naskladňuje po velkých baleních, tak přeci jen mnohem menší, než účtenky. Člověk by řekl že naskladnění - účtenky musí dát nulu...v E15 jsem si přečetl, že se ročně v ČR ukradne z obchodů zboží za 2 miliardy...tak to je ten rozdíl :)
4. Kampaně - letáky - hodně práce, a nakonec je z toho pár dvojlistů...nejdůležitější je časová platnost akce, lokalizace, a zpětná kontrola zásahu (zvýšení obratu na požadovaných skupinách sortimentu)
5. Logistika - intra i extra logistika - pracoval jsme pro jednu dopravní firmu, která zajišťovala mimo jiné zásobování supermarketů - naplánovat návozy na centrální sklady (několik v ČR) se závozy na prodejny (desítky až stovky v ČR) - zaměstnává to spoustu CPU a mnohem více lidí. Jeden příklad za všechny...možná nevíte, ale pivovary a výrobci nealko začínají už od cca února vyrábět na sklady, aby v létě zvládly nápory žíznivých krků...podobně vánoční sortiment...viz poslední čtvrtletí roku 2013 a mnoho diskutovaná intervance...obchodníci vykoupili velkoobchodní sklady během několika dní z obavy před pohybem koruny...


Co s těmito daty daty ?

Když už data potenciálně máme, resp. měli by jsme na diskutovaném hadoopu, jak by se daly využít ? 
Dost z níže popsaných věcí se dnes již realizuje, ale přesnost je ekvivalentní agregované statistice prodeje a tím snížení adresnosti a přesnosti akční nabídky.

Použijeme data pro standardní úlohy s rozšířením možností a přesnosti
1. Optimalizace zásobování resp. eliminace ležáků - téma i u firem z jiných segmentů trhu - optimalizace zásob a tím snížení rizika expirace zboží - korelace v rámci nákupního košíku (co se s čím kupuje v rámci jednotlivých nákupů v kombinaci s prodejním dnem a  dobou) a dlouhou časovou řadou - umožní firmě získat podklady pro optimalizaci naskladnění, takže ležák se ležákem nestane, protože ho na sklad nedovezeme :). Pro snížení objemu disponibilních zásob a minimalizaci převozů mezi prodejnami. Dnes je k dispozici pouze denní objem prodejů, což je suma za den a prodejní místo. Může to stačit, ale nemusí...
2. Vyhodnocení akční kampaně - když použiji na nákupní košík seznam produktů v akci, získávám informaci, jak moc je daný člověk zvyklý nakupovat věci v akci
3. Opět na bázi nákupního košíku - produkty v nákupním košíku rozdělené do skupin (food, nod food, fresh) mi opět dává korelaci, jaké kombinace produktů u mě zákazníci nakupují v rámci jednoho nákupu umožní mi to lépe strukturovat akční nabídku (kde slevit více, kde méně, kde naopak), abych docílil nákupo zboží, které chci výhodně prodat - znáte to - sleva není zadarmo :).
4. Korelace produktů v nákupním koši - pokud identifikuji produkty, které jsou klíčové pro prodej jiného výrobku, mohu akcí podpořit produkt, který zákazníka podnítí k nákupu dalších produktů - napadá mě příklad - nabídnu dobré víno, a k tomu prodám zákazníkovi sýry a lupínky, protože každý ví, že dobré víno je potřeba zajíst něčím dobrým...dodavatelů vína je přebytek, s dobrými sýry a šunkou je to horší, takže "skřípnu" dodavatele vína, nabídnu jej v akci, a zvýším cenu sýrů. Podobě těstoviny a omáčky na ně (i kečup se hodí). Podobně letní grilovací akce typu 3kg krkovice, k tomu basu piv, dřevěné uhlí do grilu a navrh pěknou zástěru, aby jsme se neumazali :). Můžete si říst, že na toho nepotřebuji znát strukturu jednotlivých nákupů, ale pak je to vyšší riziko a dojem může převládnout nad realitou...koupí 5 PET lahví levného piva a 2kg párků za 45Kč/kg...ale i to je korelace...pak jen musím znát strukturu mých zákazníků, abych neobjednal hodně krkovice, ale měl dostatek párků a plastáků na skladě.
5. Optimalizace nákup u dodavatelů - větší objem nákupu = lepší cena, ale musím mít jistotu, že prodám za zajímavou cenu, případně, pokud vím, že o daný produkt mají zákazníci zájem bez velké citlivosti za cenu, mohu v případě klíčové dodávky přeplatit jiného zájemce a ještě na tom v součtu vydělám.
6. Optimalizace akcí a slev  - řetězce se dostali do spirály, kdy zboží bez nápisu sleva = vysoké riziko neprodeje, enormní tlak na prodejní ceny...lepší segmentací nabídky slev (rozumněj postupné omezování rozahu a výše slev) bez vlivu na dosažený profit znamená potenciální cestu ven z této spirály...při znalosti korelace produktů mohu do slevy zařadit jen jeden výrobek, který je hojně nakupovaný a  který zajistí prodej i navázaných produktů (s lepším profitem). A nebo obráceně - hodně produktů se slevou, kde mě ale sleva nebolí a vím, že se těch produktů v daných dnech neprodá tolik...ale na letáku to vypadá zajímavě (někde jsem viděl nabídku na slevu na letní gumy na auto v polovině prosince - buď omyl, něbo někdo uvažoval stejně :)
7. Plán prodejů - podrobné časové řady prodejů produktů s vazbou na prodej další produktů umožňuje zpřesnit odhad a zvýšit pravděpodobnost úspěšného splnění plánu prodejů , resp. i vytvořit pravděpodobnější plán. Díky výpočetní síle a rozsahu dat lze přepočívávat každý den a případně korigovat navázané operace (pokud produkt nejde, tak snížit jeho zásobu i třeba odvolat objednávku, nebo přesměrovat na jiný obchod, kde scénář připravili lépe) 
8. Household - přepočet košů domácnosti (přes zákaznické karty) , řazení do zákaznických segmentů je výpočetně náročná úloha, a pokud by jsme používali účtenky v  dělší časové řadě,  budeme mít segmentaci i cistlivost householdu na změny cen jako na dlani...druhá věc je indikace členů domácnosti podle nakupovaných produktů (kojenecká výživa - malé dítě = pleny, olejíček, jídlo pro kočky nebo psy - super, mají zvířecího miláčka, pro obojí se peníze vždycky najdou. Vysoké procento zásahu do sorty akčního zboží za nejlevnější ceny, žádný jiný "normální" produkt  = důchodce s časem objet postupně více obchodů a koupit vše za slevy...?)
8. Nové cesty - úvaha, někde ve světě už realizují - když dáme na vozík senzor polohy a její uchování v hadoopu, propojíme s účtenkou (u pokladny) - v kombinaci s plánem prodejny a osazením produktů, získáme  mapu, kudy zákazník projížděl, přes jaké zóny, a co reálně nakoupil...při použití na masu dat umožní výhodněji rozmístit produkty s cílem dát zákazníkovi "pod nos" to, co víme, že bude chtít při daném scénáři průjezdu nakoupit, případně co chceme, aby koupil ...ze mě by moc moudří nebyli, vždycky "náhodně bloudím", odložím košík a chodím bez něj a jedu podle seznamu...:)


Samozřejmě dat je v retailu více, zmínil jsem ty dle mého nejdůležitější z pohledu objemu a významu. Stejně tak použití dat, zde ale předpokládám realističnost scénáře, ať již z minulé praxe, nebo z možnosti technologií a hledání souvislostní ve velkých objemech dat. 
Nejhorší pak je když po dlouhých analýzách přijdete s hypotézou za matadory businessu a oni Vám to rozstřelí jako broky holuba...ale to už je o konkrétních případech...

Budu rád za Vaši reakci...





1 komentář:

  1. Ahojte všetci tu, volám sa Fumo Sadiku žijúci v meste Malindi v Keni. Chcem povedať niečo viac o dobrom počúvanom mužovi menom Benjamin Breil Lee, ktorý pracuje s finančnou službou ako úverový dôstojník. Pán Benjamin Breil Lee mi pomohol získať pôžičku vo výške 37 115 225 225 šilingov v čase, keď sa snažím snažiť dostať sa späť na nohy, aby som rozbehol svoje podnikanie, viem, že sú tu niektorí z vás, ktorí sú vo finančných ťažkostiach, aby sa porozprávali s pánom Benjaminom o tom, čo je app + 1-989-394-3740 alebo tiež s jeho osobnou E -mail na Lfdsloans@outlook.com Som veľmi rád za to, čo urobil pre mňa a tiež pre svojho bankového účtovníka.

    OdpovědětVymazat