Qualunque sia il metodo con cui un’azienda calcola il prezzo da applicare al paniere di beni o servizi che propone sul mercato, avrà bisogno di un database di informazioni ben strutturate per prendere decisioni corrette e data-driven.
Molte aziende dispongono di dati storicizzati e (solo a volte) organizzati. E’ importante rendere però queste informazioni utilizzabili al fine, ad esempio, di stabilire un corretto pricing.
La cifra “15” potrebbe indicare il numero civico di un’abitazione, come il numero di prodotti acquistati. Il dato “15€” mi fa capire che si tratta di un prezzo. Avere una colonna di nome “Prezzo” in una tabella di un Database di nome “Prezzi Prodotti”, adeguatamente compilata, me ne fornisce la certezza. Quel “15” diventa così un contenuto utilizzabile, con un significato funzionale. In definitiva si trasforma in un’informazione.
Dati di vendita, standardizzazione e pulizia
Inoltre, una volta identificati i dati input che rappresentano il set che voglio organizzare, l’operazione successiva riguarda la sua preparazione e standardizzazione.
Per rendere meglio l’idea, ecco alcuni esempi:
- “Mario Rossi”, “mario rossi” con ragionevole certezza, rappresentano la stessa informazione, ma se non interveniamo prima uniformando questi vizi di forma in un unico formato standard, si avrà erroneamente a che fare con due “Mario Rossi”, anziché uno. Quando si incontrano valori come questi, e capita spesso, il rischio è quello di perdere tempo nel ricercare l’origine dell’errore;
- 13/11/2021, 11/13/2021, 2021/11/13, 2021-11-13 rappresentano la stessa data, ma esistono diversi formati (italiano, inglese, americano con “/” e americano con “-“) che vanno uniformati prima di poter procedere con qualsiasi analisi;
- Lat: 45°28’38” Lon: 09°10’53” e Lat: 45°27′51 Lon: 9°11′22″ sono entrambe coordinate di zone di Milano. Qualora lo scopo fosse quello di identificare semplicemente la città di Milano con una coordinata, sarà importante sceglierne una delle due per non generare conflitti;
- Lunedì e monday: rappresentano lo stesso giorno della settimana, ma se le due informazioni non vengono uniformate si rischia di trovarsi ad analizzare una settimana di 14 giorni;
In un mondo ideale, un database dovrebbe contenere da subito dati uniformati e ben strutturati, ma per il livello di digitalizzazione che caratterizza la maggior parte delle imprese, ancora oggi non è così.
Individuate e corrette le possibili incongruenze sia nel database esistente, sia nei flussi di salvataggio delle nuove informazioni, si ottiene il set di informazioni definitivo. Prima di procedere con i successivi passaggi è necessario controllare attentamente che queste informazioni siano corrette: un algoritmo alimentato in modo errato produce inevitabilmente risultati altrettanto scorretti.
Dati di vendita, data driven pricing
Tornando all’obiettivo iniziale, quello del calcolo dei prezzi, le informazioni che servono sono quelle necessarie a stimare la domanda dei prodotti in vendita:
- I dettagli delle transazioni passate, in termini di quantità acquistate per ogni prezzo applicato e per ogni prodotto con l’indicazione della data e dell’ora delle transazioni;
- Le informazioni sulle eventuali promozioni applicate sui prodotti sia nel presente, sia nel passato;
- Le informazioni aggiuntive sui clienti o su gruppi di clienti, utili per capire, per esempio, come varia la domanda in base alla nazionalità dell’acquirente;
- Informazioni sui competitor, di più tipi:
- Prezzi presenti e storici per prodotti uguali o assimilabili ai nostri
- Promozioni presenti e storiche applicate dai competitor
- Informazioni qualitative come la stima della quota di mercato o indicazioni sul posizionamento di ciascun competitor
- Altre informazioni utili a stimare la domanda, che dipendono dal mercato, ad esempio:
- parlando di spedizioni, la modalità di consegna scelta dai clienti potrebbe essere influenzata dalla concomitanza con altri eventi (es: delivery in caso di epidemia)
- qualora gestissimo un servizio di video on demand potrebbe essere utile tenere traccia delle informazioni meteorologiche, oppure di informazioni di attualità che possono permettere di cavalcare determinati trend di interesse
- …
Va detto che queste informazioni non sono tutte obbligatorie per poter calcolare i prezzi: anche solo con i dati delle transazioni e delle promozioni è possibile arrivare ad un risultato verosimilmente corretto, che però potrebbe risultare approssimativo senza il supporto di altre evidenze.
Dati di vendita, l’importanza del data enrichment
Aggiungere informazioni relative alle aziende concorrenti, a fattori esogeni come la situazione macroeconomica, l’evoluzione della pandemia, le previsioni meteo o gli eventi in programma, solo per citarne alcuni, potrebbe consentire, tramite algoritmi di intelligenza artificiale, di individuare relazioni apparentemente nascoste tra i dati e di utilizzarle a proprio vantaggio. Ad esempio, analizzando i dati di un e-commerce, potremmo comprendere che in corrispondenza di condizioni meteo negative cresce il numero di computer portatili acquistati. Disponendo di queste informazioni un algoritmo sarebbe in grado di ottimizzare il prezzo e di incrementare i ricavi dell’azienda.
Oltre alla qualità e alla varietà di informazioni inserite nel file di input è importante concentrarsi sull’importanza della loro numerosità. Con un database contenente uno storico di 100 transazioni totali, non è pensabile applicare algoritmi di intelligenza artificiale in modo efficace e sarà necessario affidarsi almeno inizialmente ad algoritmi più semplici come sistemi di regole preimpostati e valutati periodicamente (ad esempio “abbassare il prezzo del pane del 40% dopo le 17:00”), oppure funzioni di interpolazione matematica che permettono di stimare, ad esempio, la domanda e il relativo prezzo in grado di massimizzare il fatturato oppure la quantità venduta pur avendo a disposizione anche solo un numero esiguo di osservazioni storiche. Questi metodi possono rappresentare un buon punto di partenza e sono relativamente semplici da costruire, quando si hanno a disposizione poche informazioni sulle vendite passate.