Kuidas vältida vigu rahvusvahelise turu GMV arvutamisel?

Turuplatsiga töötades tuleb arvutada brutokauba maht (GMV). Alguses tundub see lihtne: kõik, mida vajate, on kõigi aktiivsete reklaamide hinnad ühte veergu koondada ja klõpsata SUMM. Kui teie turg tegutseb erinevates riikides, ei pruugi asjad siiski nii lihtsad olla.

Miks on GMV arvutamine keeruline?

Töötan Lalafos - AI-toega peer-to-peer turul. Platvormil on iga kuu 3 miljonit aktiivset kasutajat 4 riigist. 2016. aasta lõpus pidime arvutama kõigi selle aasta Lalafo-le paigutatud reklaamide rahalise koguväärtuse.

Esiteks võtsime kokku kõik kasutajad soovitatud hinnad, jättes välja kõik paigutamata ja blokeeritud reklaamid. Selle tulemuseks oli GMV, mis oli suurem kui selle riigi SKP, mida me hindamisel kasutasime!

Puhastasime andmed ja konverteerisime valuuta reaalajas. See tegi koguarvu väiksemaks, kuid oli siiski mõistlikult suur.

Kõige populaarsem viis räpase andmestiku anomaaliate väljalõikamiseks on kvartiilidevahelise vahemiku kasutamine (andmevahemik 25. ja 75. protsentiili vahel). Ka see lähenemisviis ei lahendanud probleemi, kuna pärast kvartiilidevahelise vahemiku rakendamist langes kasutajahindade maht väga madalaks.

Pöörake tähelepanu protsentiilidele

Kiire ajurünnak andis aimu, et probleem oli protsentiili väärtuses: erinevus nulli ja esimese vahel oli liiga dramaatiline.

Protsentiil (või sentiil) on statistikas kasutatav mõõt, mis näitab väärtust, millest allapoole antud vaatlusrühma vaatluste protsent langeb. Näiteks on 20. protsentiil väärtus (või hinne), millest madalamal võib leida 20% vaatlustest. Protsentiilid võivad toimida lineaarselt või mittelineaarselt sõltuvalt sellest, kas andmestikus on vigu. (Vikipeedia)

Otsustasime vaadata üle kõigi protsentiilide vahemikus 1 kuni 100. Leidsime, et kõik andmed protsendi 1 ja 99 vahel olid lineaarsed, kuid vahemikus 99 kuni 100 leidsime suure tõusu, mis näitab, et viga ilmneb selles jaotises. Eemaldasime kõik andmed 99. ja 100. protsentiili vahel, mis probleemi lahendas.

Tootekategooria tähtsus

Lalafo turg sisaldab erinevaid tootekategooriaid. Kõige kallimad kategooriad on kinnisvara ja sõidukid. GMV täpsema saamiseks otsustasime protsentiilide arvutamisel arvestada tootekategooriaid. Näiteks on sõidukite ja kinnisvara protsentiilid kümneid kordi suuremad kui rõivaesemete omad.

Selle tulemusel me:
- määras iga kategooria protsentiili väärtuse.
- kasutatud protsentiilid ainult mittelineaarse GMV korral.
See andis meile täpse GMV.

Teine oluline asi - valuuta

Sageli unustavad kasutajad reklaamide paigutamise ajal valuuta määramise. Selle tulemusel müüakse iPhone 7S vaid 20 dollari eest või ahjud maksavad rohkem kui kogu Colombia SKP!

Valuuta kohandamiseks, säilitades 99. protsentiili andmestiku redigeerimise tulemused, otsustasime teha järgmist:

- määrake igale kategooriale ühine hind, mis võrdub kategooria mediaaniga (protsenti 50).
- vaadake andmekogumit ja korrigeerige valuutat, kui väärtus on liiga madal või liiga kõrge.

GMV arvutamine. Üldine nõuanne:

- levinud meetodid (mediaan, kvartiilidevaheline vahemik) toimivad ainult lineaarse GMV korral. Kui need ei tööta, kontrollige kõigi protsentiilide väärtusi uuesti.

- arvutage protsentiilid iga kategooria kohta eraldi.

- filtreerige enne arvutamist oma andmed.

- kontrollige valuuta väärtusi.