Vaaleanpunaisia omenia

Peter Benson heitti ECCMA:n kesäkuun uutiskirjeessä mielenkiintoisen esimerkin hierarkisten luokittelujen ongelmista. Vaikka yritykset orjallisesti noudattaisivat UNSPSC – luokittelua tai jotain muuta standardia, joka pohjautuu hierarkisuuteen, törmätään vääjäämättä jossain vaiheessa hankaluuksiin. Sama nimike näyttäisi yksiselitteisesti kuuluvan useampaan luokkaan.

Peterin esimerkki oli omenat – ei se puhelimiakin valmistava IT-yritys, vaan tämä ihmiskunnan historiassa merkittävää roolia näytellyt hedelmä, jota Aatami ja Eeva maistelivat ja joka Newtonin päähän pudotessaan mullisti käsityksen maailmankaikkeudesta.  Siis ruokakaupan hyllyiltä löytyvä tuote ”Pink Lady® apple”, joka on UNSPSC luokittelussa määritelty kahdeksaan (8) eri luokkaan:

Pink lady apple UNSPSC luokat

Pink lady apple UNSPSC luokat

Tuon omena-esimerkin voi käydä lukemassa originaalina täältä, hyvä tarina: ECCMA June Newsletter

Esimerkki on loistava siinä mielessä, että siinä esiintyy lähes kaikki tyypilliset nimikeluokittelussa tehtävät virheet. Ensinnäkin Pink Lady® on rekisteröity tavaramerkki – siis brandi. Sitä ei kannata sotkea esimerkiksi termiin, joista muodostuu yrityksen sanasto.

Viime aikoina olemme tehneet useampia sanastoprojekteja, joissa brandi-nimien ohella on tullut vastaan erilaisia apusanoja, kuten ylä, ala, taka, sivu, oikea, vasen. Pahimmillaan sanastossa on termejä tyyliin: ”1. vasen tukivarsi”, ”2. vasen tukivarsi”, ”3. oikea tukivarsi” … Tämä generoi tietysti kielenkääntäjälle töitä, kun kaikki variaatiot käännetään jopa kymmenille kielille.

Loputon suo

Omena-esimerkissä luokittelutekijöihin on lisäksi sotkettu viljelysmenetelmä sekä jälkiprosessointi, joka johtaa siis jäädytettyihin orgaanisesti viljeltyihin omeniin sekä jäädytettyihin muuten vaan viljeltyihin omenoihin. Koska ryhmä ei vielä kerro, onko omenat jäädytetty kokonaisina, viipaloituina vai murskattuina tarvitsemme todennäköisesti vielä lisää ryhmiä. Tällä mallilla suo on loputon. Konepajamaailmassa tyypillisin luokittelusynti on sekoittaa nimikkeen käyttökohde ja funktio – siis esim. KIINNITYSLAIPPA vs. MOOTTORIN KIINNITYSLAIPPA, KYTKIMEN KIINNTYSLAIPPA, NOSTURIN NH15 KIINNITYSLAIPPA jne

Hierarkisuus sinänsä on erittäin ymmärrettävää, koska ihmiset ja varsinkin me insinöörit olemme tottuneet jäsentämään asioita hierarkisesti. Tietojärjestelmät eivät hierarkisuutta tarvitse, joten näin tietointensiivisenä aikana olisi hyvä yhdistää nämä molemmat asiat. Tietomallin luonnissa siis pyritään välttämään kiinteitä hierarkioita, jottei synny duplikaatteja, mutta käyttäjälle pitäisi pystyä asiat tuomaan tarpeen mukaan erilaisten näkymien ja polkujen kautta.

ISO 8000 mukainen kuvaus

ISO 8000 mukainen kuvaus

Tässä hypätään nyt hieman idealistiselle puolelle. Koko nimikkeistön attributisointi kyseiseen tasoon on monelle yritykselle tekemätön paikka. Tietotekniset työkalut ja algoritmit kyllä työssä auttavat mutta puhutaan joka tapauksessa megalomaanisesta työmäärästä, jos nimikemäärä on satoja tuhansia.

Suunta kyllä kannattaa pitää mielessä ja aloittaa esimerkiksi myytävistä omista tuotteista, toimittajat nimittäin vastaavat ostokomponenttien jalostamisesta, mikäli haluavat niitä myydä 😉

PS: En siis mitenkään halua kyseenalaistaa UNSPCS-luokittelun käyttämistä – päinvastoin, mutta sitä kannattaa käyttää omiin tarpeisiin järkevästi soveltaen.

Tässä kesäkuun saarna. Eiköhän lähdetä nauttimaan kotimaisista, UNSPSC-vapaista, kirkkaan punaisista mansikoista.

-PDM Preacher

Mainokset

Data is Truth

ECCMA:n puheenjohtaja Peter Benson totesi keynote-puheessaan asiakaspäivillämme, että noin neljä vuotta sitten alkoi maailma kääntyä. Todennäköisesti triggerinä ei ollut Obaman valinta ensimmäistä kertaa USA:n presidentiksi, vaan Lehman Brothersin romahdus, joka havahdutti miettimään montaa asiaa uudelleen. Siihen saakka DATA tyypillisesti edusti dokumentaatiota olemassa olevasta tilanteesta, ja nyt DATA on todellisuus – Information is Power, Data is Truth.

Datan merkitys totuutena näkyy monessa paikassa. Joskus – yleensä useimmin – myös negatiivisena ja koomisena. Koska samaa dataa käsitellään ja ylläpidetään useissa järjestelmissä, on suuri todennäköisyys sille, että datan hyödyntäjä saa käsiinsä aina väärää tietoa. Monella on varmasti omakohtaisia kokemuksia esimerkiksi terveydenhuollon alalta, koska meiltä puuttuu keskitetty potilasrekisteri. Onneksi kuitenkin verottaja tietää kaiken sinusta. Business-maailmassa törmätään yhä useammin kuvan kaltaisiin tilanteisiin.

Säästäminen ei ole seksikästä

Kaikesta huolimatta motiivi nimikedatan standardisointiin on lähtenyt alun perin jenkkien puolustusteollisuuden kustannussäästötarpeista. Kun saadaan parempi läpinäkyvyys sille mitä ollaan ostamassa, voidaan ostokustannuksissa säästää yksinkertaisesti vertailemalla eri tuotteita todellisten ja käyttötarpeeseen liittyvien ominaisuuksien suhteen. Säästäminen Cut Costs ei ole ainakaan jenkeissä koskaan ollut seksikästä, mutta ostotransaktiolla on aina toinenkin puoli. Jos tuote erottautuu hyvin erilaisissa Google-hauissa informaatiosisällöllään, sitä todennäköisesti myydään enemmän – More Sales.

Tuotteiden valmistajien on hyvä muistaa, että lain mukaan heillä on velvollisuus toimittaa asiakkaille tai asiakkaiden asiakkaille kaikki riittävä tieto tuotteesta, jotta sitä voidaan käyttää turvallisesti. Jos tiedon tuottaminen asiakkaiden kyselyihin on hankalaa ja aikaa vievää, palaa valmistajalla tiedon keräämiseen aivan turhaan resursseja – Save Resources.

Nimike yhteinen kieli

Bensonin mukaan sähköiset kyselyt tuotteiden tiedoista ovat lisääntyneet merkittävästi aivan viime aikoina ja vauhti vain kiihtyy. ISO 8000 ja ISO 22745 määrittelevät kuinka kysely tehdään ja kuinka siihen pitää vastata. Periaate on yksinkertaisuudessaan se, että sinun pitää tietää tarkasti mitä tietoa haluat. Jos saat asiakkaalta pyynnön: ”Lähetä minulle kaikki tuotetieto”, siihen ei tarvitse reagoida mitenkään. Mutta jos kysymys tulee muodossa: ”Kerro toimittamasi hydrauliventtiilin käyttölämpötila-alue”, siihen on parempi vastata. Kyseiset kysymykset alkavat jatkossa tulla XML-muodossa ja nyt on oiva aika alkaa kehittää valmiuksia myös sähköisiin vastauksiin.

Datan merkitys liiketoiminnalle saa johdon huomion vasta kun vaatimukset tulevat viranomaisilta. No hyvä uutinen data-evankelistoille yrityksissä on se, että viranomaisvaatimukset eivät ainakaan tulevaisuudessa vähene. Euroopassa tullaan vielä hieman perässä esimerkiksi SOX-vaatimuksia, jotka jenkeissä talous-datan osalta vievät talousjohtajat suoraan linnaan, mikäli tiedot eivät ole oikein. Ympäristön suojelun nimissä on jo tänään tuotteissa raportoitava vaarallisten aineiden osuudet, jotka luonnollisesti kuuluvat nimikkeen perustietoihin. Datan merkityksen tärkeyttä liiketoiminnalle kuvastaa se, että jenkeissä on alkanut yleistyä johtoryhmätason vastuu; CDO, Chief Data Officer, joka siis ei ole funktio tietohallinnossa, joka hienosta nimestään huolimatta keskittyy informaatiotekniikkaan.

Älä pelkää

Peter Benson on toiminut nimikedatan standardisoinnin puolesta 30 vuotta. Kun häneltä kysyttiin mikä on suurin syy siihen, että data on edelleen kuralla lähes joka yrityksessä, eikä siihen puututa vaikka kaikki sen myöntää, vastaus oli PELKO. Ihmiset pelkäävät, mitä kaikkea sieltä paljastuu, kun dataa aletaan penkoa ja siivota. Syyllistetäänkö heitä siitä, että tiedot ovat väärin tai puutteellisia? Saavatko he kenkää, tai joutuvatko maksamaan korvauksia siitä, että ovat olleet vastuussa legacy datan tuottamisesta? Ammutaanko viestintuoja?

No todellisuudessa ei ammuta. Kaikilla on data kuralla. Se joka saa sen ensimmäisenä kuntoon, on voittaja.

Kisa alkakoon.

– PDM Preacher