Information architecture is a matter (en)

(Finnish edition copy)

Take the first review of Inmon’s model compared to Kimball’s model (original links do not work any more) – both of those guys are the pioneers of the information architecture and a very well-known influencers from the early 1980’s.

Inmon: All corporate information, further processed, “one truth”. A central data warehouse. Data Warehouse including historical data – the Corporate Information Factory (CIF)

Inmon’s CIF includes the data from the operational systems, data transfer and processing processes (ETL), data warehouse, and the establishment of the special needs of smaller data warehouses (data marts). Data Marts are always the data warehouse data, “one truth”, never data from anywhere else. These are the special needs of different departments and processes, analytical solutions, etc.

Data integration is time-consuming step. This work requires the utmost diligence, discipline. The entire organization is committed to information architecture.

CIF: A Data Warehouse should be located in a normalized relational database format. History-containing structures may be permitted to also be “de-normalized”, at least to some extent.

The work is a long-term, construction will last a long time, but in return is expected to be and should be long-lasting and reliable data architecture.

Kimball’s model is considered to represent “opposite” view of how the company will design and build architecture. Kimball’s model is also called “dimensional” model (stars, snowflakes).

In this approach, dimensional data structures (data marts) come directly from the organization’s applications. The same information can be transferred to more than just a single data mart, depending on the function of the individual models.

Interest and the criterion of this approach is the speed of development. Analytical and reporting needs can be quickly implemented when there is not a target to design and build the whole enterprise on a common data repository. Inmon other hand says that Kimball’s model used for the company there is no “one truth”

Kimball’s Read More

Information architecture is a matter

(English edition copy)

Tietoarkkitehtuurilla on väliä

Otetaan ensin tarkasteluun Inmon:in malli vs Kimball:in malli (edellisissä olleet linkit vanhentuneet) – Molemmat mainituista herroista ovat tietoarkkitehtuurien pioneereja ja erittäin tunnettuja vaikuttajia jo 1980 luvulta alkaen.

Inmon: Kaikista organisation (Enterprise) tiedoista koostettuna ja jalostettuna ”yksi totuus”. Tietovarasto keskeinen. Tietovarastossa historioidut tiedot – Corporate Information Factory (CIF)

Inmon:in CIF pitää sisällään operatiiviset järjestelmät, tietoa tietovarastoon siirtävät ja jalostavat prosessit, tietovaraston ja tietovarastosta erityistarpeisiin muodostettavat pienemmät tietovarastot (data marts). Data Mart:it muodostetaan aina tietovarastosta, ”yhdestä totuudesta”, ei koskaan mistään muualta. Näitä erityistarpeita ovat mm. eri osastojen ja prosessien tarpeet, analyyttiset ratkaisut jne.

Aikaa vievä vaihe on organisaation eri sovellusten tietojen integrointi ja siirtäminen tietovarastoon. Tietovarasto ja koko CIF arkkitehtuuri rakennetaan koko organisaation näkökulmasta yhteiseksi ”totuudeksi”. Tämä työ vaatii äärimmäistä huolellisuutta, kurinalaisuutta ja koko organisaation sitoutumista mallinnettavaan ja rakennettavaan tietoarkkitehtuuriin.

CIF:issa tietovarasto tulee sijoittaa relaatiokantaan ja normalisoituun muotoon. Historian sisältävien rakenteiden sallitaan olevan myös ”de-normalisoituja”, ainakin jonkun verran.

Työ on pitkäjännitteistä, rakentaminen kestää pitkään, mutta vastineena tuloksen uskotaan olevan ja tulee olla pitkäkestoinen ja luotettava tietoarkkitehtuuri.

Kimball:in mallin katsotaan edustavan ”vastakkaista” näkemystä siitä, kuinka yrityksen tulee arkkitehtuurinsa suunnitella ja rakentaa. Kimball:in mallia kutsutaan myös ”dimensionaaliseksi” malliksi faktatauluineen ja dimensiotauluineen (tähtimalli, lumihiutale).

Tässä lähestymistavassa tiedot dimensionaalisiin rakenteisiin (data marts) tulevat suoraan organisaation sovelluksista. Sama tieto voidaan siirtää useampaankin kuin vain yhteen data mart:iin riippuen yksittäisten mallien funktiosta.

Etu ja peruste tässä lähestymistavassa on kehittämistyön nopeus. Analyyttiset ja raportoinnin tarpeet saadaan nopeasti toteutettua, kun ei oteta tavoitteeksi suunnitella ja rakentaa koko yrityksen käyttöön yhteistä tietovarastoa Inmon:in mallin mukaisesti. Mutta Inmon:in mukaan Kimball:in mallia mukaillen yritykseen ei synny ”yhtä totuutta”. Read More