11.01. Adat, informácó, adatok közötti kapcsolat

Default book

Adat

A valóságos világ minden objektumához, jelenségéhez tartoznak "jellemzők", paraméterek, "adatok" amelyek számokkal, betűkombinációkkal, tehát szöveggel vagy akármilyen jellel, jelsorozattal, jelenséggel, mozgással, stb. kifejezve megadhatók. A wikipédia adatfogalma.

Információ

Erre a fogalomra több definíció is létezik. Az egyik az, hogy a felhasználható, vagy hasznos adatot nevezzük információnak. Mások azt mondják  az információ olyan adat, ami döntés megtételére alkalmas. Az információ tehát több mint adat. Az információt adatok, jelek hordozzák. A Wikipédia információfogalma.

Ha az információ mennyiségéről, a kezeléséről beszélünk, akkor az információ tartalmát nem vizsgáljuk. Elegendő az információt hordozó adatok tulajdonságait vizsgálni.

Az információ mennyisége

Ha egy jel vagy jelsorozat előfordulási valószínűsége kicsi, akkor az általa hordozott információ mértéke nagyobb, A nagyobb valószínűséggel előforduló jelsorozat információértéke kisebb. Tehát a jel előfordulási valószínűsége fordítottan arányos az információ tartalmával.

Megjegyzés:

Erre több magyarázat is létezik, de talán az a székely vicc elég jól értelmezi:

"A székely feleség állandóan beszél és folyton szekálja a férjét, hogy sohasem mondja, hogy szereti. A székely ember megunja és a következőt mondja: Asszony, egyszer már mondtam, hogy szeretlek. Ha ez megváltozik, akkor szólok!"

Persze elég hülye hasonlat, de a lényeget kifejezi: Ha egy jel két féle állapotának változása lényeges állapotváltozást hoz létre, akkor az a jel fontos, tehát az információ tartalma nagy! Ekkor a jel állapotainak a valószínűsége 50-50%.

Ha egy rendszer több tucat jellemzője együtt határozza meg az állapotot, akkor egy-egy jel változásának valószínűsége kicsi, tehát a jel információ tartalma kicsi.

Az információ mértékének alapegysége

a bit. ( A bit tehát egy mértékegység, mint a méter vagy a kilogramm, az információ mennyiségét mérjük vele)

A bit kétállapotú jel, amit általában 0-val vagy 1-essel szokás jelölni. Egy bit valamelyik állapotának előfordulási valószínűsége 50%. Minél hosszabb egy bitsorozat (=jelsorozat) az előfordulás valószínűsége annál kisebb, tehát több információt hordoz.

Az információ mennyisége a hosszabb jelsorozatok esetén összeadódik

Miért érdekes ez az elméleti megközelítés?

Az adatbáziskezelő rendszerekben fontos az, hogy az információt a lehető legkisebb méretben és egyszerűen kezelhető módon tároljuk. Az adatbáziskezelő rendszerek nem foglalkoznak az adatok tartalmával, hanem csak az adatok formájával, tárolásának módjával, tulajdonságaival. Ha a tartalmával nem foglalkoznak, akkor már csak az alábbi legfontosabb jellemzői maradnak:

  • adat mérete - mennyi helyet (hány bit helyet) foglal el egy háttértárolón, vagy a számítógép memóriájában,
  • az értéktartománya - mettől meddig terjedhetnek az adat által tárolható értékek (jelek listája, legkisebb, legnagyobb jel, stb...)

Az adatok felépítésük szerint lehetnek egyszerű és összetett adatok. Összetett adatokról beszélünk akkor, ha az adat felbontható összetevőkre, amelyek maguk is egyszerű vagy összetett adatok.

Az egyszerű adatokat háromféleképpen szokás összetenni:

  • Sorozatot alkotunk. Ennek a programozási megfelelője a tömb, adatbáziskezelés esetén pedig táblának mondjuk. Alapvető jellemzője, hogy azonos típusú adatokból épül fel. A sorozatban az egyes összetevők azonos méretűek. A sorozat mérete megegyezik az összetevők méreteinek összegével. Speciális esetben, ha az egyszerű adat mérete x bit, akkor n elemű sorozat mérete n * x bit lesz.
  • Rekordot hozunk létre. Ekkor az összetevők különböző típusúak. Az egyes összetevők méreteinek összege adja a rekord méretét.
  • Objektumot hozunk létre. Ekkor nemcsak az adatokat tároljuk le, hanem az adatokat kezelő szoftvereket is az adatszerkezet részévé tesszük. Ezzel ebben a kurzusban nem foglalkozunk.

Az adatokat funkcióik szerint három részre osztjuk

  • Információhordozó adat. A ténylegesen tárolt adatok, amiket az adatbázisban tárolnunk kell.
  • Szerkezethordozó adatok. Az információ tárolásához szükséges elengedhetetlen adatokat tekintjük. (mutatók, indexek, egyéb jelölő és vezérlő adatok)
  • Metaadatok. Az adatokról tárolt adatok! Mi ez: Olyan adatok például, amelyek az adatbázissal foglalkozó fejlesztőnek elmondják, hogy az aktuális adat jellemzője mit is jelent. Például egy kép esetén metaadat a GPS koordináta vagy az, hogy milyen fényképezőgéppel készítettük, stb...

Az adatok között kapcsolatok

Az adatok között kapcsolatok lehetnek. Például: szülők - gyerekek, rendszámok-autók, repülők-járatok-utasok, stb...

Az adatbázis definíciója

Az adatbázis az adat és az adatok közötti kapcsolatok együttese (halmaza)

A jól megtervezett adatbázisok jellemzői:

  • Egy adatot egyszer tárolunk le. Ezzel megelőzhető a felesleges helyfoglalás. A jól megtervezett kapcsolatoknak köszönhetően lehetséges.
  • Nincsen ellentmondás az adatok között. (Pl. Egyszer egy tantárgy neve: magya nyelv és irodalom, magyar nyelv- és irodalom. Az adatbáziskezelés esetén ez két különböző adat, mert csak a formája számít, nem a tartalma! A kettő nem ugyanaz!!!)
  • Nem lessul le a rendszer sok adat esetén

Az adatok közötti kapcsolat lehet a kapcsolódásban résztvevő elemek száma szerint

  • egy-egy adat között, akkor azt mondjuk, hogy a kapcsolat egy az egyhez kapcsolat,
  • egy adathoz több adat tartozik, akkor azt mondjuk, hogy egy a többhöz kapcsolat,
  • több adathoz több adat tartozik, akkor azt mondjuk, hogy több a többhöz kapcsolat.

A kapcsolat lehet függő, ami azt jelenti, hogy egyik adat valamiféleképpen hat egy másik adat tartalmára, jelentésére. Ekkor irányított kapcsolatról, vagy hierarchiáról beszélünk.

Az adatok közötti kapcsolatok lehetnek közvetlenek, és közvetettek.

Bizonyos esetekben van értelme megfogalmazni az elérési út fogalmát. Erről akkor beszélünk, ha két egymással közvetett kapcsolatban lévő adat közötti közvetlen kapcsolatok sorozatát írjuk le.

Az adatok közötti kapcsolatok jól formalizálhatók. A formalizálás elméletébe nem megyünk bele. Az adatbázisban tárolt adatok közötti kapcsolatok rendszerét az adatbázis sémájának (schema) hívjuk.