Skip to content
Snippets Groups Projects

Pripomienky1oliver

Merged Oliver Siksa requested to merge pripomienky1oliver into main
1 file
+ 209
0
Compare changes
  • Side-by-side
  • Inline
+ 209
0
# Pravidlá pre prácu s tabuľkovými dátami
Jednoznačne definované pravidlá práce s tabuľkovými dátami sú kľúčové pre ich efektívne zdieľanie, spracovanie, analýzu a interpretáciu. Tento dokument obsahuje pravidlá a odporúčania pre štruktúru dát, názvoslovie, formátovanie a jednotné konvencie, ktoré zabezpečia konzistentnosť a kvalitu spracovávaných údajov.
Dôsledné dodržiavanie týchto zásad umožní jednoduchšie vyhodnocovanie údajov, lepšiu čitateľnosť a minimalizáciu chýb pri ich používaní. Dokument je určený pre všetkých, ktorí pracujú s tabuľkovými dátami, či už v rámci analýz, reportov alebo databázových systémov.
## Dátový set (databáza)
Nakoľko sa vo väčšine prípadov pracuje s veľkým množstvom dát, je potrebné dátam vytvoriť optimálnu štruktúru a logické skupiny. Dátový set (databáza) je skupina tabuliek, ktoré tvoria logický a tématický celok.
- Dáta dátového setu (databázy) MUSIA byť rozdelené do logických skupín t.j. každá tabuľka datasetu (databázy) predstavuje 1 skupinu (napríklad občania, podnety).
Príklad tabuliek datasetu (databázy):
obcania
| id_obcana | meno | priezvisko |
|----------|----------|----------|
| 1 | Martin | Novák |
| 1 | Jozef | Kováč |
podnety
| id_podnetu | id_obcana | podnet |
|----------|----------|----------|
| 1 | 1 | Lorem Ipsum... |
| 2 | 1 | Lorem Ipsum... |
## Tabuľka
### Názov tabuľky
- Názov tabuľky sa NESMIE vyskytovať v bunkách tabuľky
- Názov tabuľky sa MUSÍ vyskytovať v názve súboru, vo funkcii „hlavička súboru“ alebo na samostatnom hárku
- Názov tabuľky BY MAL byť v množnom čísle
- Názov tabuľky MUSÍ obsahovať iba malé písmená a NESMIE obsahovať diakritiku a špeciálne znaky
- Názov tabuľky BY MAL byť jednoslovný, pri viacslovnom MUSIA byť slová oddelené podčiarkovníkmi NIKDY NIE medzerami
Jednoslovný názov (preferovaný)
Nesprávny príklad: Občan
Správny príklad: obcania
Viacslovný názov
Nesprávny príklad: Pasport dopravy
Správny príklad: pasport_dopravy
### Názvy stĺpcov
- Názvy stĺpcov tabuľky MUSIA jednoznačne definovať obsah daného stĺpca
- Názov stĺpca MUSÍ byť v jednotnom čísle a MUSÍ obsahovať iba malé písmená
- Slová v názve stĺpca musia byť oddelené podčiarkovníkmi NIKDY NIE medzerami
- Názvy stĺpcov tabuľky NESMÚ obsahovať diakritiku a špeciálne znaky
Nesprávny príklad: Projektové zámery
Správny príklad: projektovy_zamer
### Povinný stĺpec tabuľky
- Tabuľky MUSIA obsahovať jedinečný identifikátor, tzv. primárny kľúč - ide o povinný stĺpec každej tabuľky
**<ins>Primárny a cudzí kľúč</ins>**
**Primárny kľúč** je jedinečný identifikátor (id) každého riadku v tabuľke.
**Cudzí kľúč** je stĺpec, ktorý odkazuje na primárny kľúč inej tabuľky, čím vytvára medzi tabuľkami vzťah.
obcania
| id_obcana | meno | priezvisko |
|----------|----------|----------|
| 1 | Martin | Novák |
| 1 | Jozef | Kováč |
podnety
| id_podnetu | id_obcana | podnet |
|----------|----------|----------|
| 1 | 1 | Lorem Ipsum... |
| 2 | 1 | Lorem Ipsum... |
### Formátovanie buniek
- NESMIE sa používať zlučovanie buniek
- Bunka NESMIE obsahovať viac ako jednu hodnotu
- Bunky jedného stĺpca MUSIA obsahovať dáta práve jedného dátového typu
### Ďalšie pravidlá
- Tabuľka BY NEMALA obsahovať výpočty – tie by mala obsahovať dokumentácia pripojená k dátovému setu
- Tabuľka MUSÍ byť zdieľaná vo formáte .xls, xlsx alebo .csv
- V prípade formátu .xls, jeden hárok NESMIE obsahovať viac tabuliek
- Tabuľky BY MALI minimalizovať duplicitu dát t.j. viacnásobné zapisovanie tých istých dát
## Jednotné konvencie pre dátové typy
Táto sekcia obsahuje typické dátové typy s ich príkladmi správneho zápisu.
**Dátum (Date)**
- 01.01.2025
**Čas (Time)**
- 07:03
- 07:03:00
- 07:03:00.159
**Dátum a čas (DateTime alebo Timestamp)**
- 01.01.2025 07:03
- 01.01.2025 07:03:00
- 01.01.2025 07:03:00.159
**Číslo (Integer alebo Float)**
- 123
- 123,455
Pozn.: pre označenie percent používame desatinné číslo bez znaku % (0,2 namiesto 20%)
**Text (String/VARCHAR)**
- „Bežné výdavky v roku 2025“
**Boolean**
- True/False
- 1/0
## Geotabuľky
Pri tabuľkách definujúcich polohu (geotabuľky) MUSÍ byť stĺpec (stĺpce), ktoré jednoznačne definujú polohu daného záznamu (riadku) tabuľky.
### Spôsoby definovania polohy:
### 1. Geografické súradnice
Slúžia pre jednoznačné definovanie polohy objektu (informácie) použitím súradnicového systému World Geodetic System 1984 (WGS 84).
Konvencie:
- Súradnice MUSIA byť v dvoch osobitných stĺpcoch, v tomto poradí - geografická šírka, geografická dĺžka
- Stĺpce obsahujúce súradnice BY MALI byť označené štandardne ako X a Y resp. podobne napr. geo_sirka a geo_dlzka
- Súradnice MUSIA byť dátového typu Float (desatinné číslo)
Príklady:
- 49.00169182517054
- 21.22386968200959
### 2. Plus kódy
Plus kódy (Open Location Codes) sú systémom viacúrovňového geografického označovania, ktorý umožňuje presne určiť polohu pomocou krátkeho alfanumerického kódu.
Konvencie:
- Plus kódy BY MALI mať úplný neskrátený tvar
- Plus kódy MUSIA obsahovať iba veľké písmená, čísla a znak „+“
Príklady:
- 8GX3262F+MGH (úplný tvar)
- 262F+MGH Prešov (skrátený tvar)
## Dokumentácia dát (metadáta)
Dátový set alebo tabuľka MUSÍ obsahovať dokumentáciu. Dokumentácia BY MALA obsahovať:
- Popis obsahu dátového setu (databázy) alebo tabuľky
- Popis dát – dátové typy a vysvetlivky k jednotlivým stĺpcom t.j. popis atribútov
- Zoznam vzorcov pre numerické a logické výpočty
## Prílohy
### Príklad nesprávne formátovanej tabuľky
<table border="1">
<tbody>
<tr>
<td colspan="4">Europrojekty v oblasti IT</td>
</tr>
<tr>
<td rowspan="2">Operačné programy</td>
<td rowspan="2">Názvy projektov</td>
<td rowspan="2">Financovanie</td>
<td colspan="2">Dátumy</td>
</tr>
<tr>
<td>začatia</td>
<td>ukončenia</td>
</tr>
<tr>
<td>Plán obnovy</td>
<td>Digitálny občan</td>
<td>1 700 000 300 000</td>
<td>01.01.2025</td>
<td>01.12.2025</td>
</tr>
<tr>
<td>Program Slovensko</td>
<td>Kyberbezpečnosť</td>
<td>300 000</td>
<td>01/01/2025</td>
<td>1.6.2025</td>
</tr>
</tbody>
</table>
### Príklad správne formátovanej tabuľky
europrojekty_v_oblasti_it
<table border="1">
<tbody>
<tr>
<td>operacny_program</td>
<td>nazov_projektu</td>
<td>financovanie</td>
<td>datum_zacatia</td>
<td>datum_ukoncenia</td>
</tr>
<tr>
<td>Plán obnovy</td>
<td>Digitálny občan</td>
<td>2000000</td>
<td>01.01.2025</td>
<td>01.12.2025</td>
</tr>
<tr>
<td>Program Slovensko</td>
<td>Kyberbezpečnosť</td>
<td>300000</td>
<td>01.01.2025</td>
<td>01.06.2025</td>
</tr>
</tbody>
</table>
Loading