Preprocesor jazyka C

Kategorie: Nezařazeno (celkem: 23179 referátů a seminárek)

Informace o referátu:

Příbuzná témata



Preprocesor jazyka C

Preprocesor jazyka C (cpp) je preprocesor používaný zejména během překladu zdrojových kódů programů napsaných v programovacím jazyce C. V mnoha implementacích se jedná o samostatný program, spouštěný překladačem v rámci první fáze překladu. Preprocesor interpretuje direktivy pro vložení zdrojového kódu z jiného souboru (#include), definici maker (#define) a podmíněné vložení kódu (#if). Jazyk direktiv preprocesoru není úzce spojený se syntaxí jazyka C, takže preprocesor C lze využít i na zpracování jiných typů souborů.

Obsah

Fáze překladu zdrojového kódu v C

  1. Nahrazení trigramů (v podstatě jde o escape sekvence, které umožňují zadávání potřebných 7-bit ASCII znaků i z jiných, většinou starších kódových tabulek).
  2. Spojení řádků – fyzické řádky zdrojového textu, které jsou zakončeny escape-sekvencí nového řádku (v podstatě jde o obrácené lomítko použité jako poslední znak na řádku), jsou spojeny do jediného logického řádku.
  3. Tokenizace – preprocesor zalomí výsledek do posloupnosti tzv. tokenů preprocesoru a bílých znaků (mezery, tabelátory a konce řádků). Komentáře jsou nahrazeny bílým znakem.
  4. Přepsání maker a provedení direktiv 0 v této fázi jsou expandována makra a provedeny direktivy, jako např. vložení zdrojového kódu z jiného souboru nebo vynechání části zdrojového kódu v případě podmíněného překladu.

Vkládání souborů

Nejčastěji využívanou direktivou preprocesoru je vložení jiného souboru:

#include <stdio.h>
 
int main (void)
{
    printf("Hello, world!
");
    return 0;
}

V tomto případě direktiva #include vložila na začátek zdrojového souboru obsah souboru stdio.h, který musí být v systému uložen ve specifickém adresáři (v unixových systémech jde o adresář /usr/include).

Podmíněný překlad

Direktivy #if, #ifdef, #ifndef, #else, #elif a #endif umožňují podmíněný překlad vybraných částí zdrojového kódu.

#define __WINDOWS__
 
#ifdef __WINDOWS__
#include <windows.h>
#else
#include <unistd.h>
#endif

Často se podmíněný překlad používá, aby zabránil vícenásobnému vložení téhož kódu. Následující příklad zajistí, že kód bude vložen pouze jednou, bez ohledu na to, kolikrát bude direktivou #include vložen soubor, který jej obsahuje. To je užitečné při tvorbě složitějších programů, složených z mnoha souborů.

#ifndef SOUBOR_A
#define SOUBOR_A
...
kód
...
#endif

Definice a expanze maker

Používají se dva základní typy definice maker. Jednak lze definovat makra bez parametru, která expandují vždy do stejné sekvence znaků (resp. tokenů), jednak lze definovat makra s parametry, které se z praktického hlediska chovají podobně jako funkce. Obecná syntaxe direktivy #define je:

#define <identifikátor> <seznam nahrazujících tokenů>
#define <identifikátor>(<seznam parametrů>) <seznam nahrazujících tokenů>

Speciálním případem je definice samotného identifikátoru, kterému není přiřazen žádný další seznam tokenů – příklad použití takovéto definice byl uveden v sekci 'Podmíněný překlad.

Příkladem makra, které nepřijímá žádné parametry, může být následující použití preprocesoru k definici číselné konstanty:

#define PI 3.14159

Příkladem makra, které přijímá parametr (argument):

#define RADTODEG(x) ((x) * 57.29578)

Při použití takto definovaného makra se nesmí mezi názvem makra a závorkou, ve které je uveden jeden nebo více parametrů (argumentů), vyskytovat žádné bílé znaky (tzn., např. tam nesmí být uvedena mezera).

Specifickým rysem maker C preprocesoru z hlediska programování v jazyce C je to, že jde pouze o zestručněný zápis zdrojového kódu (podobně jako v případě některých skriptovacích jazyků) – nikoliv o skutečnou definici funkce. Proto parametry maker např. nepodléhají typové kontrole jazyka C. Tento zápis se nechová jako funkce a někdy to může vést k obtížně odhalitelným chybám. Například makro

#define NASOBEK(a,b) a*b

použité ve výrazu

c=NASOBEK(2+2,5+5)

expanduje jako

c=2+2*5+5

Výsledek není tedy mylně očekávaných 40 ale 17. Takové chybě se dá v tomto konkrétním případě zabránit uzavřením matematického výrazu do závorek (podobně jako u ukázkového makra RADTODEG(x) v předchozím příkladu). Obecným řešením je nepoužívání nadměrně komplikovaných maker. V tomto konkrétním případě stačí dané makro přepsat jako

#define NASOBEK(a,b) ((a)*(b))

Obtížněji řešitelným problémem je tzv. vícenásobná evaluace (vyhodnocení) parametrů makra - pokud je parametrem makra např. volání funkce, tak na rozdíl od obyčejného volání funkce, kdy by byla funkce zavolána jen jednou a pak se pracovalo s její návratovou hodnotu, je v případě makra funkce zavolána pokaždé, když se definice makra odkazuje na daný parametr. Kromě volání funkcí je toto chování nepříjemné např. i při použití specifických C operátorů jako ++, --, apod.

Ustálené zvyklosti

Existuje nezávazná konvence využití dostupného prostoru jmen, podle které jsou v názvech maker preprocesoru jazyka C vždy používána pouze velká písmena A-Z (spolu s číslicemi a podtržítky), zatímco názvy funkcí a proměnných v C jsou obvykle tvořená pouze malými písmeny a-z (spolu s číslicemi a podtržítky, někdy je použita kombinace velkých a malých písmen). Nicméně jde pouze o konvenci usnadňující čtení zdrojového kódu: lze použít i názvy maker tvořené malými písmeny nebo kombinací velkých a malých písmen (stejně tak lze pojmenovat funkce a proměnné v C naopak velkými písmeny)



Nový příspěvek


Ochrana proti spamu. Kolik je 2x4?



Na-mobil.cz

Spřátelené weby

Přidat stránku k oblíbeným

Nejnovější v diskusi

Diskusní fórum »

TIP: Chcete zkrátit dlouho chvíli sobě nebo blízkému?
Klikněte na Puzzle-prodej.cz a vyberte si z 5000 motivů skladem!
TIP: Hračky a hry za dobré ceny?
Klikněte na Hračky obchod.cz a vyberte si z tisícovky hraček skladem!