3) Rappresentazione Formale
Chomsky afferma che le nozioni di grammatico e non grammatico possono essere definite in maniera utile e significativa.
Egli sostiene quindi che l'intuizione che ne ha un parlante madrelingua è sufficiente a definire la natura grammatica di una frase; cioè a dire, se un determinato flusso di parole inglesi sollecita in un individuo che parla inglese dalla nascita un doppio senso, o la sensazione che in esso vi sia qualcosa di sbagliato, si può sostenere che il flusso sia non grammatico (posto che i diversi fattori esterni che possono influenzare un'intuizione possano essere esclusi). Questo, sostiene Chomsky, è cosa completamente diversa dalla questione che una frase abbia un significato o possa essere compresa. È ben possibile per una frase essere grammaticale eppure priva di senso, come nel famoso esempio dello stesso Chomsky, in cui "verdi idee senza colore dormono furiosamente".
Le grammatiche generative possono essere descritte e confrontate fra loro con l'aiuto della Gerarchia di Chomsky, da lui proposta negli anni cinquanta. Questa definisce una serie di tipi di grammatiche formali aventi potere espressivo crescente. Ne deriva che il modello teorico grammaticale elaborato da Chomsky è ben adatto a descrivere gli infiniti tipi di linguaggi di tipo generativo, da quello meccanico-informatico a quello creativo-umano.
La gerarchia di Chomsky è composta dai seguenti livelli:
• Grammatiche di tipo-0 (grammatiche illimitate) include tutte le grammatiche formali. Queste grammatiche generano esattamente tutti i linguaggi che possono essere riconosciuti da una Macchina di Turing. Questi linguaggi sono anche conosciuti come linguaggi ricorsivamente enumerabili. Da notare che questi linguaggi sono differenti dai linguaggi ricorsivi che possono essere riconosciuti da una macchina di Turing che termina sempre.
• Grammatiche di tipo-1 (grammatiche dipendenti dal contesto) generano linguaggi dipendenti dal contesto. I linguaggi descritti da queste grammatiche sono esattamente tutti i linguaggi che possono essere riconosciuti da una macchina di Turing non deterministica nella quale il nastro è limitato da un numero costante di volte la lunghezza dell'input.
• Grammatiche di tipo-2 (grammatiche libere dal contesto) generano linguaggi liberi dal contesto. Questi linguaggi sono esattamente tutti i linguaggi che possono essere riconosciuti da un automa a pila non deterministico. I linguaggi context free sono teoricamente le basi per la sintassi di molti linguaggi di programmazione (Analisi sintattica).
• Grammatiche di tipo-3 (grammatiche regolari) generano linguaggi regolari. Questo tipo di grammatiche restringe le sue regole ad un singolo simbolo non terminale nel lato sinistro della produzione e nel lato destro un singolo simbolo terminale, che può essere seguito (o preceduto, ma non entrambe le forme nella stessa grammatica) da un singolo simbolo non terminaleQuesti linguaggi sono esattamente tutti i linguaggi riconosciuti da un automa a stati finiti. Oltretutto, questa famiglia di linguaggi formali può essere ottenuta con espressioni regolari. I linguaggi regolari sono comunemente usati per definire modelli di ricerca (search patterns) e la struttura lessicale dei linguaggi di programmazione (Analisi lessicale (informatica)).
Fra i tipi più semplici ci sono le grammatiche regolari (regular grammars) (tipo 3). Chomsky sostiene che i linguaggi regolari non sono adeguati come modelli del linguaggio umano, perché tutti i linguaggi umani consentono l'annidamento di stringhe all'interno di stringhe in modo gerarchico.
A un livello più alto ci sono le grammatiche libere dal contesto (context-free grammars) (tipo 2). La derivazione di una frase da una grammatica libera dal contesto può essere descritta come un albero di derivazioni, o albero sintattico.
Il lavoro dei linguisti nell'ambito della grammatica generativa vede spesso tale albero di derivazioni come un oggetto di studio fondamentale. Secondo questo punto di vista, una frase non è semplicemete una stringa di parole, ma piuttosto un albero con rami subordinati e sopraordinati connessi a dei nodi.
Sostanzialmente, il modello ad albero funziona in qualche modo come il seguente esempio (frase semplice), nel quale F è una frase (sentence), Det è un determinante (determiner), N è un sostantivo (noun), V è un verbo (verb), SN è un sintagma nominale (noun phrase) e SV è sintagma verbale (verb phrase):
F
/ \
/ \
/ \
/ \
/ \
SN SV
/ \ / \
/ \ / \
/ \ / \
Det N V SN
Il cane mangia / \
Det N
l' osso
La frase risultante potrebbe essere
Il cane mangia l'osso. Questo diagramma ad albero è anche chiamato un indicatore sintagmatico (phrase marker). Esso può essere rappresentato più convenientemente in forma testuale, sebbene il risultato sia meno facilmente leggibile).
In questo formato la suddetta frase sarebbe resa nel modo seguente:
[F [SN [Det Il ] [N cane ] ] [SV [V mangia ] [SN [Det l' ] [N osso ] ] ] ]
Comunque Chomsky a un certo punto ha affermato che anche le grammatiche a struttura sintagmatica (phrase structure grammars) sono inadeguate per descrivere i linguaggi naturali. Per far fronte a questa necessità, egli formulò allora il sistema più complesso della grammatica trasformazionale.
Spero di essere stato utile.