|
|
L'alphabet arabe est l'alphabet utilisé principalement pour écrire la langue arabe.
En tant qu'alphabet de la langue du Coran, sacrée pour les musulmans, son influence s'est étendue avec celle de l'Islam et il a été aussi utilisé (ou l'est encore) pour écrire d'autres langues qui n'ont aucune parenté avec l'arabe, comme le persan, le turc avant 1928 (date à partir de laquelle Mustafa Kemal Atatürk a imposé la transcription latine), la kâshmîrî, le sindhi, ou encore l'ourdou et le kurde (toutes ces langues, d'ailleurs, sauf le turc, étant indo-européennes). On a souvent dû ajouter ou modifier certaines lettres pour adapter cet alphabet au système phonologique des langues en question. Certaines langues d'Afrique, comme le haoussa, l'ont aussi utilisé avant de passer à une transcription latine. Pour plus de détails concernant les adaptations de l'alphabet arabe, consulter Adaptations de l'alphabet arabe.
Cet article ne traite pas de la prononciation de cet alphabet.
Introduction
L'alphabet arabe comprend vingt-neuf lettres fondamentales (vingt-huit si l'on exclut la hamza, qui se comporte soit comme une lettre à part entière soit comme un diacritique) et s'écrit de droite à gauche. Il n'y a pas de différence entre les lettres manuscrites et les lettres imprimées ; les notions de lettre capitale et lettre minuscule n'existent pas (l'écriture est donc monocamérale). En revanche, la plupart des lettres s'attachent entre elles, même en imprimerie, et leur graphie diffère selon qu'elles sont précédées et/ou suivies d'autres lettres ou qu'elles sont isolées (on parle de variantes contextuelles). Certaines lettres, cependant, ne s'attachent jamais à la lettre suivante : de fait, un mot unique peut être entrecoupé d'un ou plusieurs espacess, lequel est aussi utilisé pour séparer les mots. Il est généralement plus grand que l'espacement à l'ntérieur des mots portant une lettre ne s'attachant pas.
L'alphabet arabe est un abjad, terme technique décrivant les écritures dans lesquels les voyelles ne sont pas explicitement notées ; le lecteur doit donc connaître la langue pour les restituer. Dans les éditions du Coran ou les ouvrages didactiques, cependant, on utilise une notation vocalique plus ou moins précise sous forme de diacritiques. Il existe, de plus, dans de tels textes, dits « vocalisés », une série d'autres diacritiques de syllabation dont les plus courants sont l'indication de l'absence de voyelle (sukūn) et la gémination des consonnes (šadda).
On fait remonter cet alphabet à l'araméen dans sa variante nabatéenne ou syriaque, lui-même descendant du phénicien (alphabet qui, entre autres, donne naissance à l'alphabet hébreu, à l'alphabet grec et, partant, au cyrillique, aux lettres latines, etc.). La première attestation d'un texte en alphabet arabe remonte à 512 de notre ère. C'est au VIIe siècle qu'on a ajouté des points sur ou sous certaines lettres afin de les différencier, le modèle araméen ayant moins de phonèmes que l'arabe et l'écriture des origines ayant donc dû confondre par une même lettre plusieurs phonèmes. Lors de ces modifications, l'ordre des lettres a été changé : de fait, l'alphabet arabe ne suit plus l'ordre traditionnel des autres alphabets sémitiques, dit ordre levantin, comme l'hébreu le fait encore.
Pour plus de détails, consulter l'article Histoire de l'alphabet arabe
L'alphabet arabe peut être translittéré et transcrit de diverses manières. On utilisera de préférence dans ce document la translittération DIN-31635. Il peut être codé par plusieurs jeux de caractères, parmi lesquels ISO-8859-6 et Unicode, grâce au bloc « Arabe », des emplacement U+0600 à U+06FF. Ces deux jeux, cependant, n'indiquent pas pour chaque caractère la forme contextuelle qu'il doit prendre. C'est au moteur de rendu de sélectionner le bon œil. Il existe cependant, dans le cas où l'on voudrait coder une forme particulière d'un caractère, les blocs « Formes de présentation arabe A » (U+FB50 à U+FDFF) et « Formes de présentation arabe B » (U+FE70 à U+FEFF), qui contiennent la majorité des caractères en variante contextuelle ainsi que les caractères étendus propres à d'autres langues. Il est aussi possible d'utiliser les liants sans et avec chasse. Enfin, le codage de l'arabe est logique, c'est-à-dire qu'on entre les caractères à la suite sans se soucier du sens de l'écriture (nécessairement inversé pour un Occidental). C'est encore une fois au moteur de rendu qu'il revient d'afficher les caractères dans le bon sens. À cet égard, si les mots arabes de cette page sont affichés à l'envers, c'est que votre moteur de rendu Unicode n'est pas assez récent. Pour plus de détails concernant les questions de codage de l'arabe, consultez la traduction française du manuel d'Unicode, disponible sur le site Hapax.
Conventions de transcription et d'écriture
La transcription et la translittération suivent principalement la norme DIN-31635 ; les variantes appartenant à d'autres normes sont indiquées après barre oblique. Noter que le macron suscrit au dessus des voyelles peut être aisément remplacé par un accent circonflexe. Une translittération de l'arabe doit faire apparaître clairement les caractères qui ne se prononcent pas ou se prononcent comme d'autres afin d'être non ambiguë ; une transcription n'indique cependant que la prononciation. Voir plus bas pour plus de détails. La transcription phonétique (ici quelque peu simplifiée) suit les conventions de l'API : pour plus de détails concernant la prononciation de l'arabe, consultez l'article Phonologie de l'arabe.
Dans cet article, sauf mention contraire, l'arabe sera transcrit et non translittéré. Les termes notés en arabe sont entièrement vocalisés et tous les diacritiques sont indiqués (sauf certains sukūn). Dans la pratique, ce type de notation complète est très rare et ne se rencontre que dans les ouvrages didactiques, ce qui est le cas ici.
| Graphie isolée | Graphie initiale | Graphie médiane | Graphie finale | Nom | Trans. | Valeur |
|---|---|---|---|---|---|---|
| ﺀ | أ, إ, ؤ, ئ | hamza | ʾ / ’ et ‚ | [ʔ] | ||
| ﺍ | — | ﺎ | ʾalif | ā / â | [aː] | |
| ﺏ | ﺑ | ﺒ | ﺐ | bāʾ | b | [b] |
| ﺕ | ﺗ | ﺘ | ﺖ | tāʾ | t | [t] |
| ﺙ | ﺛ | ﺜ | ﺚ | ṯāʾ | ṯ / th | [θ] |
| ﺝ | ﺟ | ﺠ | ﺞ | ǧīm | ǧ / j / dj | [ʤ] |
| ﺡ | ﺣ | ﺤ | ﺢ | ḥāʾ | ḥ | [ħ] |
| ﺥ | ﺧ | ﺨ | ﺦ | ḫāʾ | ḫ / ẖ / kh | [x] |
| ﺩ | — | ﺪ | dāl | d | [d] | |
| ﺫ | — | ﺬ | ḏāl | ḏ / dh | [ð] | |
| ﺭ | — | ﺮ | rāʾ | r | [r] | |
| ﺯ | — | ﺰ | zāy | z | [z] | |
| ﺱ | ﺳ | ﺴ | ﺲ | sīn | s | [s] |
| ﺵ | ﺷ | ﺸ | ﺶ | šīn | š / sh | [ʃ] |
| ﺹ | ﺻ | ﺼ | ﺺ | ṣād | ṣ | [sˁ] |
| ﺽ | ﺿ | ﻀ | ﺾ | ḍād | ḍ | [dˁ], [ðˤ] |
| ﻁ | ﻃ | ﻄ | ﻂ | ṭāʾ | ṭ | [tˁ] |
| ﻅ | ﻇ | ﻈ | ﻆ | ẓāʾ | ẓ | [zˁ], [ðˁ] |
| ﻉ | ﻋ | ﻌ | ﻊ | ʿayn | ʿ / ‘ | [ʔˤ] |
| ﻍ | ﻏ | ﻐ | ﻎ | ġayn | ġ / gh | [ɣ] |
| ﻑ | ﻓ | ﻔ | ﻒ | fāʾ | f | [f] |
| ﻕ | ﻗ | ﻘ | ﻖ | qāf | q / ḳ | [q] |
| ﻙ | ﻛ | ﻜ | ﻚ | kāf | k | [k] |
| ﻝ | ﻟ | ﻠ | ﻞ | lām | l | [l] |
| ﻡ | ﻣ | ﻤ | ﻢ | mīm | m | [m] |
| ﻥ | ﻧ | ﻨ | ﻦ | nūn | n | [n] |
| ﻩ | ﻫ | ﻬ | ﻪ | hāʾ | h | [h] |
| ﻭ | — | ﻮ | wāw | w | [w] | |
| ﻱ | ﻳ | ﻴ | ﻲ | yāʾ | y | [j] |
Les lettres sans graphie initiale ni médiane ne sont jamais liées à la lettre suivante, même dans un mot. Quant à la ﺀ hamza, elle n'a qu'une seule graphie, car elle n'est jamais liée ni à la lettre qui précède, ni à celle qui suit. La hamza peut aussi se comporter comme un diacritique (on dit alors qu'elle a un support). Aucun mot ne commence dans le dictionnaire par un ʾalif : de fait, hamza est la première lettre, bien que, traditionnellement et historiquement, ce rôle échée à ʾalif.
| Graphie isolée |
Graphie initiale |
Graphie médiane |
Graphie finale |
Nom | Trans. | Valeur |
|---|---|---|---|---|---|---|
| ﺓ | — | ﺔ | tāʾ marbūṭa | h et t / Ø / h / ẗ | [t], [h], Ø | |
| ﻯ | — | ﻰ | ʾalif maqṣūra | ā / ỳ | [(a)ː] | |
| ﻻ | — | ﻼ | lām ʾalif | lā | [l(a)ː] | |
Dans une prononciation soutenue, on fait entendre à la pause un [h] à la place du [t]. Le tāʾ marbūṭa est rarement transcrit quand il est muet ; seule la translittération en indique généralement la présence (voir plus bas à la section « Translittération »), mais les usages sont très fluctuants. Dans cette encyclopédie, le tāʾ marbūṭa sera noté par ʰ.
Pour faciliter la lecture, cependant, et ce dans un cadre didactique ou religieux, de nombreux signes auxiliaires viennent rendre le texte moins ambigu : l'arabe ne notant normalement pas les voyelles, par exemple, ni les géminations ou encore les assimilations, il n'est pas possible à un lecteur débutant de lire à voix haute un texte sans l'aide de ces signes, ou sans une bonne connaissance de la langue.
Les diacritiques utilisés sont décrits en détail dans l'article Diacritiques de l'alphabet arabe, qu'il est conseillé de lire avant de poursuivre plus avant la lecture de cet article. Les mots arabes cités ici, en effet, utilisent ces diacritiques et leur connaissance est nécessaire à la compréhension de certains points.
L'alphabet arabe se sert maintenant de la lettre hamza pour transcrire le coup de glotte, phonème qui, en arabe, peut se manifester n'importe où dans un mot, même à l'initiale ou en finale. Cette lettre, cependant, ne fonctionne pas comme les autres : elle peut être écrite seule ou avoir besoin d'un support, auquel cas elle devient un diacritique :
Tāʾ marbūṭa
Le ة tāʾ marbūṭa (« tāʾ bouclé » ; c'est, historiquement, un dérivé du ت tāʾ et non du ه hāʾ, d'où la présence des deux points) est une consonne, à savoir un /t/ ; toutefois, elle ne se trouve qu'en fin de mot et toujours précédée de /a/ (qui n'est que rarement écrit). Le son /t/ n'est prononcé que si les voyelles casuelles finales qui suivent la lettre le sont aussi ; or, ces voyelles sont souvent omises dans la prononciation courante. C'est pour cette raison qu'on indique, improprement, que cette lettre vaut [a(t)]. ʾAlif maqṣūra
La lettre ى ʾalif maqṣūra ne s'utilise qu'en fin de mot ; c'est une lettre de prolongement pour le phonème /a/. Son nom indique le son obtenu, « ʾalif de prolongement », et non sa forme, puisque la lettre ressemble à un ي yāʾ. Son utilisation est décrite à la section « Voyelles longues et lettres de prolongement ».Ligature lām ʾalif
Lorsqu'un ل lām est suivi d'un ا ʾalif, il faut remplacer les deux lettres par la ligature لا ; il existait auparavant d'autres ligatures de ce type, qui ne sont cependant plus utilisées. On peut encore les rencontrer dans des textes anciens.ʾAlif muet
Dans quelques mots, et surtout au cours de la flexion verbale, on peut écrire un ʾalif qui ne se prononce pas et ne sert pas de support à un diacritique. On le trouve principalement dans le mot مِائَة miʾa, « cent » (qui serait écrit plus régulièrement مِئَة). Dans la conjugaison, on ajoute un ʾalif muet après un wāw و en fin de mot ; ainsi :
Diacritiques
Tel qu'écrit couramment, l'alphabet arabe n'utilise pour ainsi dire pas de diacritiques, outre le point souscrit ou suscrit obligatoire pour disinguer des lettres ambiguës (consulter Histoire de l'alphabet arabe pour plus de détails). Notation des voyelles
Toutes les lettres des tableaux précédents sont des consonnes (ou des lettres muettes), contrairement à ce qu'on pourrait croire. Les voyelles ne sont que rarement notées, et si elles le sont, c'est sous la forme de diacritiquess.Voyelles brèves
Celles-ci ne sont pas indiquées autrement que par des diacritiques, et ce seulement pour lever des ambiguïtés (rarement) ou dans les ouvrages didactiques ou religieux.Voyelles longues et lettres de prolongement
Quatre lettres, dites « de prolongement », sont employées pour indiquer la présence d'une voyelle longue — qui, elle, n'est normalement pas écrite —, ا ʾalif, ى ʾalif maqṣūra (seulement en fin de mot), ي yāʾ, et و wāw. Ces deux dernières sont aussi les consonnes pleines y et w. Dans un texte non vocalisé, ce qui est de loin le cas le plus fréquent, l'on obtient les ambivalences suivantes :
En fait, l'arabe, par exemple pour le son ū, décompose logiquement le phonème long en uw ; comme seule la consonne est écrite, celle-ci semble noter aussi ū. De sorte, ces lettres, qui sont toutes des consonnes (historiquement pour ا ʾalif), peuvent, d'une certaine manière, remplir le rôle de voyelles longues ; on dit alors qu'elles sont des matres lectionis (en latin « mère de la lecture »). En effet, l'alphabet arabe, bien qu'il soit un abjad purement consonantique, marque systématiquement l'emplacement de voyelles longues : partant, ces signes indiquant les emplacements en question sont aussi lus comme des voyelles. D'autres écritures sémitiques, comme l'alphabet hébreu, retiennent ce procédé.Diphtongues
Deux diphtongues sont principalement utilisées, ay et aw ; comme a n'est normalement pas écrit, seul le deuxième élément, y ou w l'est, au moyen de la consonne idoine, ي yāʾ ou و wāw, ce qui crée une nouvelle ambiguïté ; en effet, ي yāʾ et و wāw peuvent donc être lus comme :
Écriture de la hamza
Historiquement, la lettre ʾalif notait une occlusive glottale, ou « coup de glotte », transcrite par [ʔ], ce que confirment les alphabets issus de la même origine phénicienne. Or, il a servi, de la même manière que dans d'autres abjads, avec yāʾ et wāw, de mater lectionis, c'est-à-dire de caractère de remplacement pour noter une voyelle longue (voir plus bas). De fait, au cours du temps sa valeur phonétique s'est effacée et, depuis, ʾalif sert principalement à remplacer des phonèmes, noter l'allongement de la voyelle /a/ ou servir de support graphique à certains signes.
Le détail de l'écriture de la hamza est trop complexe pour être traité ici ; un article séparé lui est consacré : Alphabet arabe (écriture de la hamza).Assimilations
L'alphabet arabe ne note pas les cas d'assimilations des consonnes en contact :
| Graphie | Translittération | Transcription |
|---|---|---|
| ز ,ر ,ذ ,د ,ث ,ت + أَل |
ʾal + t-, ṯ-, d-, ḏ-, r-, z- | ʾal + t-, ṯ-, d-, ḏ-, r-, z- |
| = | = | = |
| أَلزّ ,أَلرّ ,أَلذّ ,أَلدّ ,أَلثّ ,أَلتّ |
ʾaltt-, ʾalṯṯ-, ʾaldd-, ʾalḏḏ-, ʾalrr-, ʾalzz- | ʾat-t-, ʾaṯ-ṯ-, ʾad-d-, ʾaḏ-ḏ-, ʾar-r-, ʾaz-z- |
| ض ,ص ,ش ,س + أَل | ʾal + s-, š-, ṣ-, ḍ- | ʾal + s-, š-, ṣ-, ḍ- |
| = | = | = |
| أَلضّ ,أَلصّ ,أَلشّ ,أَلسّ | ʾalss-, ʾalšš-, ʾalṣṣ-, ʾalḍḍ- | ʾas-s-, ʾaš-š-, ʾaṣ-ṣ-, ʾaḍ-ḍ- |
| ن ,ل ,ظ ,ط + أَل | ʾal + ṭ-, ẓ-, l-, n- | ʾal + ṭ-, ẓ-, l-, n- |
| = | = | = |
| أَلنّ ,أَللّ ,أَلظّ ,أَلطّ | ʾalṭṭ-, ʾalẓẓ-, ʾalll-, ʾalnn- | ʾaṭ-ṭ-, ʾaẓ-ẓ-, ʾal-l-, ʾan-n- |
Lettres utilisées pour d'autres langues
En arabe même, dans l'alphabet dit « occidental », la lettre fāʾ était écrite ڢ (au lieu de ف de l'alphabet oriental), tandis que qāf était représentée par ڧ (plutôt que ق). De nos jours, les éditions maghrébines suivent les usages orientaux.
Pour les langues autres que l'arabe, consulter Alphabet arabe (adaptations).
Ponctuation
L'arabe s'écrivant de droite à gauche, les éditions modernes utilisent des signes de ponctuation respectant cette écriture, à savoir :
Numération
Consulter l'article Numération arabe.Styles d'écritures
[À compléter]À propos de la translittération
On l'a vu, certaines lettres ont plusieurs fonctions, d'autres sont muettes : la transcription est donc souvent ambiguë :
Toutes ces raisons font qu'il est parfois utile d'utiliser une translittération précise qui suive l'original arabe, caractère par caractère. La norme ISO 233 permet cela (dans les exemples suivants, on placera les translittérations entre accolades) :
Articles connexes