Trigram (lingüístico)

En lingüística , un trigrama es la asociación de tres signos que, juntos, denotan un sonido del lenguaje, ya sea porque este sonido no tiene un signo escrito dedicado o por convención ortográfica .

También es, en el campo de la escritura en sentido amplio, cualquier secuencia de 3 signos - tres caracteres manuscritos, tipográficos o informáticos  - o incluso 3 palabras , que aparecen en un texto.

Definición lingüística

Un trigrama es un grafema que asocia tres signos , posibles diacríticos no contados , que representa un solo fonema . Por tanto, un trigrama nota un sonido.

Por ejemplo, en francés , el sonido [ o ] en agua , hermoso , arroyo , foca o red se escribe con el trigrama "eau", mientras que el mismo sonido se escribe de forma más simple con el digram "au" en autor y s 'escrito en una sola letra en borracho  ;

Otro ejemplo, en bretón , el trigrama "  cʼh  " se pronuncia en una sola emisión de voz, nota una consonante fricativa velar sonora [ ɣ ] , velar sonora [ x ] , glotal sorda [ h ] u otras variantes dialectales. Solo uno de estos fonemas se conserva oralmente según el contexto.

Enfoque estadístico

Caracteres

Por extensión, en el procesamiento automático del lenguaje natural a nivel de carácter , un trigrama es una secuencia de 3 caracteres. Desde este punto de vista, los trigramas se caracterizan por sus probabilidades de aparecer en diferentes corpus de textos y no nos preocupamos por los sonidos asociados. .

Dependiendo de los idiomas y tipos de escritura , los signos en cuestión pueden ser letras , eventualmente complementadas con diacríticos o resultantes de ligaduras , espacios y signos de puntuación , los símbolos de un silabario , logogramas ,  etc. .

Palabras

La noción de trigrama también se usa a nivel de palabras  : un trigrama de palabras es una secuencia de 3 palabras de manera que podamos ubicarlas en un texto, sin necesariamente preocuparnos por su significado o su rol gramatical. Los trigramas de palabras, como los que se encuentran a nivel de personaje, se caracterizan por sus probabilidades de aparecer en diferentes corpus de textos. .

Ver también

Artículos relacionados