RAIRO-Theor. Inf. Appl. 41 (2007) 425–446
DOI: 10.1051/ita:2007027
COMBINATOIRE DE MOTS R
´
ECURRENTS
DE COMPLEXIT
´
E n +2
Idrissa Kabor
´
e
1
et Th
´
eodore Tapsoba
2
Abstract. Combinatorics on recurrent words with subword
complexity n+2. We state some new properties on Sturmian words
and classify words which have, for any nonnegative integer n,exactly
n + 2 subwords of length n.Wealsodefinethenotionofk by k inser-
tion on infinite words and we give a formula for the complexity function
of words obtained by applying that notion to Sturmian words. Lastly
we study balance property and palindrome complexity of a subclass of
words with complexity n + 2 called quasi-Sturmian words by insertion;
w e give a characterization of this subclass with Parikh vectors.
R´esum´e. Nous ´etablissons quelques propri´et´es des mots sturmiens
et classifions, ensuite, les mots infinis qui poss`edent, pour tout entier
naturel non nul n, exactement n + 2 facteurs de longueur n.Nous
d´efinissons ´egalement la notion d’insertion k `a k sur les mots infinis
puis nous calculons la complexit´e des mots obtenus en appliquant cette
notion aux mots sturmiens. Enfin nous ´etudions l’´equilibre et la palin-
dromie d’une classe particuli`eredemotsdecomplexit´e n +2quenous
appelons mots quasi-sturmiens par insertion et que nous caract´erisons
`a l’aide des vecteurs de Parikh.
Classification Math´ematique. 68R15.
1. Introduction
La fonction de complexit´e p, qui calcule le nombre de facteurs de longueur
donn´ee dans un mot, est souvent utilis´ee pour caract´eriser certaines familles de
mots [3]. Ainsi on sait, depuis les r´esultats pr´ecurseurs de Morse et Hedlund [17,18],
Mots Cl´es. Mot sturmien, complexit´e, mot quasi-sturmien par insertion.
Sturmian word, complexity, quasi-Sturmian word by insertion.
1
Institut Sciences Exactes et Appliqu´ees, Univ. polytech. de Bobo-Dioulasso, 01 BP 1091
Bobo-Dioulasso 01, Burkina Faso ; ikaborei@yahoo.fr
2
´
Ecole Sup´erieure d’Informatique, Univ. polytech. de Bobo-Dioulasso, 01 BP 1091
Bobo-Dioulasso 01, Burkina Faso ; theo
tapsoba@univ-ouaga.bf
c
EDP Sciences 2007
Article published by EDP Sciences and available at http://www.rairo-ita.org or http://dx.doi.org/10.1051/ita:2007027
426 I. KABOR
´
EETT.TAPSOBA
qu’un mot dont la fonction de complexit´ev´erifie p(n) ≤ n pour un certain entier n
est ultimement p´eriodique, et que les mots sturmiens sont les mots de complexit´e
minimale parmi les mots infinis non ultimement p´eriodiques. Depuis ces travaux,
de nombreuses ´etudes comme par exemple [5,8,9,11,12,16,21] ont ´et´emen´ees sur
les mots sturmiens et ont conduit `adenombreusesg´en´eralisations parmi lesquelles
les mots quasi-sturmiens. Un mot infini est dit quasi-sturmien s’il existe des entiers
n
0
et k tels que p(n)=n + k pour tout n ≥ n
0
. Dans les ann´ees 1975 on ´etudiait
d´ej`a ces mots [8, 9, 19], mais c’est au milieu des ann´ees 1990 que l’expression
de (( mot quasi-sturmien )) a´et´e utilis´ee pour les d´esigner du fait qu’ils ont des
propri´et´es tr`es proches des mots sturmiens. En effet, les mots quasi-sturmiens ont
une combinatoire assez proche des mots sturmiens et leurs caract´erisations font
intervenir ces derniers [1,2, 7, 8, 10,13, 14].
Les palindromes et la fonction de complexit´e palindromique interviennent dans
l’´etude combinatoire des mots infinis. Des r´esultats int´eressants ont ´et´e obtenus
pour certaines classes de mots (voir par exemple [4]) et en particulier une ca-
ract´erisation des mots sturmiens [11].
Dans ce travail, apr`es avoir donn´e quelques notations et d´efinitions utiles
(sect. 3) nous ´etablissons des propri´et´es combinatoires des mots sturmiens (sect. 4)
puis nous classifions tous les mots quasi-sturmiens de complexit´e n + 2 (sect. 5).
Ensuite nous introduisons, dans la section 6, la notion (( d’insertion k `a k )) sur
les mots infinis puis nous calculons la complexit´e des mots obtenus en appliquant
l’insertion k `a k aux mots sturmiens. Enfin, `a la section 7, nous ´etudions l’´equilibre
et la palindromie d’une classe particuli`ere des mots de complexit´e n +2 quenous
appelons mots quasi-sturmiens par insertion et que nous caract´erisons `a l’aide des
vecteurs de Parikh.
2. Pr
´
eliminaires
La plupart des notations utilis´ees ici peuvent ˆetre retrouv´ees dans le livre de
Lothaire [15].
Soit A un alphabet fix´e. A
∗
, l’ensemble des mots finis sur A,estlemono¨ıde libre
engendr´eparA, ε le mot vide ´etant l’´el´ement neutre. A
+
est l’ensemble des mots
finis non vides. Pour tout u ∈ A
∗
, |u| d´esigne la longueur du mot u (|ε| =0)et
pour toute lettre x de A, |u|
x
est le nombre d’occurrences de x dans u.Unmotu de
longueur n form´e d’une seule lettre x est simplement not´e u = x
n
;parextension
x
0
= ε.Soitu = u
1
u
2
···u
n
un mot tel que u
i
∈ A pour tout i ∈{1, 2, ..., n}.
Le mot miroir de u que l’on note
u est le mot obtenu en lisant u de la droite vers
la gauche, c’est-`a-dire
u = u
n
u
n−1
···u
1
.Siu et v sont deux mots de A
∗
on a
uv = v u. On dit qu’un mot u est un palindrome s’il est identique `a son image
miroir, c’est-`a-dire
u = u. Par exemple les mots (( elle )) , (( ´et´e )) , (( ici )) et (( tˆot ))
sont des palindromes en fran¸cais.
Un mot infini est une suite de lettres de A index´ee par N.Ond´esigne par A
ω
l’ensemble des mots infinis sur A et on pose A
∞
= A
∗
∪A
ω
. Pour tout mot u ∈ A
∞
,
on note alph(u) l’ensemble des lettres de A pr´esentes dans u.
COMBINATOIRE DE MOTS R
´
ECURRENTS DE COMPLEXIT
´
E N +2 427
Un mot infini u est dit ultimement p´eriodique s’il existe un entier non nul τ
et un entier n
0
tels que u
i+τ
= u
i
pour tout i ≥ n
0
. Ainsi un mot infini u est
ultimement p´eriodique s’il existe deux mots v ∈ A
∗
et w ∈ A
+
tels que u = vw
ω
o`u w
ω
= www ··· est une concat´enation infinie de w.
On d´efinit la puissance n-i`eme d’un mot fini w comme ´etant la concat´enation
n fois de w ;onlanotew
n
.
Soient u ∈ A
∞
et v ∈ A
∗
.Lemotv est un facteur de u s’il existe u
1
∈ A
∗
et
u
2
∈ A
∞
tels que u = u
1
vu
2
; on dit aussi que u contient v.Lefacteurv est dit
pr´efixe (resp. suffixe) si u
1
(resp. u
2
)estlemotvide.
Soient u ∈ A
ω
, w un facteur de u et x une lettre de A. Le langage de longueur
n de u,not´e L
n
(u), est l’ensemble des facteurs de u de longueur n. L’ensemble de
tous les facteurs de u est simplement not´e L(u). La lettre x est un prolongement `a
gauche (resp. `adroite)dew si xw (resp. wx) appartient `a L(u). On note ∂
−
w (resp.
∂
+
w)lenombredeprolongements`a gauche (resp. `adroite)dew. On dira qu’un
facteur w est biprolongeable (resp. triprolongeable) `adroitesi∂
+
w =2(resp.
∂
+
w =3).Delamˆeme mani`ere on d´efinit la notion de facteur biprolongeable
ou triprolongeable `a gauche. Un facteur est dit sp´ecial `a gauche (resp. `adroite)
s’il admet plusieurs prolongements `a gauche (resp. `adroite).Unfacteur`alafois
sp´ecial `a gauche et `a droite est dit bisp´ecial.
Un mot u est dit r´ecurrent si tout facteur de u apparaˆıt une infinit´e de fois dans
u. Un mot est dit uniform´ement r´ecurrent ou minimal si tout facteur apparaˆıt
avec des lacunes born´ees, c’est `a dire que pour tout n ∈ N,ilexisteN tel que tout
facteur de longueur N contient tous les facteurs de longueur n.
On appelle d´ecalage l’application S de A
ω
dans A
ω
qui consiste `a effacer la
premi`ere lettre.
La fonction de complexit´edeu est l’application de N dans N
∗
d´efinie par
p
u
(n)=#L
n
(u), o`u#L
n
(u)d´esigne le cardinal de L
n
(u). Dans tout ce qui suit
la fonction de complexit´ed’unmotu sera simplement d´esign´ee par p.Lafonction
de complexit´eestli´ee aux facteurs sp´eciaux par la relation [6]
p(n +1)− p(n)=
n∈L
n
(u)
∂
+
(w) − 1
.
Ainsi, le nombre de facteurs sp´eciaux `a droite est au plus p(n +1)− p(n). Il y a
un unique facteur sp´ecial de longueur n, qui est biprolongeable si et seulement si
p(n +1)− p(n)=1.
La fonction de complexit´e palindromique de u est l’application de N dans N
qui compte le nombre de palindromes de longueur n contenus dans u,c’est-`a-dire
pal
u
(n)=#{v ∈ L
n
(u):v = v}.
Un morphisme f est une application de A
∗
dans lui-mˆeme telle que f(uv)=
f(u)f (v) pour tous u, v ∈ A
∗
.
On dit qu’un mot infini u est engendr´e par un morphisme f s’il existe une lettre
a telle que les mots a, f (a), f
2
(a), ···, f
n
(a), ··· sont des pr´efixes de plus en plus
longs de u.Onnotealorsu = f
ω
(a).
428 I. KABOR
´
EETT.TAPSOBA
3. Mots sturmiens
Dans cette section, l’alphabet est A = {a, b}.
D´efinition 3.1. Un mot infini u sur A est un mot sturmien si pour tout entier n,
p(n)=n +1.
Exemple. Le mot sturmien le plus connu est le c´el`ebre mot de Fibonacci engendr´e
par le morphisme Φ d´efini par Φ(a)=ab et Φ(b)=a.
Remarque 3.2. (i) Les mots ab et ba sont facteurs de tout mot sturmien.
(ii) Tout mot sturmien a en facteur un et un seul des deux mots a
2
et b
2
.
D´efinition 3.3. Soit u un mot sturmien. On dit que u est a-sturmien (resp.
b-sturmien) lorsqu’il contient a
2
(resp. b
2
).
D´efinition 3.4. Soit u un mot infini sur A.Onditqueu est ´equilibr´esipour
tout entier n et tous v, w ∈ L
n
(u),
|v|
x
−|w|
x
≤ 1 pour tout x ∈ A.
Th´eor`eme 3.5. [9] Un mot infini u sur A est non ´equilibr´e si et seulement s’il
existe un unique mot t de longueur minimale tel que u contient ata et btb.Lemott
est alors un palindrome.
La caract´erisation suivante est fort utile.
Th´eor`eme 3.6. [9] Un mot infini u est sturmien si et seulement s’il est non
ultimement p´eriodique et ´equilibr´e.
Lemme 3.7. Soit u un mot a-sturmien. Alors il existe une suite sturmienne
(
i
)
i≥1
sur l’alphabet {0, 1} et un entier naturel non nul n tel que u s’´ecrit
u = a
n
0
ba
n+
1
ba
n+
2
ba
n+
3
b ···
avec n
0
≤ n +1.
Preuve.Soitu un mot a-sturmien. Consid´erons alors n l’entier minimal tel que u
contient ba
n
b.Ainsi,u ne contient pas a
n+2
par le th´eor`eme 3.5. Donc u est de
la forme
u = a
n
0
ba
n+
1
ba
n+
2
ba
n+
3
b ···
o`u n
0
≤ n +1 et (
i
)
i≥1
une suite sur l’alphabet {0, 1} [16].Ilrestedonc`aprouver
que la suite (
i
)
i≥1
est sturmienne.
Supposons (
i
)
i≥1
non sturmienne. Alors (
i
)
i≥1
est ultimement p´eriodique ou non
´equilibr´ee.
Si (
i
)
i≥1
´etait ultimement p´eriodique alors u le serait aussi, ce qui est impossible
car u est sturmien. Par suite, (
i
)
i≥1
est non ´equilibr´ee, et poss`ede de ce fait deux
facteurs de la forme 0t0et1t1. Consid´erons les facteurs de (
i
)
i≥1
;enles´ecrivant
de telle sorte que chaque lettre pr´ec`ede et succ`ede un b puis en rempla¸cant 0 par
a
n
et 1 par a
n+1
on retrouve certains facteurs de u.Ainsiu admet deux facteurs
de la forme ba
n
Ta
n
b et ba
n+1
Ta
n+1
b. En posant w = a
n
Ta
n
on remarque que les
COMBINATOIRE DE MOTS R
´
ECURRENTS DE COMPLEXIT
´
E N +2 429
mots awa et bwb sont dans u.Doncu est non ´equilibr´e. On obtient une contradic-
tion, car u est un mot sturmien. Par cons´equent (
i
)
i≥1
est une suite sturmienne.
Soient α ∈]0, 1[ et R la rotation d’angle α du cercle unit´e(identifi´e`a l’intervalle
[0, 1[). On a R(ρ)=(ρ + α)mod1 = {ρ + α}, partie fractionnaire de ρ + α.
L’orbite d’un point ρ du cercle unit´e par la rotation d’angle α est l’ensemble des
points {{ρ + nα} ,n≥ 0}. Le codage de l’orbite de ρ sous la rotation R d’angle α
sur le cercle unit´e partitionn´e en deux intervalles compl´ementaires I
0
=[0, 1 − α[
et I
1
=[1−α, 1[ (ou I
0
=]0, 1−α]etI
1
=]1−α, 1[∪{0})estlemotu
0
u
1
···u
n
···
d´efini sur l’alphabet {0, 1} par : u
n
=
1si{ρ + nα}∈I
1
0sinon
.
L’orbite d’un point ρ du cercle unit´e par une rotation d’angle irrationnel est
dense sur le cercle unit´e. Pour plus de d´etails sur les codages de rotations voir
par exemple [1, 2] et chapitre 6 section 6.1.2 de [20]. Rappelons la caract´erisation
classique des mots sturmiens due `a Morse et Hedlund [17,18].
Th´eor`eme 3.8. Un mot u est sturmien si et seulement s’il existe un nombre
irrationnel α ∈]0, 1[ et un nombre r´eel ρ tels que u estlecodagedel’orbitedeρ
sous la rotation R d’angle α.
Soit u le mot codant l’orbite d’un point ρ sous la rotation d’angle irrationnel
α. Un mot fini w = w
1
w
2
···w
n
sur l’alphabet {0, 1} est un facteur de u si et
seulement s’il existe un entier naturel k tel que :
R
k
(ρ) ∈ I
w
=
n−1
j=0
R
−
j
I
w
j+1
o`u I
w
j+1
=
I
0
si w
j+1
=0
I
1
sinon
([2,15], chap. 2 sect. 2.1).
La caract´erisation ci-dessus nous permet d’´etablir le r´esultat suivant.
Th´eor`eme 3.9. Soient u = u
0
u
1
u
2
··· un mot sturmien et k ≥ 1 un entier. Tout
facteur w de u, de longueur n quelconque, apparaˆıt dans u `a toutes les positions
modulo k,c’est-`a-dire
∀i ∈{0, ··· ,k− 1}∃l
i
∈ N : w = u
kl
i
+i
u
kl
i
+i+1
···u
kl
i
+i+n−1
.
Preuve.Soientu un mot sturmien et k ≥ 1unentier.D’apr`es le th´eor`eme 3.8, il
existe un nombre r´eel ρ et un nombre irrationnel α ∈]0, 1[ tel que u soit le codage
de l’orbite de ρ par la rotation d’angle α sur le cercle unit´e muni de la partition
P =([0, 1 − α[, [1 − α, 1[) ou P =(]0, 1 − α], ]1 − α, 1[∪{0}). Consid´erons w un
facteur de u de longueur n non nulle. Alors I
w
est un intervalle de longueur non
nulle. Pour tout i ∈{0, ··· ,k− 1} posons ρ
= ρ + iα et α
= kα.Ilvientqueα
est irrationnel comme α.Parsuiteρ
est d’orbite dense dans [0, 1[ par la rotation
d’angle irrationnel α
.Parcons´equent, il existe l
i
≥ 0telqueρ
+l
i
α
mod 1 ∈ I
w
.
Autrement dit, il existe l
i
≥ 0telqueρ +(kl
i
+ i) α mod 1 ∈ I
w
et donc w ap-
paraˆıt dans u `a la position kl
i
+ i.