Mystères de l'utf8

Tout ce qui concerne l'utilisation ou l'installation de LaTeX.

Modérateur: gdm_tex

Règles du forum
Merci d'éviter le style SMS dans vos messages et de penser à utiliser la fonction Recherche avant de poster un message. Pour joindre des fichiers à vos messages, consulter ce sujet.
> Penser à utiliser les balises Code pour poster du code.

Mystères de l'utf8

Messagepar SB » Mardi 04 Mars 2014, 15:37

Bonjour,

j'utilise souvent les fichiers d'examens mis en ligne sur le site de l'apmep.
-> cette histoire d'utf8 fait que pour les caractères accentués l'affichage est bizaroïde.
Je suis windaubien et j'utilise texmaker comme éditeur, et jusque maintenant je bidouillais avec des rechercher-remplacer. Je viens de me rendre qu'avec texworks il ouvre le fichier avec les caractères accentués. Néanmoins j'ai rencontré un fichier où apparemment l'accentuation est correcte mais, bizarrement texmaker me souligne les mots accentués et cela fait planter lorsque je veux compiler.

Code: Tout sélectionner
\textbf{\textsc{Exercice 1} \hfill 8 points}

\medskip

L'association sportive du lycéŽe Mozart ne propose que deux sports : le hand-ball et le basket-ball.

\begin{enumerate}
\item Recopier et compléŽter le tableau ci-dessous, sachant que :

$\bullet$ Le nombre total d'Žélèves inscrits est $200$.

$\bullet$ Il y a autant d'Žélèves dans chaque sport.
 
$\bullet$ L'association sportive comporte 45\,\% de garons.

$\bullet$ Parmi les basketteurs, il y a autant de filles que
  de garons.

\begin{center}
\begin{tabularx}{\linewidth}{|l|*{>{\centering \arraybackslash}X|}} \hline
        &  Hand-ball & Basket-ball & Total \\ \hline
Gar\c{c}ons &            &             &       \\ \hline
Filles  &            &             &       \\ \hline
Total   &            &             &   200  \\ \hline
\end{tabularx}
\end{center}

\item On choisit au hasard un ŽŽélève inscrit ˆ l'association sportive.
On suppose que tous les ŽŽélèves inscrits ont la même probabilitéŽ d'\^etre choisis.

Dans cette question, les rŽésultats seront donnŽés sous forme de fractions
  irréŽductibles.
   \begin{enumerate}
      \item Calculer la probabilitŽé pour que cet ŽŽélève pratique
  le basket-ball.
      \item Calculer la probabilitéŽ pour que cet ŽŽélève soit une fille.
      \item Calculer la probabilitéŽ pour que cet ŽŽélève soit
  une fille et qu'elle pratique le basket-ball.
      \item Calculer la probabilitŽé pour que cet Žélève soit
  une fille ou pratique le basket-ball.
   \end{enumerate} 
\end{enumerate}


source : Exercice n°1 BAC SMS 1999 en Métropole.

Pouvez-vous m'en dire plus et m'aider à résoudre ce problème.
Merci,
SB
SB
Kilo-utilisateur
 
Messages: 238
Inscription: Lundi 07 Juillet 2008, 07:15
Statut actuel: Actif et salarié | Enseignant

Publicité

Re: mystères de l'utf8

Messagepar texmaker » Mardi 04 Mars 2014, 17:10

SB a écrit:j'utilise souvent les fichiers d'examens mis en ligne sur le site de l'apmep.

La plupart des sources latex venant de l'APMEP sont en latin1 et pas en utf-8 (sauf certains plus récents qui sont bien en utf8 - j'avais déjà signalé qu'il serait bon que l'APMEP précise l'encodage des fichiers sources sur son site web).
SB a écrit:-> cette histoire d'utf8 fait que pour les caractères accentués l'affichage est bizaroïde.
SB

1) L'encodage déclaré dans le préambule avec \usepackage[???]{inputenc} doit absolument correspondre à l'encodage avec lequel le fichier a été enregistré.
Voir ici les problèmes d'encodage avec LaTeX : http://www.xm1math.net/doculatex/encodage.html
2) Si on essaye, avec Texmaker, d'ouvrir un document dont l'encodage (celui avec lequel le texte a été tapé) ne correspond pas au réglage de l'éditeur (c'est toujours indiqué dans la barre d'état), un message d'avertissement apparait et il est alors demandé de choisir l'encodage correct. Si on ignore cet avertissement, on coure droit à des ennuis.
3) Il ne faut jamais enregistrer un fichier .tex sous un encodage différent de celui avec lequel il a été préalablement enregistré. Quand on passe d'un éditeur à l'autre, il faut faire très attention à ce que l'encodage soit le même.
4) Il existe un outil pour réencoder un document .tex en utf8 dans Texmaker.
5) Pour compiler les annales de l'APMEP, voir ici : http://www.xm1math.net/doculatex/apmep.html.
Ce site d'aide associé à Texmaker est accessible depuis le menu "Aide" de Texmaker.

En clair, pour ne jamais avoir de problèmes d'encodage avec LaTeX : toujours ouvrir et enregistrer un document existant avec l'encodage d'origine et bien veiller à ce que l'encodage déclaré dans le préambule avec \usepackage[???]{inputenc} correspond à l'encodage avec lequel le document est enregistré.

PS : l'extrait donné ne peut pas servir à détecter l'origine du problème, car rien n'indique sous quel encodage il a été enregistré et comme il n'y a pas en plus le préambule, on peut encore moins savoir s'il y a concordance ou non.
Texmaker (version courante : 5.0.3) : éditeur LaTeX libre et multi-plateforme avec afficheur pdf.
PdfAdd : Tableaux variations, courbes, arbres, graphes, loi binomiale, cercle trigo, suites pour pdflatex et Asymptote
Site de documentation sur LaTeX
texmaker
Kilo-utilisateur
 
Messages: 226
Inscription: Vendredi 30 Juillet 2010, 11:19
Statut actuel: Actif et salarié | Enseignant

Re: mystères de l'utf8

Messagepar gigiair » Mardi 04 Mars 2014, 17:19

Le ficher a été édité avec les pieds. Il est déclaré comme utf-8, mais certaines parties ne le sont pas. Vraisemblablement des inclusions faites avec un copier-coller depuis un fichier encodé dans un autre système. A tout hasard, je dirais un encodage genre cp1252 ou autre microsofterie.
La seule solution pour corriger ce défaut est de prendre son courage à deux mains et un éditeur hexadécimal de l'autre et de modifier les caractères fautifs. On peut aussi utiliser un vrai éditeur de texte comme Emacs, ou peut-être Vim.
D'avance bon courage aux volontaires.
Il faudrait en informer l'auteur de la compilation que sa façon de faire n'est pas la bonne.
JJR.
LaTeXien migrateur.
gigiair
Exa-utilisateur
 
Messages: 2441
Inscription: Samedi 08 Juillet 2006, 19:56
Localisation: Saint Bonnet Elvert
Statut actuel: Actif et salarié

Re: mystères de l'utf8

Messagepar texmaker » Mardi 04 Mars 2014, 17:33

En effet, en allant voir le fichier source sur le site de l'APMEP, on s'aperçoit qu'il est corrompu : il contient des caractères non utf8 (et ni en iso8859-1, ni en cp1252, on n'obtient un document correct). Il a été probablement corrompu lors de son enregistrement et là, il n'y a plus grand chose à faire, sinon remplacer les caractères défectueux "à la main".
Il est très majoritairement utf-8 (et comme ça qu'il est détecté par Texmaker et d'autres éditeurs), mais avec des caractères défectueux (d'encodage mystérieux).
Va falloir que je change la page sur la compilation des annales de l'APMEP (entre les encodages qui changent d'un document à l'autre et les fichiers corrompus, il va être difficile d'être clair...)
Texmaker (version courante : 5.0.3) : éditeur LaTeX libre et multi-plateforme avec afficheur pdf.
PdfAdd : Tableaux variations, courbes, arbres, graphes, loi binomiale, cercle trigo, suites pour pdflatex et Asymptote
Site de documentation sur LaTeX
texmaker
Kilo-utilisateur
 
Messages: 226
Inscription: Vendredi 30 Juillet 2010, 11:19
Statut actuel: Actif et salarié | Enseignant

Re: Mystères de l'utf8

Messagepar gigiair » Mardi 04 Mars 2014, 18:13

Je ne pense pas qu'il y ait d'autre solution que de demander à l'auteur du document à apprendre à travailler proprement, et à n'effectuer des copier-collés qu'entre documents ayant le même encodage.
Avec Emacs, il est possible d'agir sur l'encodage du tampon avant le collé dans le document destination, mais avec d'autres éditeurs, je ne sais pas. Une fois le mal fait, c'est un travail de romain que de réparer les dégâts.
JJR.
LaTeXien migrateur.
gigiair
Exa-utilisateur
 
Messages: 2441
Inscription: Samedi 08 Juillet 2006, 19:56
Localisation: Saint Bonnet Elvert
Statut actuel: Actif et salarié

Re: Mystères de l'utf8

Messagepar cpo » Mardi 04 Mars 2014, 23:13

Bonsoir,

C’est certain que ce document LaTeX est relativement moche, mais il a le mérite d’exister. Je me suis permis de le rectifier quelque peu.
Fichiers joints
BacSMSMetropolejuin1999.tex
(3.93 Kio) Téléchargé 95 fois
cpo
Déca-utilisateur
 
Messages: 33
Inscription: Samedi 06 Octobre 2012, 08:22
Statut actuel: Post-bac | Doctorat

Re: Mystères de l'utf8

Messagepar texmaker » Mardi 04 Mars 2014, 23:17

cpo a écrit: mais il a le mérite d’exister.

Tout à fait. Même s'il y a quelques erreurs, toutes ces sources d'annales rendent bien des services.
Merci pour la rectification.
Texmaker (version courante : 5.0.3) : éditeur LaTeX libre et multi-plateforme avec afficheur pdf.
PdfAdd : Tableaux variations, courbes, arbres, graphes, loi binomiale, cercle trigo, suites pour pdflatex et Asymptote
Site de documentation sur LaTeX
texmaker
Kilo-utilisateur
 
Messages: 226
Inscription: Vendredi 30 Juillet 2010, 11:19
Statut actuel: Actif et salarié | Enseignant

Re: Mystères de l'utf8

Messagepar SB » Jeudi 06 Mars 2014, 22:59

Merci pour vos réponses (pas vraiment comprises). Je suis bien d'accord sur le fait que ces annales sont très pratiques et par ailleurs c'est beaucoup de boulot.

SB
SB
Kilo-utilisateur
 
Messages: 238
Inscription: Lundi 07 Juillet 2008, 07:15
Statut actuel: Actif et salarié | Enseignant


Retourner vers LaTeX

 


  • Articles en relation
    Réponses
    Vus
    Dernier message

Qui est en ligne

Utilisateurs parcourant ce forum: Google Adsense [Bot], Grapeshot [Crawler], MSN [Bot] et 26 invités