Tout ce qu'un développeur Python doit décemment savoir au sujet d'Unicode.

Type:
pyconfr
Audience level:
Intermediate
Category:
présentation
Septembre 16th 3 après-midi – 3:30 après-midi

Description

Bien que le traitement d'information textuelle fasse partie de notre quotidien, Unicode et les opérations d'encodage/décodage relèvent encore pour beaucoup de la magie noire. Après une introduction aux concepts fondamentaux de l'encodage de texte et un bref rappel historique, nous en aborderons les applications en Python à travers plusieurs cas d'usage accompagnés de quelques bonnes pratiques.

Abstract

Sommaire approximatif

Fondamentaux

  • De la nécessité absolue d'encoder le texte.
  • Présentation des principaux encodages dans le temps et l'espace.
  • Unicode, un catalogue de l'écriture humaine.
  • Les trois représentations binaires d'Unicode : UTF-(8|16|32).

Application à Python

  • Histoire du support d'Unicode en Python.
  • Comparaisons des types de chaîne de caractères en Python 2.7 et Python 3.3.
  • Valse d'exemples d'encodages/décodages de texte.
  • Présentation du module unicodedata.
  • Présentation du module codecs.

Cas d'usages

  • Unicode et les dictionnaires.
  • Unicode et le module csv.
  • Unicode et les bases de données Sqlite, PostgreSQL & MongoDB.
  • Unicode et les fichiers de code source.

Expériences et bonnes pratiques

  • Comment réparer une chaîne de caractères incorrectement encodée ?
  • Conseils pour réduire le risque d'erreur.
  • Questions/Réponses.