Compteur de mots et de caractères

Collez du texte pour voir en direct le nombre de mots, de caractères, le temps de lecture et le nombre estimé de tokens.

Texte à compter

Essayer le répéteur

Statistiques

0

Mots

0

Caractères

0

Sans espaces

0

Phrases

0

Paragraphes

0 min 0 sec

Temps de lecture

0

Tokens (est.)

Comment ça marche

Saisissez ou collez le texte que vous souhaitez analyser.
Toutes les statistiques se mettent à jour en temps réel pendant la saisie.
Utilisez Sélectionner ou Copier pour récupérer le texte saisi et l'utiliser ailleurs.

Pourquoi les gens utilisent un compteur de mots

Respecter les limites de mots

Les dissertations universitaires, les lettres de motivation et les bios de réseaux sociaux ont tous des limites de mots ou de caractères. Collez votre brouillon ici pour voir le compte instantanément et ajustez si nécessaire avant de soumettre.

Estimer le temps de lecture

Les rédacteurs de blogs et les éditeurs de newsletters vérifient le temps de lecture pour garder le contenu à une longueur que leur audience terminera réellement. La statistique du temps de lecture ici suppose 200 mots par minute, ce qui est une estimation standard pour la lecture adulte en anglais.

Estimer le coût des tokens LLM

Si vous travaillez avec ChatGPT, Claude, Gemini ou d'autres modèles de langage, le nombre estimé de tokens vous donne une idée approximative du coût d'une requête. Un token représente environ 4 caractères de texte anglais.

Méthodologie

Les mots sont comptés en séparant par les espaces. Les phrases sont comptées par la ponctuation terminale (. ! ?) suivie d'un espace ou de la fin du texte. Un texte sans ponctuation terminale compte comme une phrase. Les paragraphes sont des blocs séparés par une ou plusieurs lignes vides. Le temps de lecture suppose 200 mots par minute. Le nombre de tokens est estimé à environ 1 token pour 4 caractères. Cette approximation fonctionne pour la plupart des textes en anglais avec les modèles GPT, Claude et Gemini. Le nombre réel de tokens varie selon le modèle, la langue et le vocabulaire.

Questions fréquemment posées

Quelle est la précision de l'estimation de tokens ?

L'heuristique de 1 token pour 4 caractères est précise à environ 80 % pour le texte en anglais. Les écritures non latines et le code peuvent être tokenisés différemment. Pour des comptes exacts, utilisez le tokeniseur de votre fournisseur de modèle.

Les espaces sont-ils comptés comme des caractères ?

La statistique « Caractères » inclut les espaces. La statistique « Sans espaces » exclut tous les caractères d'espacement.