Text Repeater logosu

TextRepeater.com

Arac

Kelime ve Karakter Sayaci

Canli kelime sayisi, karakter sayisi, okuma suresi ve tahmini token sayisini gormek icin metin yapistirin.

Tekrarlayiciyi dene

Istatistikler

0
Kelime
0
Karakter
0
Bosluksuz
0
Cumle
0
Paragraf
0 min 0 sec
Okuma suresi
0
Token (tahm.)

Nasil calisir

  1. Analiz etmek istediginiz metni yazin veya yapistirin.
  2. Siz yazarken tum istatistikler gercek zamanli olarak guncellenir.
  3. Giris metnini baska bir yerde kullanmak icin sec veya kopyala butonlarini kullanin.

Insanlar neden kelime sayaci kullaniyor

Kelime sinirlarini karsilama

Universite kompozisyonlari, on yazilar ve sosyal medya biyografilerin hepsinin kelime veya karakter siniri vardir. Taslagizi buraya yapistirin, sayiyi aninda gorun ve gondermeden once gerektiginde kisaltin.

Okuma suresi tahmini

Blog yazarlari ve bulten editörleri, icerigini hedef kitlenin gercekten bitirebilecegi uzunlukta tutmak icin okuma suresini kontrol eder. Buradaki okuma suresi istatistigi, yetiskin Ingilizce okumasi icin standart bir tahmin olan dakikada 200 kelime varsayar.

LLM token maliyeti tahmini

ChatGPT, Claude, Gemini veya diger dil modelleriyle calisiyorsaniz, tahmini token sayisi bir istemin ne kadara mal olacagi hakkinda kabaca bir fikir verir. Bir token, yaklasik 4 Ingilizce karakter uzunlugundadir.

Yontem

Kelimeler bosluk karakterlerine gore bolünerek sayilir. Cumleler son noktalama isaretleri (. ! ?) ve ardindan gelen bosluk veya metin sonuna gore sayilir. Son noktalama isareti olmayan metin bir cumle olarak sayilir. Paragraflar bir veya daha fazla bos satirla ayrilan bloklardir. Okuma suresi dakikada 200 kelime varsayar. Token sayisi yaklasik her 4 karakter icin 1 token olarak tahmin edilir. Bu yaklasim, GPT, Claude ve Gemini modelleri genelinde cogu Ingilizce metin icin geçerlidir. Gercek token sayilari modele, dile ve kelime dagarcigina gore degisir.

Sikca sorulan sorular

Token tahmini ne kadar doğrudur?

4-karakter-basina-1-token sezgisel kurali Ingilizce metin icin yaklasik %80 dogrudur. Latin olmayan yazim sistemleri ve kod farkli sekilde tokenize edilebilir. Kesin sayilar icin model saglayicinizin tokenizer'ini kullanin.

Bosluklari karakter olarak sayiyor mu?

"Karakter" istatistigi bosluklari iceriyor. "Bosluksuz" istatistigi tum bosluk karakterlerini haric tutar.