उपकरण
शब्द और अक्षर गणक
आँकड़े
यह कैसे काम करता है
- जो टेक्स्ट विश्लेषित करना है उसे टाइप या पेस्ट करें।
- टाइप करते ही सभी आँकड़े रियल टाइम में अपडेट होते हैं।
- इनपुट टेक्स्ट को कहीं और इस्तेमाल करने के लिए चुनें या कॉपी करें।
लोग शब्द गणक का उपयोग क्यों करते हैं
शब्द सीमा पूरी करना
कॉलेज निबंध, कवर लेटर और सोशल मीडिया बायो सभी में शब्द या अक्षर सीमा होती है। अपना ड्राफ़्ट यहाँ पेस्ट करें, तुरंत गणना देखें और सबमिट करने से पहले ज़रूरत अनुसार काट-छाँट करें।
पढ़ने के समय का अनुमान
ब्लॉग लेखक और न्यूज़लेटर संपादक पढ़ने का समय जाँचते हैं ताकि सामग्री उतनी लंबी रहे जितनी उनके पाठक वाकई पूरी पढ़ेंगे। यहाँ पढ़ने का समय प्रति मिनट 200 शब्द मानता है, जो वयस्क अंग्रेज़ी पठन का एक मानक अनुमान है।
LLM टोकन लागत का अनुमान
अगर आप ChatGPT, Claude, Gemini या अन्य भाषा मॉडल के साथ काम कर रहे हैं, तो अनुमानित टोकन संख्या आपको एक मोटा अंदाज़ा देती है कि एक प्रॉम्प्ट की कितनी लागत होगी। एक टोकन अंग्रेज़ी टेक्स्ट के लगभग 4 अक्षर होता है।
गणना पद्धति
शब्दों की गणना व्हाइटस्पेस पर विभाजित करके की जाती है। वाक्यों की गणना अंतिम विराम चिह्न (. ! ?) के बाद स्पेस या टेक्स्ट के अंत से की जाती है। बिना अंतिम विराम चिह्न वाला टेक्स्ट एक वाक्य गिना जाता है। पैराग्राफ़ एक या अधिक खाली पंक्तियों से अलग किए गए ब्लॉक हैं। पढ़ने का समय प्रति मिनट 200 शब्द मानता है। टोकन संख्या का अनुमान लगभग 1 टोकन प्रति 4 अक्षर है। यह अनुमान GPT, Claude और Gemini मॉडलों में अधिकांश अंग्रेज़ी टेक्स्ट के लिए काम करता है। वास्तविक टोकन संख्या मॉडल, भाषा और शब्दकोश के अनुसार भिन्न होती है।
अक्सर पूछे जाने वाले प्रश्न
टोकन अनुमान कितना सटीक है?
1-टोकन-प्रति-4-अक्षर का अनुमान अंग्रेज़ी टेक्स्ट के लिए लगभग 80% सटीक है। गैर-लैटिन लिपियाँ और कोड अलग तरह से टोकनाइज़ हो सकते हैं। सटीक गणना के लिए अपने मॉडल प्रदाता के टोकनाइज़र का उपयोग करें।
क्या यह स्पेस को अक्षरों में गिनता है?
"अक्षर" आँकड़े में स्पेस शामिल हैं। "रिक्त स्थान रहित" आँकड़ा सभी व्हाइटस्पेस अक्षरों को बाहर रखता है।