Kolik znaků má jedna SMS? Vše o kódování GSM-7, Unicode a dělení zpráv


Kolik znaků má jedna SMS? Vše o kódování GSM-7, Unicode a dělení zpráv
Autor
Autor: Marek Kohút — Téma: Průvodce efektivní komunikací | 3 minuty čtení

SMS zpráva se někdy může chovat jinak, než byste očekávali. 🤯 I krátký text se někdy rozdělí na více částí, kampaň je dražší než plánujete a důvod není na první pohled vidět. 

Proč se to děje? Jak mít počet znaků, cenu i podobu SMS plně pod kontrolou? V tomto článku si vysvětlíme jak funguje kódování SMS, kdy dochází k jejich dělení a proč může diakritika hrát zásadní roli.


SMS bez diakritiky: kódování GSM-7

Pokud chcete ze své SMS dostat maximum textu za nejnižší cenu, GSM-7 je vaše ideální volba. Jde o výchozí a nejpoužívanější kódování SMS, které se automaticky použije ve chvíli, kdy zpráva obsahuje pouze podporované znaky – tedy bez diakritiky a nestandardních symbolů.

V kódování GSM-7 může mít jedna SMS až 160 znaků, což z něj dělá nejefektivnější a nejúspornější variantu pro běžné firemní rozesílky. Právě proto se s ním setkáte u většiny jednoduchých notifikací, upozornění i marketingových kampaní.

Jaké znaky GSM-7 obsahuje?

🆎 písmena abecedy bez diakritiky

Aa Bb Cc Dd Ee Ff Gg Hh Ii Jj Kk Ll Mm Oo Pp Qq Rr Ss Tt Uu Vv Ww Xx Yy Zz

1️⃣ číslice a matematické symboly

1 2 3 4 5 6 7 8 9 0 % ( ) * / + - < > = ø

❓ základní interpunkci a běžné symboly

. , ? ! _ ' " # & @

💲 vybrané speciální znaky

£ $ ¥ Åå Ää à Ç Éé è ì Öö ò Ññ Üü ù Æ æ ß Φ Γ Λ Ω Π Ψ Σ Θ Ξ Ø ¤ Δ ¿ ¡

Jakmile ale do textu přidáte znak, který do této sady nepatří, typicky diakritiku nebo méně běžný symbol, SMS se automaticky přepne do jiného kódování. A tím se mění i maximální počet znaků i výsledná cena zprávy.

Přehled všech znaků GSM7
GSM7   0x00  0x10  0x20   0x30  0x40  0x50  0x60  0x70
-----------------------------------------------------
0x00   @     Δ     SP     0     ¡     P     ¿     p
0x01   £     _     !      1     A     Q     a     q
0x02   $     Φ     "      2     B     R     b     r
0x03   ¥     Γ     #      3     C     S     c     s
0x04   è     Λ     ¤      4     D     T     d     t
0x05   é     Ω     %      5     E     U     e     u
0x06   ù     Π     &      6     F     V     f     v
0x07   ì     Ψ     '      7     G     W     g     w
0x08   ò     Σ     (      8     H     X     h     x
0x09   Ç     Θ     )      9     I     Y     i     y
0x0A   LF    Ξ     *      :     J     Z     j     z
0x0B   Ø     ESC   +      ;     K     Ä     k     ä
0x0C   ø     Æ     ,      <     L     Ö     l     ö
0x0D   CR    æ     -      =     M     Ñ     m     ñ
0x0E   Å     ß     .      >     N     Ü     n     ü
0x0F   å     É     /      ?     O     §     o     à
SP = mezera, LF = nový řádek, CR = carriage return, ESC = escape

SMS s diakritikou: přechod na kódování Unicode

Diakritika dělá text hezčí a čitelnější, ale u SMS má svou cenu. Ve chvíli, kdy ve zprávě použijete znak mimo kódování GSM-7, typicky písmena s diakritikou, emoji nebo méně běžný symbol, SMS se automaticky přepne do kódování Unicode (UCS-2). A to často bez toho, abyste si toho na první pohled všimli.

V kódování Unicode se do jedné SMS vejde maximálně 70 znaků. Oproti GSM-7 je to méně než polovina textu, což může velmi rychle vést k rozdělení zprávy na více částí – a tím i k vyšším nákladům na rozesílku. 👀

Typickými „spouštěči“ změny kódování jsou například:

  • písmena s diakritikou (á, č, ř, ž…)

  • emoji

  • interpunkce a neviditelné znaky zkopírované z textových editorů (Word, Writer aj.)  

  • znaky mimo latinku


Pozor na symboly, které se počítají jako dva znaky

Existuje ještě jedna záludnost, která může ovlivnit délku vaší zprávy. Některé symboly se totiž počítají jako 2 znaky, a to bez ohledu na to, zda používáte GSM-7 nebo Unicode.

👉 symboly, které zabírají 2 znaky

€ ^ { } [ ] ~ | \

Tyto symboly využívají rozšířenou znakovou sadu a zabírají v SMS více místa. V praxi to znamená, že i když se váš text na první pohled vejde do limitu, několik těchto znaků může zprávu nečekaně posunout do další části.

Je proto dobré s nimi počítat zejména ve chvíli, kdy v SMS uvádíte ceny v eurech (€), používáte technické údaje a podobně. Právě v takových případech může pár znaků navíc rozhodnout o tom, zda odešlete jednu, nebo dvě SMS. 💸


Vyzkoušejte si, jak funguje kódování textu SMS

Vaše zpráva
Zbývá znaků v poslední části SMS: 160
Kódování
  • Použito znaků celkem: 0
  • Počet znaků dostupných v jedné části SMS: 160
  • Počet částí SMS: 1
  • Kódování: GSM 7-bit
Detaily
Legenda
Běžný 7bitový znak, součástí znakové sady GSM
2 Znak počítaný jako 2 jednotky bez ohledu na kódování € ^ { } [ ] ~ | \
H UDH u vícedílné SMS (spojovací informace)
Nevyužité znaky v části SMS
Znak není součástí znakové sady GSM, vynutí použití kódování Unicode

Co se stane, když SMS přesáhne limit znaků?

Jakmile délka SMS překročí povolený počet znaků, zpráva se automaticky rozdělí na více částí. Tento proces probíhá na pozadí, bez nutnosti jakéhokoliv zásahu odesílatele, a každá vzniklá část se účtuje jako samostatná SMS. ⚠️

Součástí každé části je tzv. spojovací informace (UDH), díky které se jednotlivé části v koncovém zařízení příjemce automaticky spojí do jedné souvislé zprávy. Z pohledu zákazníka tak SMS dorazí jako celek a není tak poznat, že byla složená z více částí.

💡 Kolik znaků tedy máte skutečně k dispozici v jednotlivých částech SMS?

Přehled délky SMS podle kódování
GSM-7 vs. Unicode (dělené SMS)
Kódování Počet SMS Max. znaků
GSM-7
bez diakritiky
Každá část max. 153 znaků
1 SMS 160
2 SMS 306
3 SMS 459
4 SMS 612
5 SMS 765
Unicode
s diakritikou / speciálními znaky
Každá část max. 67 znaků
1 SMS 70
2 SMS 134
3 SMS 201
4 SMS 268
5 SMS 335

Právě zmíněná spojovací informace ukrajuje část dostupných znaků. Výsledkem je, že každá část vícedílné SMS má nižší maximální délku, než kolik nabízí jedna samostatná zpráva. I zdánlivě krátký text se tak může rozdělit na dvě nebo tři SMS, a tím zbytečně navýšit cenu celé rozesílky.


Shrnutí

Kódování SMS má přímý vliv na délku zprávy, její cenu i celkovou efektivitu kampaně. 🔥 Pokud se text vejde do kódování GSM-7, získáte maximum znaků v jedné SMS a lépe udržíte náklady pod kontrolou. Jakmile se ale ve zprávě objeví diakritika nebo jiný znak mimo GSM-7, SMS se přepne do Unicode a počet dostupných znaků se výrazně sníží.

U větších nebo pravidelných rozesílek se vyplatí mít nad textem plnou kontrolu – sledovat použité znaky, počítat s dělením zpráv a před odesláním si vždy ověřit výslednou délku i počet účtovaných SMS. Zároveň ale platí, že čitelnost a srozumitelnost zprávy by měla mít vždy přednost před snahou ušetřit každý znak. 💸

Správně napsaná SMS není jen o obsahu, ale i o technickém nastavení na pozadí. Když víte, jak kódování funguje, můžete své SMS kampaně lépe plánovat, optimalizovat rozpočet a předejít nepříjemným překvapením při vyúčtování.

👉 Mějte délku, kódování i cenu SMS pod kontrolou. V Portálu SMSbrány máte ještě před odesláním jasno v tom, kolik SMS odešlete a kolik vás budou skutečně stát.

Přesvědčte se o síle SMS marketingu na vlastní kůži. Registrace zabere jen minutu a můžete začít posílat.