UTF-8 je način zapisivanja kompletnog seta UNICODE karaktera. Svi ASCII (7bita) se zapisuju kao i do sada - u jednom bajtu, a za ostale znakove se malo razlikuje.
U prvom bajtu se na početku nalazi 1, pa onda 0, a posle toga brojiš jedinice do kraja bajta ili do pojave prve nule. Taj broj jedinica može biti od 1 do 6 i taj broj predstavlja koliko je još bajtova potrebno da bi se zapisao broj. Svaki od narednih bajtova na početku sadrži 10, a ostale binarne cifre predstavljaju binarni zapis UNICODE vrednosti znaka koji je zapisan.
While you were hanging yourself on someone else's words
Dying to believe in what you heard
I was staring straight into the shining sun