[es] - Konverzija ćirilice u latinicu i linkovi

plus_minus

Član broj: 289459
Poruke: 2242
*.exe-net.net.

Sajt: https://hardcoder.xyz

+2247 Profil

Re: Konverzija ćirilice u latinicu i linkovi

^{12.06.2020. u 14:41 - pre 59 meseci}

Moram da prepravim samog sebe, jer sam toliko izmlatio u prethodnom postu, evo sad ... primetih, špartam po svom profilu i gde sam šta pisao. A prethodni post sam pisao .. pa ne znam ni ja šta mi bi, da se ne pro5er4vam i vadim sada, nego da cititam svoju idiotsku grešku, zbog onih koji zaista ne znaju o materiji, kojim slučajem hoće da uzmu u obzir deo mog prethodnog posta kao neku privremenu i početničku referencu (ako uopšte ima takvih).

Citat:

Ćirilica zauzima ni više ni manje po osam bita za svaki karakter.

Sramota, ali namerno neću da editujem, neka ostane. D se vidi kako "majstor plus_minus" lupi i ostade živ.

Ono što jeste tačno:

- Svaki ASCII karakter jeste `težak` jedan bajt ili 8 bit-a. A bit je kec ili nula. (slika u prilogu pojašnjava dodatno, šta je ASCII, ima tona materijala na netu o tome).
- Za ćirilicu mora više od `samo osam bita` po karakteru, jer je UNICODE *(utf-8 web standard) da tako kažemo - fleksibilan, pa će u nekim jezicima ići i po 2 ili 3 BAJTA za svaki karakter (i o tome ima tona materijala na izvol' te ...).

Evo dva primera.
Prvi, gde je reč `Latinica` napisana latinično (prvi primer) i drugi gde je reč `Latinica` ispisana ćirilicom.

Izraženo u binarnom, `sirovom` CPU formatu (ASCII/Unicode enkodiranje).

01001100 01100001 01110100 01101001 01101110 01101001 01100011 01100001

11010000 10011011 11010000 10110000 11010001 10000010 11010000 10111000 11010000 10111101 11010000 10111000 11010001 10000110 11010000 10110000

Zaključak je dakle da za ćirilicu treba po 2 bajta za svako slovo.
Zaključak je dakle da bi kompletna baza bila minimum - DUPLO veća.

Pa neka je sada, ovakva kakva je, mlatim -- nekih 2 terabajta .. a gabaritna *sql baza podataka ume da košta i to fino. (ovde već ne mlatim).
Uopšte - samo jedna dodatna *sql tabela - negde kod nekih hosting/sql provajdera košta i do 100 evra preko.
Pa neka ima i 3 recorda .. I tako ..

Možda je to Gojkov glavni razlog za nepostojanje ćirilice, arapskog, kineskog, japanskog.. pisma, a ne zato što je šatro `srbomrzac/domobran` i slične 3.14čke materine.

about:networking

Prikačeni fajlovi

table.gif - 219.49k

Odgovor na temu

plus_minus

Član broj: 289459
Poruke: 2242
*.exe-net.net.

Sajt: https://hardcoder.xyz

+2247 Profil

Re: Konverzija ćirilice u latinicu i linkovi

^{12.06.2020. u 18:55 - pre 59 meseci}

^^

E, vidiš .. ako je tako kako veliš, a izgleda da jeste (definitivno nema mesta za sumnju) .. onda Gojko treba da napiše i neko smisleno objašnjenje.

Ovo gore sa (bajt * 2) jeste tačno i za cenu baze podataka i za sve ostalo i zaista može da bude dobar i logičan razlog za automatsko preslovljavanje .. međ' tim .. problem je mizeran, gorak i nažalost nije taj razlog ... čim ja mišem selektujem svaki karakter tvoj posta ..

Dobro. :)

- Nema mesta NAJSAVRŠENIJEM pismu .. na svetu .. ?
- Problem nije u mesečnom/godišnjem održavanju velike baze ... ?

Onda će i manje korisnika biti ubuduće (100% da hoće) na istoj adresi, `tak' prosto, kaj ne?`.

Jedan manje, sigurno.

きららしこんいいりにかいといそなすにかん

about:networking

Odgovor na temu