Zusatzinfo:
Wieviel Byte ein Zeichen beansprucht hängt vom verwendeten Encoding, charset, Zeichensatz (glaub das sind alles Synonyme) ab.
Die in Westeuropa noch gebräuchlichen Zeichensätze der ISO 8859 Familie verwenden jeweils 1 Byte pro Zeichen. Ebenfalls das auf Microsoft Plattformen (noch) sehr gebräuchliche cp1252. Im Zuge des Endes der 550 Jahre währenden Vorherrschaft europäischer Kulturen in der Welt (populär auch unter dem Begriff Globalisierung bekannt) setzt sich aber UTF-8 immer mehr durch, das jeweils 2 bis 4 byte für ein Zeichen benötigt. Damit lassen sich dann Schriftzeichen aus allen möglichen Kulturen ausdrücken.
In guten Editoren wie Text-Pad kannst du das encoding angeben, in dem du einen Text zu speichern gedenkst.