DU LERNST HIER... |
wie man als Text vorliegende Informationen in elektronisch speicherbare Form umwandelt und was Bits und Bytes sind. Die Menschheit hat mehrere Jahrtausende vor Christus die Schrift erfunden, um Wissen festzuhalten, so dass dieses später wieder verfügbar war, aber auch, um Informationen anderen Personen übermitteln zu können. Statt Steintafel und Papier wird heute Wissen und Information in elektrische Signale umgewandelt, die lediglich zwei Werte, 0 und 1 enthalten. Man nennt diese Elementarinformation ein Bit. Mit einem Bit lassen sich 2 Zeichen unterscheiden, mit 2 Bits 4 Zeichen, mit 3 Bits 8 Zeichen usw..
Mit 8 Bits (1 Byte) kann man 256 verschiedene Zeichen darstellen. Damit kann das ganze Alphabet mit Gross- und Kleinbuchstaben inklusive Umlaute und einigen Sonderzeichen codiert werden. |
MUSTERBEISPIEL |
Bei der Codierung von Texten wird der ASCII-Code verwendet. Dieser ordnet jedem Zeichen des Texts 1 Byte = 8 Bits zu. So wird z.B. der Buchstabe A als 0100001 codiert. In einem Python-Programm kannst du die Funktion strToBin(c) verwendendie zu einem Zeichen c den zughörenden Code (als String mit 0 und 1) liefert..
Mit deinem Programm kannst du einen beliebigen Text eingeben, der dann codiert als Bytefolge ausgeschrieben wird. text = inputString("Gib einen Text ein") print(text) for buchstabe in text: print(strToBin(buchstabe)) |
MERKE DIR... |
Textinformationen werden elektronisch als 0/1-Werte (bits) codiert. Oft verwendet man für einen Buchstaben 8 Bits = 1 Byte. Der internationale Standard für diese Codierung nennt man ASCII-Code. |
ZUM SELBST LÖSEN |
|
Die zwei Werte können als physikalischer Zustand realisiert werden, beispielsweise durch die Spannungspegel 0 Volt und 5 Volt oder durch einen leitenden oder gesperrten Transistor, einen nach oben oder unten gerichteten Magneten, usw. Oft spricht man auch von den Zuständen LOW/HIGH oder kurz L/H.
Die Codierung von Text und Steuerzeichen ist standardisiert, wobei allerdings verschiedene Standards in Gebrauch sind. Bei 7 Bits ist es üblicherweise der 7-bit ASCII Zeichensatz, in höheren Programmiersprachen wird oft Unicode und im Internet UTF-8 verwendet. Diese Codes benötigen bis zu 4 Bytes.