
|
 |
 |
Offentliggjort 2003 - Opdateret feb. 2006
ASCII og ISO-8859
De mest anvendt tegnsæt er latin-1 samt anvendelsen af ASCII koderne.
Indhold
Indledning
7-bits ASCII
"ASCII koder" eller "ASCII-tabellen" kalder vi det i daglig tale, men hvad er det egentligt? ASCII står for "American Standard Code for Information Interchange". Den oprindelige 7-bits ASCII tabel indeholder i alt 128 tegn, og repræsenterer de engelske skrifttegn som numre der går fra 0 til 127. De fleste operativsystemer som MS-Windows, UNIX, AmigaDOS og VMS anvender ASCII koderne til at repræsentere tekst, hvilket gør det mulig at computerne indbyrdes kan udveksle information. Det gamle MS-DOS anvender et andet tegnsæt, der næsten er identisk med ASCII.
I forbindelse med programmering tales der ofte om at gemme sine programmer i ASCII format eller "plain text". Alle tekst editorer og de fleste tekst behandlings applikationer som f.eks. Word kan gemme i ASCII format. Dog er det ikke sikker, at ASCII formatet er valgt som standard.
ISO-8859
I det danske sprog, som så mange andre, har vi nogle skrifttegn der ikke er indehold i den af ISO standardiseret ASCII tabel (ISO-646). For at løse dette har man lavet en udvidet tabel indeholdende skrifttegn der dækker de enkelte europæiske landes behov. Disse er defineret via ISO-8859-1 t.o.m. ISO-8859-10. De udvidede skrifttegn starter ved 160 og går til 255, hvor ASCII tabellen danner grundlaget.
Tegnene fra 128 t.o.m. 159 anvendes i forbindelse med kontrol tegnene 0 til 31. Dette for at forbinde den 7-bits ASCII tabel med den 8-bits ISO-8859 tabel.
I et HTML dokument er det mulig at gengive skrifttegn på forskellig vis, som f.eks. &#xxx; hvor xxx er den decimale kode for tegnet. Eller man kan skrive navnet på tegnet som &xx..xx; hvor xx..xx er en forkortelse af navnet.
For at tilkendegive hvilket tegnsæt du anvender kan du i dit html dokument tilføje følgende meta-tag:
<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1" />
7-bit ASCII "Device Control Characters"
ASCII tabellen indeholder nogle tegn, som er specielt designet til at styre enheder som keyboard, printer og lignende. Disse tegn anvendes ikke i HTML dokumentet, og er her listet for informations skyld.
Dec Oct Hex Bin HTML
000 000 000 0000000 � NUL Null
001 001 001 0000001  SOH Start of Header
002 002 002 0000010  STX Start of Text
003 003 003 0000011  ETX End of Text
004 004 004 0000100  EOT End of Transmission
005 005 005 0000101  ENQ Enquiry
006 006 006 0000110  ACK Acknowledgment
007 007 007 0000111  BEL Bell
008 010 008 0001000  BS Backspace
009 011 009 0001001 	 HT Horizontal Tab
010 012 00A 0001010 LF Line Feed
011 013 00B 0001011  VT Vertical Tab
012 014 00C 0001100  FF Form Feed
013 015 00D 0001101 CR Carriage Return
014 016 00E 0001110  SO Shift Out
015 017 00F 0001111  SI Shift In
016 020 010 0010000  DLE Data Link Escape
017 021 011 0010001  DC1 Device Control 1
018 022 012 0010010  DC2 Device Control 2
019 023 013 0010011  DC3 Device Control 3
020 024 014 0010100  DC4 Device Control 4
021 025 015 0010101  NAK Negative Acknowledgement
022 026 016 0010110  SYN Synchronous Idle
023 027 017 0010111  ETB End of Trans. Block
024 030 018 0011000  CAN Cancel
025 031 019 0011001  EM End of Medium
026 032 01A 0011010  SUB Substitute
027 033 01B 0011011  ESC Escape
028 034 01C 0011100  FS File Separator
029 035 01D 0011101  GS Group Separator
030 036 01E 0011110  RS Record Separator
031 037 01F 0011111  US Unit Separator
127 177 07F 1111111  DEL Delete
7-bit ASCII "reference liste"
Dec Oct Hex Bin HTML Navn Tegn
032 040 020 0100000   &sp; SP Space
033 041 021 0100001 ! ! ! exclamation mark
034 042 022 0100010 " " " double quote
035 043 023 0100011 # # # number sign
036 044 024 0100100 $ $ $ dollar sign
037 045 025 0100101 % % % percent
038 046 026 0100110 & & & ampersand
039 047 027 0100111 ' ' ' single quote
040 050 028 0101000 ( ( ( left/opening parenthesis
041 051 029 0101001 ) ) ) right/closing parenthesis
042 052 02A 0101010 * * * asterisk
043 053 02B 0101011 + + + plus
044 054 02C 0101100 , , , single quote
045 055 02D 0101101 - − - minus or dash
046 056 02E 0101110 . . . dot
047 057 02F 0101111 / / / forward slash
048 060 030 0110000 0 0
049 061 031 0110001 1 1
050 062 032 0110010 2 2
051 063 033 0110011 3 3
052 064 034 0110100 4 4
053 065 035 0110101 5 5
054 066 036 0110110 6 6
055 067 037 0110111 7 7
056 070 038 0111000 8 8
057 071 039 0111001 9 9
058 072 03A 0111010 : : : colon
059 073 03B 0111011 ; ; ; semi-colon
060 074 03C 0111100 < < < less than
061 075 03D 0111101 = = = equal sign
062 076 03E 0111110 > > > greater than
063 077 03F 0111111 ? ? ? question mark
064 100 040 1000000 @ @ @ AT symbol
065 101 041 1000001 A A
066 102 042 1000010 B B
067 103 043 1000011 C C
068 104 044 1000100 D D
069 105 045 1000101 E E
070 106 046 1000110 F F
071 107 047 1000111 G G
072 110 048 1001000 H H
073 111 049 1001001 I I
074 112 04A 1001010 J J
075 113 04B 1001011 K K
076 114 04C 1001100 L L
077 115 04D 1001101 M M
078 116 04E 1001110 N N
079 117 04F 1001111 O O
080 120 050 1010000 P P
081 121 051 1010001 Q Q
082 122 052 1010010 R R
083 123 053 1010011 S S
084 124 054 1010100 T T
085 125 055 1010101 U U
086 126 056 1010110 V V
087 127 057 1010111 W W
088 130 058 1011000 X X
089 131 059 1011001 Y Y
090 132 05A 1011010 Z Z
091 133 05B 1011011 [ [ [ left/opening bracket
092 134 05C 1011100 \ \ \ back slash
093 135 05D 1011101 ] ] ] right/closing bracket
094 136 05E 1011110 ^ ˆ ^ caret/cirumflex
095 137 05F 1011111 _ _ _ underscore
096 140 060 1100000 ` ` `
097 141 061 1100001 a a
098 142 062 1100010 b b
099 143 063 1100011 c c
100 144 064 1100100 d d
101 145 065 1100101 e e
102 146 066 1100110 f f
103 147 067 1100111 g g
104 150 068 1101000 h h
105 151 069 1101001 i i
106 152 06A 1101010 j j
107 153 06B 1101011 k k
108 154 06C 1101100 l l
109 155 06D 1101101 m m
110 156 06E 1101110 n n
111 157 06F 1101111 o o
112 160 070 1110000 p p
113 161 071 1110001 q q
114 162 072 1110010 r r
115 163 073 1110011 s s
116 164 074 1110100 t t
117 165 075 1110101 u u
118 166 076 1110110 v v
119 167 077 1110111 w w
120 170 078 1111000 x x
121 171 079 1111001 y y
122 172 07A 1111010 z z
123 173 07B 1111011 { { { left/opening brace
124 174 07C 1111100 | | | vertical bar
125 175 07D 1111101 } } } right/closing brace
126 176 07E 1111110 ~ ˜ ~ tilde
Udvidet ASCII "Device Control Characters" - reserveret
Dec Oct Hex Bin HTML
128
.
.
.
t.o.m.
.
.
.
159
ISO 8859-1 "(Latin-1) Characters List"
Dec Oct Hex HTML Navn Tegn
160 240 A0   No-break space
161 241 A1 ¡ ¡ ¡
162 242 A2 ¢ ¢ ¢
163 243 A3 £ £ £
164 244 A4 ¤ ¤ ¤
165 245 A5 ¥ ¥ ¥
166 246 A6 ¦ ¦ ¦
167 247 A7 § § §
168 250 A8 ¨ ¨ ¨
169 251 A9 © © ©
170 252 AA ª ª ª
171 253 AB « « «
172 254 AC ¬ ¬ ¬
173 255 AD ­ ­
174 256 AE ® ® ®
175 257 AF ¯ ¯ ¯
176 260 B0 ° ° °
177 261 B1 ± ± ±
178 262 B2 ² ² ²
179 263 B3 ³ ³ ³
180 264 B4 ´ ´ ´
181 265 B5 µ µ µ
182 266 B6 ¶ ¶ ¶
183 267 B7 · · ·
184 270 B8 ¸ ¸ ¸
185 271 B9 ¹ ¹ ¹
186 272 BA º º º
187 273 BB » » »
188 274 BC ¼ ¼ ¼
189 275 BD ½ ½ ½
190 276 BE ¾ ¾ ¾
191 277 BF ¿ ¿ ¿
192 300 C0 À À À
193 301 C1 Á Á Á
194 302 C2 Â Â Â
195 303 C3 Ã Ã Ã
196 304 C4 Ä Ä Ä
197 305 C5 Å Å Å
198 306 C6 Æ Æ Æ
199 307 C7 Ç Ç Ç
200 310 C8 È È È
201 311 C9 É É É
202 312 CA Ê Ê Ê
203 313 CB Ë Ë Ë
204 314 CC Ì Ì Ì
205 315 CD Í Í Í
206 316 CE Î Î Î
207 317 CF Ï Ï Ï
208 320 D0 Ð Ð Ð
209 321 D1 Ñ Ñ Ñ
210 322 D2 Ò Ò Ò
211 323 D3 Ó Ó Ó
212 324 D4 Ô Ô Ô
213 325 D5 Õ Õ Õ
214 326 D6 Ö Ö Ö
215 327 D7 × × ×
216 330 D8 Ø Ø Ø
217 331 D9 Ù Ù Ù
218 332 DA Ú Ú Ú
219 333 DB Û Û Û
220 334 DC Ü Ü Ü
221 335 DD Ý Ý Ý
222 336 DE Þ Þ Þ
223 337 DF ß ß ß
224 340 E0 à à à
225 341 E1 á á á
226 342 E2 â â â
227 343 E3 ã ã ã
228 344 E4 ä ä ä
229 345 E5 å å å
230 346 E6 æ æ æ
231 347 E7 ç ç ç
232 350 E8 è è è
233 351 E9 é é é
234 352 EA ê ê ê
235 353 EB ë ë ë
236 354 EC ì ì ì
237 355 ED í í í
238 356 EE î î î
239 357 EF ï ï ï
240 360 F0 ð ð ð
241 361 F1 ñ ñ ñ
242 362 F2 ò ò ò
243 363 F3 ó ó ó
244 364 F4 ô ô ô
245 365 F5 õ õ õ
246 366 F6 ö ö ö
247 367 F7 ÷ ÷ ÷
248 370 F8 ø ø ø
249 371 F9 ù ù ù
250 372 FA ú ú ú
251 373 FB û û û
252 374 FC ü ü ü
253 375 FD ý ý ý
254 376 FE þ þ þ
255 377 FF ÿ ÿ ÿ
|