Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Запись текстов двоичным кодом

Все символы и буквы могут быть закодированы при помощи восьми двоичных символов. Наиболее распространенными таблицами являются таблицы ASCII с национальными расширениями, применяющиеся в DOS (и которые можно использовать для записи текстов в микропроцессорах), и таблицы ANSI, применяющиеся в WINDOWS. В таблицах ASCII и ANSI первые 128 символов совпадают. В этой части таблицы содержатся символы цифр, знаков препинания, латинские буквы верхнего и нижнего регистров и управляющие символы. Национальные расширения символьных таблиц и символы псевдографики содержатся в последних 128 кодах этих таблиц, поэтому русские тексты в операционных системах DOS и WINDOWS не совпадают.

Таблица ASCII кодов

Десятичный код Шестнадцатеричный код Отображаемый символ Значение
      NUL
    (слово управления дисплеем)
    (Первое передаваемое слово)
    ETX (Последнее слово передачи)
    EOT (конец передачи)
    ENQ (инициализация)
    ACK (подтверждение приема)
    BEL
    BS
    HT (горизонтальная табуляция
  0A LF (перевод строки)
  0B VT (вертикальная табуляция)
  FF (следующая страница)
  0D CR (возврат каретки)
  0E SO (двойная ширина)
  0F SI (уплотненная печать)
    DLE
    DC1
    DC2 (отмена уплотненной печати)
    DC3 (готовность)
    DC4 (отмена двойной ширины)
    § NAC (неподтверждение приема)
    SYN
    ETB
    CAN
    EM
  1A SUB
  1B ESC (начало управл. послед.)
  1C FS
  1D GS
  1E RS
  1F US
      Пробел
    ! Восклицательный знак
    « Угловая скобка
    # Знак номера
    $ Знак денежной единицы (доллар)
    % Знак процента
    & Амперсанд
    ' Апостроф
    ( Открывающая скобка
    ) Закрывающая скобка
  2A * Звездочка
  2B + Знак плюс
  2C , Запятая
  2D - Знак минус
  2E . Точка
  2F / Дробная черта
      Цифра ноль
      Цифра один
      Цифра два
      Цифра три
      Цифра четыре
      Цифра пять
      Цифра шесть
      Цифра семь
      Цифра восемь
      Цифра девять
  3A : Двоеточие
  3B ; Точка с запятой
  3C < Знак меньше
  3D = Знак равно
  3E > Знак больше
  3F ? Знак вопрос
    @ Коммерческое эт
    A Прописная латинская буква А
    B Прописная латинская буква B
    C Прописная латинская буква C
    D Прописная латинская буква D
    E Прописная латинская буква E
    F Прописная латинская буква F
    G Прописная латинская буква G
    H Прописная латинская буква H
    I Прописная латинская буква I
  4A J Прописная латинская буква J
  4B K Прописная латинская буква K
  4C L Прописная латинская буква L
  4D M Прописная латинская буква
  4E N Прописная латинская буква N
  4F O Прописная латинская буква O
    P Прописная латинская буква P
    Q Прописная латинская буква
    R Прописная латинская буква R
    S Прописная латинская буква S
    T Прописная латинская буква T
    U Прописная латинская буква U
    V Прописная латинская буква V
    W Прописная латинская буква W
    X Прописная латинская буква X
    Y Прописная латинская буква Y
  5A Z Прописная латинская буква Z
  5B [ Открывающая квадратная скобка
  5C \ Обратная черта
  5D ] Закрывающая квадратная скобка
  5E ^ "Крышечка"
    _ Символ подчеркивания
    ` Апостроф
    a Строчная латинская буква a
    b Строчная латинская буква b
    c Строчная латинская буква c
    d Строчная латинская буква d
    e Строчная латинская буква e
    f Строчная латинская буква f
    g Строчная латинская буква g
    h Строчная латинская буква h
    i Строчная латинская буква i
  6A j Строчная латинская буква j
  6B k Строчная латинская буква k
  6C l Строчная латинская буква l
  6D m Строчная латинская буква m
  6E n Строчная латинская буква n
  6F o Строчная латинская буква o
    p Строчная латинская буква p
    q Строчная латинская буква q
    r Строчная латинская буква r
    s Строчная латинская буква s
    t Строчная латинская буква t
    u Строчная латинская буква u
    v Строчная латинская буква v
    w Строчная латинская буква w
    x Строчная латинская буква x
    y Строчная латинская буква y
  7A z Строчная латинская буква z
  7B { Открывающая фигурная скобка
  | Вертикальная черта
  7D } Закрывающая фигурная скобка
  7E ~ Тильда
  7F  
    А Прописная русская буква А
    Б Прописная русская буква Б
    В Прописная русская буква В
    Г Прописная русская буква Г
    Д Прописная русская буква Д
    Е Прописная русская буква Е
    Ж Прописная русская буква Ж
    З Прописная русская буква З
    И Прописная русская буква И
    Й Прописная русская буква Й
  8A К Прописная русская буква К
  8B Л Прописная русская буква Л
  8C М Прописная русская буква М
  8D Н Прописная русская буква Н
  8E О Прописная русская буква О
  8F П Прописная русская буква П
    Р Прописная русская буква Р
    С Прописная русская буква С
    Т Прописная русская буква Т
    У Прописная русская буква У
    Ф Прописная русская буква Ф
    Х Прописная русская буква Х
    Ц Прописная русская буква Ц
    Ч Прописная русская буква Ч
    Ш Прописная русская буква Ш
    Щ Прописная русская буква Щ
  9A Ъ Прописная русская буква Ъ
  9B Ы Прописная русская буква Ы
  9C Ь Прописная русская буква Ь
  9D Э Прописная русская буква Э
  9E Ю Прописная русская буква Ю
  9F Я Прописная русская буква Я
  A0 а Строчная русская буква а
  A1 б Строчная русская буква б
  A2 в Строчная русская буква в
  A3 г Строчная русская буква г
  A4 д Строчная русская буква д
  A5 е Строчная русская буква е
  A6 ж Строчная русская буква ж
  A7 з Строчная русская буква з
  A8 и Строчная русская буква и
  A9 й Строчная русская буква й
  AA к Строчная русская буква к
  AB л Строчная русская буква л
  AC м Строчная русская буква м
  AD н Строчная русская буква н
  AE о Строчная русская буква о
  AF п Строчная русская буква п
  B0  
  B1  
  B2  
  B3 Символ псевдографики
  B4 Символ псевдографики
  B5 Символ псевдографики
  B6 Символ псевдографики
  B7 Символ псевдографики
  B8 Символ псевдографики
  B9 Символ псевдографики
  BA Символ псевдографики
  BB Символ псевдографики
  BC Символ псевдографики
  BD Символ псевдографики
  BE Символ псевдографики
  BF Символ псевдографики
  C0 Символ псевдографики
  C1 Символ псевдографики
  C2 Символ псевдографики
  C3 Символ псевдографики
  C4 Символ псевдографики
  C5 Символ псевдографики
  C6 Символ псевдографики
  C7 Символ псевдографики
  C8 Символ псевдографики
  C9 Символ псевдографики
  CA Символ псевдографики
  CB Символ псевдографики
  CC Символ псевдографики
  CD Символ псевдографики
  CE Символ псевдографики
  CF Символ псевдографики
  D0 Символ псевдографики
  D1 Символ псевдографики
  D2 Символ псевдографики
  D3 Символ псевдографики
  D4 Символ псевдографики
  D5 Символ псевдографики
  D6 Символ псевдографики
  D7 Символ псевдографики
  D8 Символ псевдографики
  D9 Символ псевдографики
  DA Символ псевдографики
  DB  
  DC  
  DD  
  DE  
  DF  
  E0 р Строчная русская буква р
  E1 с Строчная русская буква с
  E2 т Строчная русская буква т
  E3 у Строчная русская буква у
  E4 ф Строчная русская буква ф
  E5 х Строчная русская буква х
  E6 ц Строчная русская буква ц
  E7 ч Строчная русская буква ч
  E8 ш Строчная русская буква ш
  E9 щ Строчная русская буква щ
  EA ъ Строчная русская буква ъ
  EB ы Строчная русская буква ы
  EC ь Строчная русская буква ь
  ED э Строчная русская буква э
  EE ю Строчная русская буква ю
  EF я Строчная русская буква я
  F0 Ё Прописная русская буква Ё
  F1 ё Строчная русская буква ё
  F2 Є  
  F3 є  
  F4 Ї  
  F5 Ї  
  F6 Ў  
  F7 ў  
  F8 ° Знак градуса
  F9 Знак умножения (точка)
  FA ·  
  FB Радикал (взятие корня)
  FC Знак номера
  FD ¤ Знак денежной единицы (рубль)
  FE  
  FF    

При записи текстов кроме двоичных кодов, непосредственно отображающих буквы, применяются двоичные коды, обозначающие переход на новую строку и возврат курсора (возврат каретки) на нулевую позицию строки. Эти символы обычно применяются вместе. Их двоичные коды - 10 (0A) и 13 (0D). В качестве примера ниже приведен участок текста данной страницы. На этом участке записан ее первый абзац. Для отображения информации применен следующий формат:

  • в первой колонке записан двоичный адрес первого байта строки
  • в следующи шестнадцати колонках записаны байты, содержащиеся в текстовом файле. Для более удобного определения номера байта после восьмой колонки проведена вертикальная линия. Байты, для краткости записи, представлены в шестнадцатеричном коде.
  • в последней колонке эти же байты представлены в виде отображаемых буквенных символов

00000000: 82 E1 A5 20 E1 A8 AC A2 │ AE AB EB 20 A8 20 A1 E3 Все символы и бу

00000010: AA A2 EB 20 AC AE A3 E3 │ E2 20 A1 EB E2 EC 20 A7 квы могут быть з

00000020: A0 AA AE A4 A8 E0 AE A2 │ A0 AD EB 20 AF E0 A8 20 акодированы при

00000030: AF AE AC AE E9 A8 20 A2 │ AE E1 EC AC A8 20 A4 A2 помощи восьми дв

00000040: AE A8 E7 AD EB E5 20 E1 │ A8 AC A2 AE AB AE A2 2E оичных символов.

00000050: 0D 0A 8D A0 A8 A1 AE AB │ A5 A5 20 E0 A0 E1 AF E0 ♪◙Наиболее распр

00000060: AE E1 E2 E0 A0 AD A5 AD │ AD EB AC A8 20 E2 A0 A1 остраненными таб

00000070: AB A8 E6 A0 AC A8 20 EF │ A2 AB EF EE E2 E1 EF 20 лицами являются

00000080: E2 A0 A1 AB A8 E6 EB 20 │ 41 53 43 49 49 20 E1 20 таблицы ASCII с

00000090: AD A0 E6 A8 AE AD A0 AB │ EC AD EB AC A8 0D 0A E0 национальными♪◙р

000000A0: A0 E1 E8 A8 E0 A5 AD A8 │ EF AC A8 2C 20 AF E0 A8 асширениями, при

000000B0: AC A5 AD EF EE E9 A8 A5 │ E1 EF 20 A2 20 44 4F 53 меняющиеся в DOS

000000C0: 20 28 A8 20 AA AE E2 AE │ E0 EB A5 20 AC AE A6 AD (и которые можн

000000D0: AE 20 A8 E1 AF AE AB EC │ A7 AE A2 A0 E2 EC 20 A4 о использовать д

000000E0: AB EF 20 A7 A0 AF A8 E1 │ A8 0D 0A E2 A5 AA E1 E2 ля записи♪◙текст

000000F0: AE A2 20 A2 20 AC A8 AA │ E0 AE AF E0 AE E6 A5 E1 ов в микропроцес

00000100: E1 AE E0 A0 E5 29 2C 20 │ A8 20 E2 A0 A1 AB A8 E6 сорах),и таблиц

00000110: EB 20 41 4E 53 49 2C 20 │ AF E0 A8 AC A5 AD EF EE ы ANSI, применяю

00000120: E9 A8 A5 E1 EF 20 A2 20 │ 57 49 4E 44 4F 57 53 2E щиеся в WINDOWS.

00000130: 20 82 20 E2 A0 A1 AB A8 │ E6 A0 E5 0D 0A 41 53 43 В таблицах♪◙ASC

00000140: 49 49 20 A8 20 41 4E 53 │ 49 20 AF A5 E0 A2 EB A5 II и ANSI первые

00000150: 20 31 32 38 20 E1 A8 AC │ A2 AE AB AE A2 20 E1 AE 128 символов со

00000160: A2 AF A0 A4 A0 EE E2 2E │ 20 82 20 ED E2 AE A9 20 впадают. В этой

00000170: E7 A0 E1 E2 A8 20 E2 A0 │ A1 AB A8 E6 EB 20 E1 AE части таблицы со

00000180: A4 A5 E0 A6 A0 E2 E1 EF │ 0D 0A E1 A8 AC A2 AE AB держатся♪◙символ

00000190: EB 20 E6 A8 E4 E0 2C 20 │ A7 AD A0 AA AE A2 20 AF ы цифр, знаков п

000001A0: E0 A5 AF A8 AD A0 AD A8 │ EF 2C 20 AB A0 E2 A8 AD репинания, латин

000001B0: E1 AA A8 A5 20 A1 E3 AA │ A2 EB 20 A2 A5 E0 E5 AD ские буквы верхн

000001C0: A5 A3 AE 20 A8 20 AD A8 │ A6 AD A5 A3 AE 20 E0 A5 его инижнего ре

000001D0: A3 A8 E1 E2 E0 AE A2 20 │ A8 0D 0A E3 AF E0 A0 A2 гистров и♪◙управ

000001E0: AB EF EE E9 A8 A5 20 E1 │ A8 AC A2 AE AB EB 2E 20 ляющие символы.

000001F0: 8D A0 E6 A8 AE AD A0 AB │ EC AD EB A5 20 E0 A0 E1 Национальные рас

00000200: E8 A8 E0 A5 AD A8 EF 20 │ E1 A8 AC A2 AE AB EC AD ширения символьн

00000210: EB E5 20 E2 A0 A1 AB A8 │ E6 20 A8 20 E1 A8 AC A2 ыхтаблиц и симв

00000220: AE AB EB 0D 0A AF E1 A5 │ A2 A4 AE A3 E0 A0 E4 A8 олы♪◙псевдографи

00000230: AA A8 20 E1 AE A4 A5 E0 │ A6 A0 E2 E1 EF 20 A2 20 ки содержатся в

00000240: AF AE E1 AB A5 A4 AD A8 │ E5 20 31 32 38 20 AA AE последних 128 ко

00000250: A4 A0 E5 20 ED E2 A8 E5 │ 20 E2 A0 A1 AB A8 E6 2C дах этих таблиц,

00000260: 20 AF AE ED E2 AE AC E3 │ 20 E0 E3 E1 E1 AA A8 A5 поэтому русские

00000270: 0D 0A E2 A5 AA E1 E2 EB │ 20 A2 20 AE AF A5 E0 A0 ♪◙тексты в опера

00000280: E6 A8 AE AD AD EB E5 20 │ E1 A8 E1 E2 A5 AC A0 E5 ционных системах

00000290: 20 44 4F 53 20 A8 20 57 │ 49 4E 44 4F 57 53 20 AD DOS и WINDOWS н

000002A0: A5 20 E1 AE A2 AF A0 A4 │ A0 EE E2 2E 0D 0A е совпадают.♪◙

В приведенном примере видно, что первая строка текста занимает 80 байт. Первый байт 82 соответствует букве 'В'. Второй байт E1 соответствует букве 'с'. Третий байт A5 соответствует букве 'е'. Следующий байт 20 отображает пустой промежуток между словами (пробел) ' '. 81 и 82 байты содержат символы возврата каретки и перевода строки 0D 0A. Эти символы мы находим по двоичному адресу 00000050: Следующая строка исходного текста не кратна 16 (ее длина равна 76 буквам), поэтому для того, чтобы найти ее конец потребуется сначала найти строку 000000E0: и от нее отсчитать девять колонок. Там снова записаны байты возврата каретки и перевода строки 0D 0A. Остальной текст анализируется точно таким же образом.

Литература:

  1. Р. Джордейн Справочник программиста персональных компьютеров IBM PC 1992
  2. Михаил Гук Аппаратные средства IBM PC 1998
  3. ru.wikibooks.org
<== предыдущая лекция | следующая лекция ==>
 | Арифметико-логическое устройство (АЛУ)
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 657; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.051 сек.