Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Небезпечний код




Однією з основних переваг мови С# є його схема роботи з пам'яттю: автоматичне виділення пам'яті під об'єкти і автоматичне прибирання сміття. При цьому неможливо звернутися за неіснуючою адресою пам'яті або вийти за межі масиву, що робить програми надійнішими і безпечнішими і унеможливлює появи цілого класу помилок.

Проте в деяких випадках виникає необхідність працювати з адресами пам'яті безпосередньо, наприклад, при взаємодії з операційною системою, написанні драйверів або програм, час виконання яких критично. Таку можливість надає так званий небезпечний (unsafe) код.

Небезпечним називається код, виконання якого середовище CLR не контролює. Він працює безпосередньо з адресами областей пам'яті за допомогою вказівок і має бути явним чином помічений за допомогою ключового слова unsafe, яке визначає так званий небезпечний контекст виконання.

Ключове слово unsafe може використовуватись або як спецификатор, або як оператор. У першому випадку його указують разом з іншими специфікаторами при описі класу, делегата, структури, методу, поля і так далі - скрізь, де допустимі інші специфікатори. Наприклад:

 

public unsafe struct Node

{

public int Value;.

public Node* Left;

public Node* Right;

}

 

Вся структура Node позначається як небезпечна, що робить можливим використання в ній вказівок Left і Right. Можна застосувати і інший варіант опису, в якому небезпечними оголошуються тільки відповідні поля структури:

public struct Node

{

public int Value;

public unsafe Node* Left;

public unsafe Node* Right;

}

Оператор unsafe має наступний синтаксис:

 

unsafe блок

 

Всі оператори, що входять в блок, виконуються в небезпечному контексті.

Компіляція кода, що містить небезпечні фрагменти, повинна проводитися з ключем / unsafe. Цей режим можна встановити шляхом налаштування середовища Visual Studio (Project ► Properties ► Configuration Properties ► Build ► Allow Unsafe Code).

 

14.1.1. Синтаксис вказівок

Вказівки призначені для зберігання адреси областей пам'яті. Синтаксис оголошення вказівок:

 

тип* змінна;

 

Тут тип - це тип величини, на яку указує змінна, тобто величини, що зберігається за записаною в змінній адресою. Тип не може бути класом, але може бути структурою, переліченням, вказівкою, а також одним із стандартних типів: sbyte, byte, short, ushort, int, uint, long, ulong, char, float, double, decimal, bool і void. Останнє означає, що вказівка посилається на змінну невідомого типу. Вказівка на тип void застосовується в тих випадках, коли конкретний тип об'єкту, адресу якого потрібно зберігати, не визначений (наприклад, якщо в одній і тій же змінній в різні моменти часу потрібно зберігати адреси об'єктів різних типів). Вказівці на тип void можна привласнити значення вказівки будь-якого типу, а також порівнювати його з будь-якими вказівками, але перед виконанням яких-небудь дій з областю пам'яті, на яку вона посилається, потрібно перетворити його до конкретного типу явним чином. Приклади оголошення вказівок:

 

int* а; // вказівка на int

Node* pNode; // вказівка на описану раніше структуру Node

void* р; // вказівка на невизначений тип

int*[] m; // одновимірний масив вказівок на int

int** d; // вказівка на вказівку на int

У одному операторові можна описати декілька вказівок одного і того ж типу, наприклад:

int* а, b, с; // три вказівки на int

 

Величини типу вказівки можуть бути локальними змінними, полями, параметрами і повертаємим значенням функції. Ці величини підпорядковуються загальним правилам визначення зони дії і часу життя.

 

14.1.2. Перетворення та ініціалізація вказівок

 

Для вказівок підтримуються неявні перетворення з будь-якого типу вказівки до типу void *. Будь-якій вказівці можна привласнити константу null. Крім того, допускаються явні перетворення:

· між вказівками будь-якого типу;

· між вказівками будь-якого типу і цілими типами.

Коректність перетворень лежить на совісті програміста. Перетворення ніяк не впливають на величини, на які посилаються вказівки, але при спробі набуття значення по вказівкам невідповідного типу поведінка програми не визначена.

 

Нижче перераховані способи привласнення значень вказівкам:

1. Привласнення вказівки адреси існуючого об'єкту:

1.1. За допомогою операції отримання адреси:

int а = 5;

int* р = &а;

 

1.2. За допомогою значення іншої вказівки:

int* r = р;

 

1.3. За допомогою імені масиву, яке трактується як адреса:

int[] b = new int[] {10, 20, 30, 50}; //масив

fixed (int* t = b) {... }; // привласнення адреси початку масиву

fixed (int* t = &b[0]) {... }; //те ж саме

 

Оператор fixed розглядається пізніше.

 

2. Привласнення вказівки адреси області пам'яті в явному вигляді:

 

char* v = (char *) 0x12F69e;

 

Тут 0x12F69e - шістнадцятирічна константа, (char *) - операція приведення типу: константа перетвориться до типу вказівки на char. Використовувати цей спосіб можна тільки в тому випадку, якщо адреса точно відома, інакше може виникнути виключення.

 

З. Надання нульового значення:

 

int* хх = nul1;

 

4. Виділення області пам'яті в стеку і привласнення її адреси вказівці:

 

int* s = stackalloc int [10];

 

Тут операція stackalloc виконує виділення пам'яті під 10 величин типу int (масив з 10 елементів) і записує адресу початку цієї області пам'яті в змінну s, яка може трактуватися як ім'я масиву.

 

14.1.3. Операції з вказівками

Всі операції з вказівками виконуються в небезпечному контексті. Вони перераховані в таблиці 14.1.

Таблиця 14.1

Операції з вказівками

 

Операція Опис
* Набуття значення, яке знаходиться за адресою, що зберігається у вказівці
-> Доступ до елементу структури через вказівку
[ ] Доступ до елементу масиву через вказівку
& Отримання адреси змінною
++, -- Збільшення і зменшення значення вказівки на один елемент, що адресується
+, - Складання з цілою величиною і віднімання вказівки
==,!=, <>, <=, >= Порівняння адрес, що зберігаються у вказівках. Виконується як порівняння беззнакових цілих величин
stackalloc Виділення пам'яті в стеку під змінну, на яку посилається вказівка

 

Розглянемо приклади застосування операцій. Якщо у вказівку занесена адреса об'єкту, дістати доступ до цього об'єкту можна за допомогою операцій розадресації і доступу до елементу.

Операція розадресації або розіменування призначена для доступу до величини, адреса якої зберігається у вказівці. Цю операцію можна використовувати як для отримання, так і для зміни значення величини, наприклад:

int а = 5; // ціла змінна

int* р = &а; // ініціалізація вказівки адресою а

Console.WriteLine(*р): // результат: 5

Console.WriteLine(++ (*р)); // результат: 6

int[] b = new int[] {10, 20, 30, 50}; // масив

fixed (int* t = b) // ініціалізація вказівки

// адресою початку масиву

int* z = t; // ініціалізація вказівки

// значенням іншої вказівки

 

for (int i = 0; i < b.Length; ++i)

{

t[i] += 5;

*z += 5;

++z;

}

Console.WriteLine(&t[5] - t); // операція віднімання вказівок

 

Оператор fixed фіксує об'єкт, адреса якого заноситься до вказівок, для того, щоб його не переміщав складальник сміття і, таким чином, вказівки залишалися коректними. Фіксація відбувається на час виконання блоку, який записаний після круглих дужок.

У приведеному прикладі доступ до елементів масиву виконується двома способами: шляхом індексації вказівки t і шляхом розадресації вказівки z.

Конструкцію *змінна можна використовувати в лівій частині оператора привласнення, оскільки вона визначає адресу області пам'яті. Для простоти цю конструкцію можна вважати за ім'я змінної, на яку посилається вказівка. З нею допустимі всі дії, визначені для величин відповідного типу.

Арифметичні операції з вказівками (складання з цілим, віднімання, інкремент і декремент) автоматично враховують розмір типу величин, що адресуються вказівками. Ці операції застосовні тільки до вказівок одного типу і мають сенс в основному при роботі із структурами даних, елементи яких розміщені в пам'яті послідовно, наприклад, з масивами.

Інкремент переміщає вказівка до наступного елементу масиву, декремент - до попереднього. Фактично значення вказівки змінюється на величину sizeof (тип), де sizeof - операція отримання розміру величини вказаного типу (у байтах). Ця операція застосовується тільки в небезпечному контексті, з її допомогою можна отримувати розміри не тільки стандартних, але і призначених для користувача типів даних. Для структури результат може бути більше суми довжин складових її полів із-за вирівнювання елементів.

Якщо вказівка на певний тип збільшується або зменшується на константу, його значення змінюється на величину цієї константи, помножену на розмір об'єкту даного типу, наприклад:

short* р;...

р++; // значення р збільшується на 2

long* q;

q++; // значення q збільшується на 4

 

Різниця двох вказівок - це різниця їх значень, що ділиться на розмір типу в байтах. Так, результат виконання останньої операції виведення в приведеному прикладі дорівнює 5. Підсумовування двох вказівок не допускається.

При записі виразів з вказівками слід звертати увагу на пріоритети операцій. Як приклад розглянемо послідовність дій, задану в операторові

 

*р++ =10;

Оскільки інкремент постфіксний, він виконується після виконання операції привласнення. Таким чином, спочатку за адресою, записаною в вказівку р, буде записано значення 10, а потім вказівка збільшиться на кількість байтів, відповідну його типу. Те ж саме можна записати докладніше:

 

*р = 10; p++;

 

Вираз (*р)++, навпаки, інкрементує значення, на яке посилається вказівка.

У наступному прикладі кожен байт беззнакового цілого числа х виводиться на консоль за допомогою вказівки t:

 

uint х = 0xAB10234F;

byte* t = (byte*)&x;

for (int i = 0; i < 4: ++i)

Console.Write("{0: X} ", *t++); // результат: 4F 23 10 AB

 

Як бачите, спочатку вказівка t був встановлений на молодший байт змінної х. Лістинг 14.1 ілюструє доступ до поля класу і елементу структури:

Лістинг 14.1. Доступ до поля класу і елементу структури за допомогою вказівок.

 

using System;

namespace ConsoleApplicationl

{

class A

{

public int value = 20;

}

struct В

{

public int a;

}

class Program

{

unsafe static void Main()

{

A n = new A();

fixed (int* pn = &n.value) ++ (*pn);

Console.WriteLine("n = " + n.value); // результат: 21

В b;

В* pb = &b;

pb->a = 100;

Console.WriteLine(b.a); // результат: 100

}

}

}

 

Операція stackalloc дозволяє виділити пам'ять в стеку під задану кількість величин заданого типу:

 

stackalloc тип [ кількість ]

 

Кількість задається цілочисельним виразом. Якщо пам'яті недостатньо, генерується виключення System.StackOverflowException. Виділена пам'ять нічим не ініціюється і автоматично звільняється при завершенні блоку, що містить цю операцію. Приклад виділення пам'яті під п'ять елементів типу int і їх заповнення числами від 0 до 4:

 

int* р = stackalloc int [5];

for (int i = 0; i < 5: ++i)

{

p[1]-1;

Console.Write(p[i] + " "); // результат: 0 1 2 3 4.

}

У лістингу 14.2 приведений приклад роботи з вказівками, узятий із специфікації С#. Метод IntToString перетворить передане йому ціле значення в рядок символів, заповнюючи його шляхом доступу через вказівку.

 

Лістинг 14.2. Приклад роботи з вказівками: переведення числа в рядок

 

using System;

class Test

{

static string IntToString (int value)

{

int n = value >= 0? value: -value;

unsafe {

char* buffer = stackalloc char[16];

char* p = buffer + 16;

do {

*--p = (char)(n % 10 + '0');

n /= 10;

} while (n!= 0);

if (value < 0) *-- p = '-';

return new string(p, 0, (int)(buffer + 16 - p));

}

}

static void Main()

{

Console.WriteLine(IntToString(12345));

Console.WriteLine(IntToString(-999));

}

}

 

 

14.2. Регулярні вирази

Регулярні вирази призначені для обробки текстової інформації і забезпечують:

· ефективний пошук в тексті за заданим шаблоном;

· редагування, заміну і видалення підрядків;

· формування підсумкових звітів за наслідками роботи з текстом.

 

За допомогою регулярних виразів зручно обробляти файли у форматі HTML, файли журналів або довгі текстові файли. Для підтримки регулярних виразів в бібліотеку.NET включені класи, об'єднані в простір імен System.Text.RegularExpressions.

 




Поделиться с друзьями:


Дата добавления: 2014-12-27; Просмотров: 410; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.092 сек.