КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Разработка алгоритма выборки слов
Для создания алгоритма выборки слов следует, прежде всего, определить, что такое слово. Возможны три определения: 1. Последовательность символов, не являющихся пробелами окруженная пробелами слева и справа. Например, в фразе "This is string" " "is" считаются словами согласно этому определению, так как он окружен символами пробела слева и справа. 2. Последовательность символов, не являющихся пробелами окруженная: • началом текста слева • символом пробела справа В нашей фразе словом считается "This". 3. Последовательность непустых символов, окруженная: • символом пробела слева • концом текста справа В нашей фразе словом считается "string". Эти определения включают все возможные подстроки текста, которые считаются словами. Имея определение слова, можно перейти к разработке алгоритма. Основная стратегия алгоритма заключается в применении двух переменных в качестве маркеров текста: wordBegin и wordEnd. Каждая переменная содержит индекс отдельного символа строки. Для иллюстрации возможностей маркеров рассмотрим следующую строку: string myText = "This is string"; Разумеется, строку myText можно рассматривать как индексированный набор символов:
Присваивая маркерам wordBegin и wordEnd допустимые значения, можно: • обращаться к отдельным символам (посредством квадратных скобок []) строки: char ch; wordEnd = 8; ch = myText[wordEnd]; (здесь переменной ch присваивается символ s); • обращаться к подстрокам, заключенным между двумя маркерами, используя метод Substring класса string.wordBegin указывает на начало подстроки, а wordEnd, очевидно, — на ее конец. Например, фрагмент кода int wordLength; wordBegin = 5; wordEnd = 7; wordLength = wordEnd - wordBegin; Console.WriteLine(myText.SubString(wordBegin, wordLength); выводит на консоль текст "is". Если wordBegin всегда указывает на начало слова, переменную wordEnd можно перемещать посимвольно в поиске конца слова. Это иллюстрируется. В соответствии с предыдущими определениями слова wordEnd находит конец слова, если:| · wordEnd указывает на символ пробела · wordEnd достигает конца текста Найденное слово можно извлечь с помощью метода Substring, так как на этот момент четко известно, что wordBegin и wordEnd обозначают границы слова. Последний шаг этого цикла алгоритма — переместить маркер wordBegin на первый символ следующего слова. Для этого ему присваивается значение wordEnd плюс один. Смысл очевиден: когда wordEnd определяет конец слова, эта переменная указывает на пробел перед следующим словом. Последнее справедливо до тех пор, пока не достигнут конец текста. В этом случае алгоритм прекращает работу; не пытаясь переместить маркер wordBegin.
Дата добавления: 2014-01-04; Просмотров: 288; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |