Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Электронные коллекции текстов




Бесплатные электронные библиотеки формируются, как правило, отдельными энтузиастами или сообществами, заинтересованными в продвижении собственных взглядов. Несколько менее распространенной разновидностью существования бесплатных электронных собраний является их организация и поддержка с целью превратить сайт в посещаемый портал с возможностью получать устойчивый доход от размещаемой рекламы.

Неформальной датой начала создания открытых электронных библиотек формально считается 1971 год, отмеченный возникновением "Проекта Гуттенберг" (Project Gutenberg). В этом году сотруднику иллинойского университета Майклу Харту (Michael Hart) было поручено найти наиболее достойное применение машинному времени на мэйнфрейме Xerox Sigma V. Стоимость предоставленного машинного времени в долларовом эквиваленте составляла сумму равную 100.000.000. После некоторых размышлений Харт пришел к выводу, что наиболее эффективным применением машинного времени будет не проведение математических расчетов, а ввод, хранение и поиск обычных печатных источников в виде текстовых файлов. Самостоятельно и с помощью своих друзей он вручную ввел в компьютер наиболее важные по его мнению источники, к коим относились "Декларация Независимости" Соединенных Штатов, Конституция США, текст Библии и ряд других работ, заслуживающих внесения в перечень вечных ценностей.

В дальнейшем проект поступательно расширялся и сейчас включает несколько тысяч произведений, среди которых известнейшие художественные произведения, научные трактаты и публицистические произведения - все на английском языке. Отбор в библиотеку весьма строг - в ее фонд включаются лишь произведения, составляющие сокровищницу человеческой цивилизации. В настоящее время адрес официального сайта "Проекта Гуттенберг" - http://www.gutenberg.net

Примеру Харта последовало множество отдельных энтузиастов и целых организаций и ныне большие и малые бесплатные электронные библиотеки составляют неотъемлемую часть ресурсов Сети. Владельцы подобных электронных собраний преследуют разные цели, но все эти библиотеки имеют характерные черты, позволяющие рассматривать их как единое явление.

Методы комплектования открытых электронных библиотек чрезвычайно просты. Тексты поступают в библиотеку одним из следующих путей:

– копируются с других сайтов;

– присылаются добровольными дарителями;

– производится их специальное сканирование и распознавание;

– тексты получаются непосредственно из издательства или от авторов.

Все эти способы используются в комплексе в зависимости от изначально поставленных задач. Например, в случае формирования фонда электронных документов, заданной тематики, основным источником поступлений является собственноручное сканирование и распознавание текстов, существующих в печатной форме. Таковы, например, "Военная литература" (militera.lib.ru), "Сказки" (www.skazka.com.ru) или Библиотека научного атеизма (www.atheism.ru/library).

В ситуации, когда область отбираемых произведений ничем не ограничена, главными методами комплектования на начальном этапе выступает копирование текстов с других сайтов. При благоприятном развитии проекта, возрастании его известности и авторитета, главным источником пополнения фонда становятся тексты, присланные дарителями. Среди жертвователей преобладают лица, страстно увлекающиеся произведениями определенного автора или направления. Увлечение это, среди прочего, выражается в сканировании и распознавании максимально большого числа любимых произведений. Однако размещение готовых текстов на личном сервере не гарантирует ознакомления с ним большого числа посетителей, и, наоборот, включение в уже существующее электронное собрание с хорошей посещаемостью обеспечивает произведению широкую известность. По этой причине поклонники самых различных авторов, направлений и жанров стремятся дополнить электронные библиотеки собственноручно созданными электронными текстами. Именно таким образом формировалась и продолжает формироваться Библиотека Максима Мошкова (www.lib.ru), являющаяся на сегодня крупнейшей бесплатной электронной библиотекой Российского сегмента Интернет. В ее составе представлены произведения самого различного художественного и научного уровня, отражающие средний вкус пользователей российского сегмента Сети.

Получение текстов непосредственно из издательств - явление крайне редкое в практике комплектования бесплатных электронных библиотек. Передача оригинал-макета выходящего издания для размещения в электронном собрании чревата для издателя сокращением числа потенциальных покупателей печатных экземпляров. Исключение составляют авторитетные электронные собрания, имеющие ярко выраженную просветительскую направленность. Ярким примером является Сетевая образовательная библиотека "Vivos Voco!" (vivovoco.rsl.ru) в которой регулярно размещаются статьи из свежих номеров авторитетных российских периодических изданий.

В раде случаев тексты произведений поступают в бесплатные электронные библиотеки непосредственно от авторов. Это, однако, относится лишь к наиболее авторитетным собраниям, включение в которые может способствовать повышению популярности писателя.

Качество текста большинства источников, размещаемых в бесплатных электронных библиотеках, весьма невысоко. С самого начала существования электронных коллекций текст в них был представлен в виде простейших ASCII-файлов. Файлы в формате.txt как известно не содержат таких излишеств форматирования как выделение фрагментов курсивом, жирным шрифтом или подчеркиванием. Естественно в txt-документах отсутствуют и все другие элементы в виде таблиц, графиков или иллюстраций, которые в значительной мере обогащают содержание произведения. Любое повышение качества текста, например, простейшая его разметка с применением HTML, связано с повышением стоимости производства документа, что чаще всего неприемлемо для проектов, положивших в основу своей деятельности бесплатность. Поэтому большинство электронных библиотек, включая "Проект Гуттенберг" и Библиотеку Мошкова до сего времени принимают тексты исключительно в виде простейших ASCII-файлов.

Не менее важной проблемой является идентичность текста оригиналу, в качестве которого в большинстве случаев выступает традиционное печатное издание. В процессе распознавания сканированного текста или ручного ввода неминуемо возникает большое количество ошибок, которые невозможно исправить с помощью автоматизированной проверки текста. Программы проверки грамотности не в состоянии вычленить и исправить неправильно распознанные слова со схожим написанием. В результате в тексте вполне возможно появление "нанялся" вместо "занялся", "гноить" вместо "строить", "запятая" вместо "занятая" и подобные им ошибки. Помимо изменения слов, насчитывается огромное число более мелких ошибок, как, например, употребление двоеточия вместо точки с запятой. От этого не свободны даже стремящиеся к максимальной академичности открытые цифровые собрания. Таким образом, надо быть готовыми к тому, что канонические, выверенные редакторами и корректорами тексты, в бесплатных электронных библиотеках обнаружить практически невозможно.

Для электронных библиотек, формируемых энтузиастами, весьма важен вопрос согласования размещения произведений для всеобщего доступа с нормами авторского права. Проблема эта решается по-разному, в зависимости от степени строгости соблюдения соответствующих законов в конкретных странах. В России соблюдение авторского права остается одним из наиболее запутанных вопросов. Большинство электронных коллекций содержат источники, на которые распространяются права их законных владельцев, включая ныне живущих авторов. Наиболее распространенной практикой при этом является получение от владельца авторских прав разрешения на публикацию. Большинство авторов на это идут, справедливо полагая, что факт публикации в Интернет, если и не прибавляет размер авторских вознаграждений, то, безусловно, расширяет популярность. Очень часто создатели электронных библиотек размещают на сайте объявление, согласно которому документ в любой момент может быть изъят из собрания (удален с сервера) по первому требованию законного владельца прав на данный источник. Следует отметить, что такие заявления со стороны авторов или издателей пока редкость в российской практике.

Сервисные функции электронных библиотек включают возможность поиска текста и его сохранение. Ныне в большинстве цифровых собраний реализованы иерархические меню, отдаленно напоминающие рубрики библиотечных классификаций. С их помощью осуществляется примитивная навигация в ресурсах. В большинстве случаев имеется и простейший поисковый механизм, позволяющий вести разыскание по ключевым словам в пределах всего собрания. Для этого весь массив электронной библиотеки предварительно индексируется.

Таким образом, для бесплатных электронных библиотек зачастую характерны неполнота и случайность представленных изданий, невысокая эффективность системы навигации и поиска, грамматические ошибки в текстах. Цифровые собрания в большинстве своем подготовлены их создателями в свободное от основной деятельности время, чем и объясняются указанные недостатки. Однако любые негативные моменты компенсируются двумя главными достоинствами цифровых библиотек - их колоссальными объемами и бесплатностью пользования. Эти факторы обеспечивает открытым электронным коллекциям текстов широкую популярность у пользователей Сети во всем мире. В них можно найти все что угодно - от детских сказок - до армейских уставов, от классических философских трактатов до лирических произведений современных начинающих авторов и кулинарных рецептов.

В настоящее время в Сети представлено огромное количество бесплатных электронных библиотек. Их пространный перечень содержится в разделе "Электронные библиотеки" справочника "Апорт" (catalog.aport.ru/rus/themes.asp?id=2107&r=0). Среди наиболее крупных и авторитетных собраний можно отметить Библиотеку Максима Мошкова (www.lib.ru), включающую огромное число самых разнообразных произведений от серьезных романов до детективов, технической документации и работ литературных дилетантов. Широкую известность имеют электронные библиотеки, размещенные на сайтах с характерными доменными именами: Классика.ру (www.klassika.ru), Проза.ру (www.proza.ru), BestBooks.RU (www.bestbooks.ru). Особое место занимает проект Vivos Voco! - "Зову живых!" (vivovoco.rsl.ru), содержащий избранные произведения, обладающие, по мнению его создателей, значительной научной или художественной ценностью.

Среди зарубежных бесплатных электронных библиотек выделяются "Проект Гуттенберг" (http://www.gutenberg.net) и Публичная Интернет библиотека - Internet Public Library (www.ipl.org). Если "Гуттенберг", содержащий лучшие произведения человеческой разума, формируется на добровольных началах и путем добровольных же пожертвований текстов, то IPL является проектом, который целенаправленно финансируется Мичиганским университетом. За счет этого Публичную Интернет библиотеку отличает высокий качественный уровень. В ней отражены бесплатные англоязычные издания, расположенные на серверах по всему миру. Реализована возможность многоаспектного поиска: в иерархии отраслей знания в строгом соответствии с Десятичной Классификацией Дьюи или непосредственно по автору, заглавию или индексу DDC.

Следует иметь ввиду, что к настоящему времени традиционные библиотеки не играют доминирующей роли в формировании в Сети бесплатных цифровых собраний. Профессиональные библиотекари пока более примеряются к новым реалиям, пытаясь выстроить собственную деятельность в соответствии возможностями цифровой эпохи.




Поделиться с друзьями:


Дата добавления: 2015-05-10; Просмотров: 312; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.