Электронные книги, цифровые библиотеки…
Электронные книги, цифровые библиотеки…
Ныне все чаще можно увидеть человека, который сидит в общественном транспорте, уткнувшись в электронный планшет, и читает. На смену книгам обыкновенным приходят электронные, а библиотеки становятся цифровыми и даже виртуальными – из Интернета сегодня можно выудить практически любую книгу.
Но процесс обновления оказался далеко не столь простым, как может показаться…
Какая бумага? Ныне большинство электронных книг имеет «классическую» электронную бумагу. По существу, она представляет собой сверхтонкий дисплей, между покрытием и подложкой которого заключены мириады черных и белых микрочастиц, всплывающих к поверхности или тонущих в толще экрана под действием меняющегося электрического заряда.
Однако это не единственная технология электронной бумаги. Скажем, появившаяся в марте 2009 года первая в мире цветная электронная книга использует другой принцип формирования изображения. Он основан на отражающих жидких кристаллах (Reflex LCD). А в декабре 2008 года группа ученых из Канады и Британии создала дисплей на базе управляемого синтетического опала, мгновенно меняющего цвет почти во всем видимом спектре. Так что поиск идеала не прекращается.
Теперь молодежь читает в основном электронные книги
Все эти разработки объединяет одно – необычные экраны работают на отраженном свете, так же как «действует» и лист обычной бумаги с буквами и рисунками. Потому эти системы и именуют электронной бумагой. Расход энергии такими устройствами на порядки ниже классических экранов, а читаемость электронной бумаги только улучшается по мере роста внешней освещенности (это актуально на улице), в противовес обычным «светящим» дисплеям, которые при внешней засветке блекнут и весьма сильно.
И вот ныне сделан следующий шаг. Электронная бумага, превосходящая предшественников по контрастности, разрешению и быстродействию, создана группой ученых под руководством профессора Джейсона Хейкенфельда из Университета Цинциннати. Авторы разработки фактически придумали новый принцип работы устройства.
Каждый пиксель электронной бумаги теперь представляет собой пустотелую герметичную гексагональную ячейку, в основе которой лежит алюминиевая пластина (она отражает свет). А в центре ячейки – крошечные полимерные колодцы, заполненные углеродными чернилами (в черно-белом варианте устройства). Сверху же конструкцию прикрывает тонкопленочный прозрачный электрод из оксида индия и олова.
Напряжение, приложенное к электроду и подложке, заставляет чернила мгновенно вытечь из колодца и заполнить всю ячейку. После снятия напряжения чернила тут же собираются обратно в колодец. А поскольку резервуар занимает порядка 5 % от общей видимой площади, в «свернутом» состоянии чернила почти не видны, ячейка кажется белой.
Понятное дело, управляя состоянием всего массива ячеек с помощью выборочно приложенного напряжения, можно формировать на поле любой черно-белый текст или изображение по точкам.
Для получения цветных пикселей авторы проекта решили применить светофильтры, наложенные поверх ячеек. Ширина одной точки в новом дисплее составила 100 мкм, а разрешение экрана – 300 точек на дюйм. Это, по словам Хейкенфельда, больше, чем у большинства моделей электронных книг, имеющихся на рынке.
Но главное преимущество новинки в другом. Новая бумага отражает 55 % падающего света, в то время как серийные электронные книги – 35–40 %, из-за чего их поле кажется серым. Причем, уверяет Джейсон, новую технологию можно улучшить, подняв степень отражения света до 60 %, а потом и выше (тут подразумевается именно цветной вариант дисплея). А это уже сравнимо с обычной белой бумагой: у нее 85-процентное отражение.
Второе колоссальное преимущество новинки – время переключения пикселей между черным и белым состоянием составляет всего одну миллисекунду, что даже быстрее, чем у хороших ЖК-экранов, и в десятки, а то и в сотни раз лучше, чем у традиционных электронных книг.
Одноразовые книги? На Западе электронные книги уже потеснили бумажные – прежде всего это касается научной и юридической литературы. В США существуют целые вузы, где преподавание ведется по электронным учебникам; предполагается, что подобные учебники появятся в некоторых российских школах и вузах.
Но всеобщего бума не получилось: даже такие крупные книжные издательства, как Time Warner и Random House, закрыли отделения по продаже электронных книг, посчитав их «несвоевременными».
Причиной неудач можно, конечно, посчитать вышеизложенные недостатки дисплеев. Но есть и другая версия. Например, некоторые полагают, что на свете давно существуют дешевые летающие электромобили, использующие антигравитацию, – просто нефтяные магнаты прячут их от нас, чтобы и дальше взвинчивать цены на бензин…
В отношении электронных книг тоже легко построить «теорию заговора». Простой факт: прототип электронной бумаги SmartPaper появился в исследовательской лаборатории Xerox PARC почти 30 лет назад. Но тогда же его и положили в долгий ящик. Автору идеи Николасу Шеридону понадобилось более 20 лет, чтобы, основав собственную фирму Gyricon Media, довести идею до реального продукта.
Но даже если книгоиздательская индустрия до сих пор не тормозила развитие электронной бумаги, она будет это делать в ближайшие годы. Хотя бы вот каким образом. В 2001 году в продаже появились первые «одноразовые книги». Электронный роман Агаты Кристи «И после не осталось никого» издательства RosettaBooks можно читать лишь в течение десяти часов. Некоторые электронные учебники «стираются» в конце года. В общем, книгопечатники хотят, чтобы в создании масс отложилась идея «одноразовости» электронных носителей. Хотя на самом деле они достаточно долговечны. А кроме того, допускают неограниченное количество копирований.
Кроме того, электронные носители позволяют автору через Интернет обратиться непосредственно к читателю, минуя книгоиздателей. Именно так, например, поступил всем известный писатель-фантаст Стивен Кинг. В 2000 году он начал публиковать на своем сайте свой роман «Росток», призывая читателей платить по доллару за каждую скачанную главу. Несмотря на то что, по мнению писателя, эксперимент окончился неудачно – после публикации 5-й главы только половина читателей продолжала платить, – Кинг на самом деле получил около полумиллиона долларов чистой прибыли. Далеко не каждая книга в обычном издании приносит такой гонорар…
Оцифрованная эра. Тем не менее одна серьезная проблема превращения всех книг в электронные все же существует. Ведь долгое время книги печаталась на бумаге, писались на пергаменте. И на деле оказалось не так-то просто превратить содержимое ветхого фолианта, впитавшего запахи веков, в микрочип красивой флешки, переписать книгу на диск.
Трудности начинаются уже со сканирования. Нынешние технологии оцифровки книг можно сравнить с печатным станком Гутенберга – медленный и очень трудоемкий процесс.
В мире же сегодня около 600 тыс. библиотек, в которых хранится более 20 млрд экземпляров книг; а ведь есть еще и периодика (не менее 10 млрд экземпляров).
К счастью, современные книги, журналы и газеты уже набраны на компьютерах, имеют электронные копии. Но как быть с миллиардами старых? Современные темпы оцифровки явно невысоки. Например, за 8 лет работы программы поиска книг Google Book Search удалось создать электронную библиотеку из 10 млн книг. Причем часто коммерческие компании больше заинтересованы в электронном издании разрекламированных новинок и не хотят тратиться на классику.
Стало быть, нужна новая уникальная техника. И она создается. Прототип ультрабыстрого сканера, способный оцифровать книгу за минуту, намерены создать в течение двух лет сотрудники Токийского университета. Причем камера, которая делает до 500 фотографий в секунду, что позволяет оцифровывать 170 страниц за 60 секунд, уже имеется. Созданы и инфракрасные датчики, которые работают в трех измерениях и корректируют искажения, вызванные изгибом переворачиваемых страниц. В настоящее время японские инженеры заняты разработкой надежного робота, который мог бы быстро переворачивать страницы, не повреждая их. Пока это приходится делать вручную.
Но и это еще не все…
Не только скопировать, но и расшифровать. С помощью качественной цифровой камеры довольно просто получить оригинал страницы любого фолианта. Однако в большинстве случаев он воспринимается компьютером как своего рода картинка. Чтобы работать с текстом – анализировать, выделять фрагменты, редактировать и т. д., – необходимо перевести «картинки» в текстовый формат. И здесь начинаются главные проблемы.
Старые книги изобилуют декоративными элементами, щедро украшены вязью и стилизованными буквицами. Устаревшие шрифты, которые использовались печатниками пару столетий назад, давно не применяются в современной полиграфии, а некоторые символы вообще исчезли из современных алфавитов. Потому стандартные «распознавалки» с такими текстами не работают.
Кроме того, со временем бумага желтеет, темнеет, а текст выцветает так, что местами становится почти неразличим. Вот почему в течение последних лет в мире реализуются специальные проекты оцифровки старинных книг.
Один из самых масштабных – МЕТА – был задуман и осуществлен странами ЕС. Причем его главная идея такова: надо не раскидывать деньги между библиотеками для покупки сканирующей техники, а финансировать прежде всего разработку системы компьютерных программ для распознавания любых европейских текстов, напечатанных в XVI–XIX веках.
Главным инструментом тут стало программное обеспечение оптического распознавания, разработанное российской компанией ABBYY. На этом, кстати, участие России в данном масштабном проекте завершилось, потому что ориентирован проект был на тексты, напечатанные с помощью популярных в тот период шрифтов Fraktur, Schwabacher, a также другой ломаной «готики».
«Чтобы качественно распознавать любые тексты, не только старые, компьютеру мало уметь узнавать символы алфавита. Нужно обладать знаниями о морфологии языка, структуре слов, – рассказывает генеральный директор ABBYY Россия Григорий Липич. – Это необходимо и для исправления опечаток, встречающихся в текстах, и для уточнения архаичных выражений… А для этого опять-таки нужны исследования по морфологии старинных языков…»
Так у разработчиков из ABBYY появились партнеры – российские лингвисты из новосибирской компании ATAPY Software, которые создали специальные языковые модели для распознавания старых европейских языков. Они проанализировали 10 словарей и более 100 книг, изданных в периоде с 1750 по 1930 год, и загрузили в систему распознавания 159 новых грамматических моделей, не использующихся в современных европейских языках. В итоге на странице текста из 1856 символов средневековой печатной «готики» оказались не распознаны всего четыре. Иными словами, вероятность распознавания достигает 99,8 %!
Понятно, что за качество приходится платить. По оценкам Григория Липича, обработка 25 тыс. страниц стоит около 75 тыс. рублей. По мировым меркам вполне приемлемо. Тем более что программа способна помочь также экспертам, криминалистам, краеведам…
Данный текст является ознакомительным фрагментом.