Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет bbb ([info]bbb)
@ 2008-08-24 13:48:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Бумага и веб
7 агуста ImageАнтон возмущался:
Я не очень понимаю, как может Арбитражный суд в цифровую эпоху, в городе, где число пользователей Интернета превышает 5,5 миллионов, требовать бумажной копии текста, доступного в открытом доступе на официальном сайте газеты. Надеюсь, это фирменный идиотизм отечественной судебной машины, а не хитрая уловка для снятия дела с рассмотрения.
А теперь, после микро-расследования юзера [info]hoz_subiekt@lj, выходит, что суд-то был прав. Гарантии, что текст на официальном сайте газеты идентичен тексту ее бумажной версии, нет.

Некий аноним предлагает конспирологическую версию случившегося. С учетом того, что, как выяснилось, бумажная версия в целом сокращена по сравнению с электронной, версия о том, что там имеет место редактирование с точки зрения не только размера, но и содержания, не кажется совсем невероятной...


(Читать комментарии) - (Добавить комментарий)


[info]riftsh@lj
2008-08-24 15:32 (ссылка)
Хотя читают все всё в интернете, серьезные люди для серьезных целей (цитирование в академических работах и т.п.) пользуются сертифицированными источниками (напр. Eastview и Integrum для русской периодики). Традиционно эти базы данных отражали бумажные версии, по настоящему интересно что происходит сейчас.

(Ответить) (Ветвь дискуссии)


[info]bbb@lj
2008-08-24 16:18 (ссылка)
Кстати, никогда не задумывался, как они это делают. Неужели в лоб сканируют бумажные выпуски, игнорируя веб?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]riftsh@lj
2008-08-24 19:10 (ссылка)
Насколько я понимаю, многие из таких западных компаний пропустили этап сканирования полностью. Т.е., начинали они с ручного набора (до OCR), а потом перешли на файлы, получаемые от издателей (до интернета). Думаю, что для западных газет они (ЛексисНексис, Фактива и т.д.) используют издательские файлы, соответствующие бумажным версиям, что происходит с русскими газетами я не знаю.

(Ответить) (Уровень выше)


[info]diesell@lj
2008-08-24 19:44 (ссылка)
И сканят, и получают файлы с верстки - в зависимости от наличия соответствующих договоров с редакциями. С веб-версиями не работают.

Рассказываю на примере public.ru (был у них на семинаре)

(Ответить) (Уровень выше)

Integrum и иже с ними
[info]olexa@lj
2008-08-25 17:35 (ссылка)
Мне приходится плотно работать с Integrum'oм, база данных по центральным газетам. Так вот, материалы до 1995 - просто тихий ужас. Обрезанные заголовки, автоматически сгенерированные выжимки вместо полнотекстовой версии статей, примерно 30% просто отсутствуют (пришлось вручную пересматривать микрофильмы соотвествующих изданий).
Насчет бумажных версий. Не уверен, т.к. в моей выборке присутствуют и те и другие (т.е. две версии одной и той же статьи, но указано, что вторая вышла в эл. версии газеты). Для некоторых газет (в частности, Сегодня), эти версии еще и не идентичны, но пока (материал в процессе обработки), я не заметил "злого умысла", т.е. правка не носит явно выраженный идеологический характер. Оттого я был просто потрясен вашим примером.

(Ответить) (Уровень выше)


(Читать комментарии) -