Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет r_l ([info]r_l)
@ 2011-05-14 12:35:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
К новой текстологии: "OCR-viruses"
Новая славная текстология: ошибочный вариант цитаты, размещенный в авторитетном месте (авторитетность понимается здесь отнюдь не филологически) при копипейсте имеет шансы на выживание не меньше нормального. В реальности пока действует "закон агенства паталогоанатомов" - неверных вариантов, кажется, меньше, чем верных. Очень жалею, что когда-то, осознав эту проблему, не начал отслеживать динамику (тогда, кажется, и цифры, выдаваемые гуглом как информация о вхождениях, не были еще непонятным украшением и имели отношение к реальности базы данных). Но я не уверен, что этот закон универсален.

Пример:
Человек превращается в шорох пера на бумаге, в кольцо (там еще один ляп, кажется, во всех случаях - отсутствие запятой между стихами, что дает дополнительную семантическую ошибку: "кольцо петли").
Очевидный источник вируса в сети - файл из библиотеки Мошкова; свод текстов подготовлен С. Винницким, который, несмотря на свою несомненную добродетельность, бага ввел в строй. В преамбуле С.В. указывает на множественность источников свода: т.е. ошибка может восходить к одному из электронных вариантов "Части речи", но сетевая авторитетность lib.ru несомненна.
Мощный ретранслятор вируса - lib.rus.ec (примечания с инициалами "С.В." перенесены из файла lib.ru, но атрибуция вычитки и преамбула сняты).
В выдаче - цитаты в блогах и самодеятельные собрания. Остается сидеть и ждать, когда вирус перекочует в другие жанры.
Покуда в поиске по книгам видна только эта цитата (с пропушенной запятой, т.е. не имеющая непосредственного отношения к нашему вирусу):

Впрочем, можно предположить, что материальным источником цитаты явился именно наш зараженный файл (одна из его инкарнаций), автор монографии самостоятельно снял одну ошибку (связанную с рифмовкой и легко опознаваемую) и не заметил второй.
Интересно было бы составить каталог таких мутаций, поглядев на них с точки зрения типологии искажений, вносимых в текст. Конечно, оптимальный объект тут - "На независимость Украины".


(Читать комментарии) - (Добавить комментарий)


[info]r_l
2011-05-14 14:39 (ссылка)
Поздравляю Вас! Вы почти прошли тест: еще "патОлого..."
"Закон агенства паталогоанатомов" формулируется так: "неправильных (эрративных) написаний в сети меньше, чем правильных". Собственно, проверить это уже затруднительно (поисковики стали слишком умными для филолога). Частным следствием закона является возможность проверки сомнительного написания путем введения двух конкурирующих форм и сравнения цифр выдачи (раньше можно было вводить обе одновременно).
Агентство: Результатов: примерно 74 700 000
Агенство: Результатов: примерно 13 600 000
Можно было также вычислять индексы эрративности (деля одно на другое).
Кому все это мешало?!
Спасибо за внимание.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ddyom.livejournal.com
2011-05-14 14:59 (ссылка)
уделали, спасибо

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2011-05-14 15:02 (ссылка)
Ну ладно, я так, слегка съехидничал.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ddyom.livejournal.com
2011-05-14 15:03 (ссылка)
у меня на "агенства" всегда шерсть таким дыбом встает, шо контекст заслоняет

(Ответить) (Уровень выше)


[info]cema
2011-05-14 17:37 (ссылка)
Если в кавычках:

Агенство
http://www.google.com/search?q=%22%D0%B0%D0%B3%D0%B5%D0%BD%D1%81%D1%82%D0%B2%D0%BE%22
9,8 млн

Агентство
http://www.google.com/search?q=%22%D0%B0%D0%B3%D0%B5%D0%BD%D1%82%D1%81%D1%82%D0%B2%D0%BE%22
75 млн

Не знаю, годится ли.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2011-05-14 18:25 (ссылка)
Там действительно непонятно за чем эти цифры рисуют. Кажется, просто по традиции.

(Ответить) (Уровень выше)


[info]dimmho
2011-05-14 18:55 (ссылка)
13 млн vs 74 млн -- что-то многовато, даже школьники неблагополучной школы дадут лучше соотношение

моя версия:
частотность "агенств" дают айтишники (программисты и поналезшие к ним в компанию)
потому,
что айтишные авторитеты хорошо помнят английские написания и не помнят русских
например, agency -- 'т' в корне отсутствует

(Ответить) (Уровень выше)


(Читать комментарии) -