Dmitri Pavlov - Теория письма
January 18th, 2007
06:45 pm

[Link]

Теория письма
Сразу скажу, что излагаемое мною ниже кажется мне настолько простым, что я уверен,
что нечто подобное уже было придумано кем-нибудь раньше.
Было бы замечательно, если кто-то сможет дать ссылку.

В начале сентября я задумался над тем, почему мы пишем так, а не иначе.
Я имею ввиду наш алфавит и способ его написания. Например,
русская буква «А» взята из греческого, в котором она называлась «альфа».
Финикийцы, у которых греки позаимствовали эту букву, рисовали её повёрнутой на прямой угол
против часовой стрелки относительно её нынешнего положения и называли её алеф, что переводится
как бык. Само написание буквы напоминало голову быка. Точно такая же ситуация имеет место
для многих других букв — например, буква «Д» в финикийском называлась
далет, что переводится как палатка, а написание буквы напоминало треугольный вход в палатку.
Этим начертания существуют более трёх тысяч лет, и на их основе были созаданы алфавиты греческого и арабского языков,
иврита, а также другие алфавиты на их основе, использовавшиеся в столь отдалённых областях, как Монголия.
Финикийский язык уже мёртв полторы тысячи лет, а буквы его остались с нами по историческим причинам.
(Я не специалист по древним письменностям, поэтому в вышеприведённом очерке наверняка есть ошибки.)

Мне стало интересно, а каким мог бы быть алфавит, если бы нам пришлось создавать его с нуля,
не опираясь на ранее созданные алфавиты. Я решил исходить из того, что алфавит должен быть
удобным при рукописном написании. Будем считать, что мы рисуем линии на ровной твёрдой поверхности
пером нулевой толщины, не отрывая его от бумаги.

Какие вообще линии мы можем нарисовать? Видимо, следует принять, что положение пера должно быть
непрерывно дифференцируемой функцией из [0, 1]
в плоскость, что следует хотя бы из существования ускорения. Что ещё?
Ясно, что человек — не робот, и не может провести линию точно через заданную точку.
Поэтому мы должны исключить тройные самопересечения, равно как и совпадение начальной или конечной точки
с какой-то другой точкой.

Далее, человек не робот и не в состоянии держать свою руку неподвижно — наши мышцы всегда дрожат, хотя
бы чуть-чуть. Поэтому скорость пера всегда должна быть отлична от нуля. (Если кто-то несогласен с этим
предположением, то он может прочесть ниже возможный вариант разрешения этой трудности.)

Суммируя сказанное, можно сказать, что человек умеет рисовать только иммерсии общего положения отрезка в плоскость.
Такие отображения мы будем называть линиями.

Заметим, что если к линии прибавить достаточно малую (в равномерной норме по функции
и её производной) непрерывно дифференцируемую функцию, то мы снова получим линию.

Вряд ли мы хотим считать различными линии, которые можно получить друг из друга непрерывной деформацией.
Поэтому назовём две линии эквивалентными, если одну из них можно перевести в другую
непрерывно дифференцируемой гомотопией в классе линий.
(Здесь, кстати, надо отметить, что линии ориентированные, и это правильно, как мы увидим ниже.)

Я утверждаю, что человек в состоянии нарисовать представителя любого класса эквивалентности по указанному
выше отношению. Действительно, для этого не надо совершать никаких «тонких» действий,
а надо лишь «грубо» начертить линию. В дальнейшем я не различаю линию и её класс эквивалентности.

Как это применить к письменности? Мы хотим писать слова, не отрывая перо от бумаги. Слова
состоят из букв. Мы должны иметь возможность составить слово из произвольной последовательности букв,
приписывая их рядом. Определим операцию соединения линий также, как композицию
классов петель в фундаментальной группе: новое отображение отрезка в плоскость
будет совпадать с первым отображением на своей первой половине и со вторым — на второй половине.
При этом надо выбрать представителей классов эквивалентности так, чтобы
результирующее отображение было линией, и при этом
не возникло бы новых точек пересечения. При этих условиях операция соединения
определяется однозначно. Легко видеть, что мы получили некоммутативный моноид.
Роль нейтрального элемента играет вложение отрезка в плоскость. Это вложение мы будем называть
тривиальной линией.

Заметим, что если мы хотим соединять буквы привычным нам образом, то
начало и конец линии буквы должны находиться в некомпактной компоненте связности — иначе
нам придётся вписывать одну букву внутрь другой.
Будем называть такие линии внешними.

Не важдый набор внешних линий можно использовать в качестве алфавита.
Необходимо избежать неоднозначности при разборе линий на составные части.
Заметим, что любая внешняя линия однозначно представляется в виде соединения нетривиальных
линий, каждую из которых нельзя разложить в соединения двух нетривильных линий. Такие линии
будем называть простыми.

Простых линий счётное число. Теперь легко понять, что моноид линий — это свободный моноид
с однозначно определённым набором образующих, которыми являются простые линии.

Поэтому естественно в качестве алфавита взять простые линии.
Мы получаем неограниченный запас букв на все случаи жизни.

Буквы естественным образом классифицируются по количеству точек самопересечения.
Заметим, что зеркальная симметрия буквы даёт другую букву с тем же число точек самопересечения.

На рисунке представлены буквы с 1, 2 и 3 точками самопересечения, при этом зеркально-симметричные буквы опущены.
Левая концевая точка начальная, правая — конечная.
Отметим, что в списке есть буквы, отличающиеся только ориентацией.

1, 2 и 9 букв с 1, 2 и 3 точками самопересечения

Ясно, что теорию можно обобщать, допуская, например изломы. На этом пути, по-видимому,
можно получить решение указанной выше проблемы нулевой скорости.

Немаловажное практическое замечание: как легко видеть на рисунке,
наиболее частым элементом является простая петля. На практике такие
петли можно было бы заменить изломами (с разными касательными прямыми слева и справа
и требованием оставаться в этом классе при гомотопии).

Если кому-нибудь это интересно, можно попробовать составить
алфавит для русского языка и записать на нём что-нибудь.

(13 comments | Leave a comment)

Comments
 
[User Picture]
From:[info]vdohnovitel@lj
Date:January 26th, 2007 - 12:19 pm
(Link)
При письме мы часто возвращаемся по той же линии (!) назад. Попробуй, например, написать "у" или "d". Или печатную "1".
From:[info]dmitri_pavlov@lj
Date:June 24th, 2007 - 02:48 pm
(Link)
В том то и дело, что подобные ситуации теорией учитываются.
Точно вернуться назад по линии у меня никогда не получается,
вторая линия всегда чуть-чуть отклоняется.
Например, для указанных букв у меня получается
следующее: Y, D, and 1

Если мой аргумент неубедителен, легко учесть этот аспект в теории:
достаточно для любого пересечения типа скобок (две скобки <)(> придвинули
друг к другу, так, чтобы они пересекались)
ввести дополнительную пометки: является ли данная линия повтором?
Это решает проблему.

Вообще, хотелось бы понять, каковы принципиальные различия между моей теорией
и практикой.

Как там дела в Пенсильвании?
В чём отличие между первым годом и вторым?
[User Picture]
From:[info]vdohnovitel@lj
Date:January 27th, 2007 - 02:10 am
(Link)
Я имел в виду письменную "d", ну да это неважно. У меня более-менее получается вернуться по линии, но главное даже не это. Главное что мы считаем два варианта "у" одинаковыми, хотя в одном из них на петельку больше. А "н" можно нарисовать вообще без самопересечений (кстати, будет смотреться довольно коряво, все-таки предполагается возвращаться назад или отрывать перо от бумаги).

Мне кажется, обычное письмо должно быть относительно избыточным и, что характерно, оптимизированным для чтения, тогда как скоропись (стенография? я не очень разбираюсь в этих терминах) - оптимизирована для записи, а не для чтения. Не отрывание пера (ручки) от бумаги - это оптимизация записи. А отсутствие неоднозначности, если это вообще оптимизация, то оптимизация чтения. Кстати, если написать "шишка" прописью, то станет ясно, что неоднозначность иногда есть (только с "ш" и "и"?), потому (?) и "ш" и подчеркивали коротеньким штришком.
From:[info]dmitri_pavlov@lj
Date:January 27th, 2007 - 06:05 am
(Link)
>Главное что мы считаем два варианта "у" одинаковыми, хотя в одном из них на петельку больше.
Не больше! Острый угол во втором варианте — это на самом деле
маленькая петелька!
Букву «н» трудно нарисовать без самопересечений
и острых углов. Я склоняюсь к мысли, что большинство
людей пишут большинство букв одинаково с точки зрения этой теории.

Ну да, я хотел сделать письмо, удобное как для чтения,
так и для записи. На мой взгляд, неотрывание ручки от бумаги
не сильно мешает чтению, зато упрощает запись.
Кроме того, более простые формы букв упрощают как чтение, так и запись.

Кстати, в нынешнее время рукописный текст вряд ли читается
больше одного-двух раз. Если текст приходится читать
часто, это значит, что он важный, и такие тексты
обычно набирают на компьютере.
Поэтому говорить, что чтение сильно важнее записи,
не совсем правильно.
[User Picture]
From:[info]vdohnovitel@lj
Date:January 27th, 2007 - 07:06 pm
(Link)
Кстати, вот здесь http://www.csin.ru/tags/contest
неправильная ссылка на якобы твои лекции по информатике.
From:[info]dmitri_pavlov@lj
Date:January 28th, 2007 - 05:06 am
(Link)
Да, это мои лекции, как легко видеть из адреса.
Очень древние — читал их на 1 и 2 курсе.
Сейчас, поскольку я перешёл на кафедру Попова,
Губанов убил мой логин и ссылка не работает.
Я, кстати, всё собираюсь написать воспоминания об ICPC…
From:(Anonymous)
Date:January 30th, 2007 - 01:56 pm
(Link)
Кстати, можем отзеркалить лекции на csin. Там есть что почитать.
[User Picture]
From:[info]vdohnovitel@lj
Date:January 30th, 2007 - 02:57 pm
(Link)
Не понял, куда отзеркалить? Они у меня и так открываются.
Я тут сегодня как раз рекламировал csin.ru в местном CS департаменте...
From:(Anonymous)
Date:April 21st, 2007 - 07:11 am
(Link)
А можно идиотский вопрос?
Вы правда математик?
From:[info]dmitri_pavlov@lj
Date:April 21st, 2007 - 07:14 am
(Link)
Чтобы ответить на этот вопрос, надо сначала определить, кто
такой математик.
[User Picture]
From:[info]crimeanelf@lj
Date:May 7th, 2007 - 03:52 am

по существу

(Link)
1. Ты забыл несамопересекающиеся кривые.
2. Такой шрифт будет не очень быстр в распознавании. Глаз в первую очередь различает "общие" очертания, дифференцируя картинку и находя контуры. Разница, например, в 2а и 3а очень мала. Предвижу комментарий: наше А раньше записывалось сильно иначе от нашей Л. Во вторую очередь глаз "проходит" по основным линиям изображения. Чем меньше их, этих линий и чем прямее они - тем быстрее восприятие, мне так кажется. Фигуры с тремя самопересечениями рассматриваются дольше, чем даже иероглифы.
3. Но мысль интересная. Хочется комментарий психолога.
From:[info]dmitri_pavlov@lj
Date:May 8th, 2007 - 02:59 am

Re: по существу

(Link)
О непересекающихся кривых я думал, но пришёл к выводу, что, например, в
русском языке только строчная буква г обладает таким свойством.
Ей можно пожертвовать.
2a и 3a, кстати, можно нарисовать совершенно по разному.
Изображения можно стилизовывать так, чтобы некоторые линии выглядели как основные.

Комментарий психолога конечно хочется.
Моей целью было показать, что нынешняя форма букв является случайным
артефактом исторического развития, и что было бы неплохо
подходить к этому вопросу с научной точки зрения.
[User Picture]
From:[info]deevrod
Date:September 13th, 2013 - 12:30 pm
(Link)
Чем-то напомнило хороший проект

http://en.wikipedia.org/wiki/Deseret_alphabet

Сам хотел выучиться писать этими буковками, но знание оных выветрилось, а, наверное, зря. Впрочем, они не до конца порвали с финикийским наследием.
My Website Powered by LJ.Rossia.org