From a955ad59d7e7c966c38213d7f6214307aeb95f59 Mon Sep 17 00:00:00 2001 From: Sergey Slepov Date: Sat, 28 Jan 2023 16:39:24 +0000 Subject: [PATCH] README edits --- README.md | 10 +++++----- 1 file changed, 5 insertions(+), 5 deletions(-) diff --git a/README.md b/README.md index deb073f..e2bf517 100644 --- a/README.md +++ b/README.md @@ -50,11 +50,11 @@ ## Цели проекта -Главная цель проекта – создать эталонную версию «Грамматического словаря», которой удобно пользоваться как лингвистам, так и программистам. +Главная цель проекта – создать эталонную версию «Грамматического словаря» (ГС), которой удобно пользоваться как лингвистам, так и программистам. Лингвистам (точнее, лексикографам) удобна система индексов, придуманная Зализняком, когда для полного и точного описания всех 120 форм глагола в большинстве случаев достаточно написать индекс вроде «1a». В более редких случаях используются знаки и пометы, сигнализирующие о регулярных отклонениях. В совсем редких случаях в статьях фигурируют словесные пометы, что делает задачу парсинга словаря довольно нетривиальной. -Программистам же удобнее работать с однородными структурами, в которых как можно меньше особых случаев. Поэтому одна из подцелей проекта – создание программ построения словоформ из статей. Возможно, самый простой способ это сделать – это создать структурированные версии [образцов склонения](https://gramdict.ru/declension/symbols#patterns) и [спряжения](https://gramdict.ru/conjugation/models), которые можно легко использовать из любого языка программирования. +Программистам же удобнее работать с однородными структурами, в которых как можно меньше особых случаев. Поэтому одна из подцелей проекта – создание программных модулей для парсинга Словаря, необходимых для построения словоформ из статей (#6) и других задач, например, доказательства гипотезы комплиментарности распределения схем ударения `/c` и `/c''` в глаголах (#22). При этом не хочется повторять ошибку, которую допустили многие создатели «клонов» Словаря: как правило, использование словаря начинается с его преобразования в «более удобный» вид (список словоформ или в альтернативный набор парадигм). Ввиду сложности формата ГС, такие преобразования нередко вносят в результат некоторые погрешности, а то и сознательно опускают часть информации из оригинального словаря, например, информацию об ударении или о [затрудненности](https://gramdict.ru/preface1#difficulty) тех или иных форм. @@ -87,7 +87,7 @@ Шестое издание словаря вышло в 2010 году. Его гранки были подготовлены [Еленой Александровной Гришиной](http://www.ruslang.ru/node/986). -В 2017 году Сергей Слепов приобрел неисключительную лицензию на использование словаря и получил гранки в виде файла MS Word. Файл был преобразован в текстовый вид, как в этом репозитории. Приложение 1 «Имена собственные» было оцифровано при помощи ABBYY FineReader с последующей вычиткой. +В 2017 году Сергей Слепов приобрел неисключительную лицензию на использование словаря и получил гранки в виде файла MS Word. Файл был преобразован в текстовый вид, как в этом репозитории, с помощью [этой программы](https://github.com/gramdict/docx2html). Приложение 1 «Имена собственные» было оцифровано при помощи ABBYY FineReader с последующей вычиткой. 15.03.2021 получено разрешение правообладателя на публикацию материалов шестого издания. @@ -108,9 +108,9 @@ Теперь все, кто использует словарь для некоммерческих целей, могут вздохнуть свободно: при любых притязаниях вы можете сослаться на данный текст и лицензию ([LICENSE.txt](LICENSE.txt)). -Те, кто зарабатывает на Словаре, теперь получили официальный канал для лицензирования: напишите нам на human@gramdict.ru для получения коммерческой лицензии. Лицензия нужна, даже если вы используете производные Словаря, такие как [словарь АОТ][aot] или [словарь OpenCorpora][opencorpora], или программы на его основе, такие как [pymorphy] или [mystem]. +Те, кто зарабатывает на Словаре, теперь получили официальный канал для лицензирования: напишите нам на human@gramdict.ru для получения коммерческой лицензии. Лицензия нужна, даже если вы используете производные Словаря, такие как [словарь АОТ][aot] или [словарь OpenCorpora][opencorpora], или программы на его основе, такие как [pymorphy2] или [mystem]. [aot]: https://github.com/sokirko74/aot [opencorpora]: http://opencorpora.org/dict.php -[pymorphy]: https://pymorphy2.readthedocs.io/en/stable/ +[pymorphy2]: https://pymorphy2.readthedocs.io/en/stable/ [mystem]: https://yandex.ru/dev/mystem/