Восстановление буквы «ё» в русских текстах
Особенности
- проверка и восстановление буквы «ё» в русских текстах, вместо написанной «е»;
- замена «е» на «ё» только в бесспорных случаях;
- исправление в словах нескольких букв «е», «ё»;
- корректная обработка сокращений («мед. училище», но не «мёд. училище»);
- аббревиатуры не обрабатываются.
Установка
npm install eyo-kernel
Зависимости
Отсутствуют.
Использование
const Eyo = require('eyo-kernel');
const text = 'Мой текст...';
const safeEyo = new Eyo();
safeEyo.dictionary.loadSafeSync();
console.log(safeEyo.restore(text));
console.log(safeEyo.lint(text));
const notSafeEyo = new Eyo();
notSafeEyo.dictionary.loadNotSafeSync();
console.log(notSafeEyo.restore(text));
console.log(notSafeEyo.lint(text));
const eyo = new Eyo();
eyo.dictionary.loadSync('./my_eyo_dict.txt');
console.log(eyo.restore(text));
console.log(eyo.lint(text));
const eyo = new Eyo();
eyo.dictionary.addWord('словоСБуквойЁ');
eyo.dictionary.removeWord('словоСБуквойЁ');
eyo.dictionary.clear();
Словарь
Первоначально словарь взят из проекта php-yoficator. По доработкам словаря см. CHANGELOG.md.
Формат словаря
Это текстовый файл с кодировкой UTF-8, каждое слово на отдельной строке.
Слова в словаре чувствительны к регистру букв. Слова, начинающиеся со строчной буквы, заменят в тексте слова со строчной и заглавной букв (Еж → Ёж и еж → ёж).
А слова, начинающиеся с заглавной буквы, заменят в тексте слова только с заглавной буквы (Еж → Ёж).
Для комментариев используйте символ #
.
Eyo в Yaspeller
В yaspeller добавлена поддержка eyo.
Используйте опцию --check-yo
в командной строке yaspeller -l ru --check-yo my_file.txt
или параметр checkYo: true
в конфигурационном файле.
Ссылки
MIT License