Читай и пиши
Добро пожаловать,
Гость
. Пожалуйста,
войдите
или
зарегистрируйтесь
.
Не получили
письмо с кодом активации
?
1 час
1 день
1 неделя
1 месяц
Навсегда
В теме
В разделе
По форуму
Google
На сайт
Начало
Помощь
Поиск
Теги
Календарь
Контакты
Вход
Регистрация
Читай и пиши
»
Оффтоп
»
Обсуждаем сайт и форум
(Модераторы:
Ser
,
Сергей Горбачевский
) »
Полезные ссылки из оупенсорса
« предыдущая тема
следующая тема »
Поделиться темой
Печать
Страницы: [
1
]
Вниз
Автор
Тема: Полезные ссылки из оупенсорса (Прочитано 2967 раз)
0 Пользователей и 1 Гость просматривают эту тему.
Сергей Горбачевский
Administrator
Знаменитый писатель
Сообщений: 85117
Пол:
Есть вопросы? Пишите в личку
Share
Полезные ссылки из оупенсорса
«
:
24, Ноября 2020, Вторник, 16:06:00 pm »
Автоматическое определение кодировки текста -
Просмотр ссылок доступен только зарегистрированным пользователям
Автоматическое определения языка текста:
NTextCat -
Просмотр ссылок доступен только зарегистрированным пользователям
Compact Language Detector 2(CLD2) -
Просмотр ссылок доступен только зарегистрированным пользователям
Compact Language Detector v3 (CLD3) -
Просмотр ссылок доступен только зарегистрированным пользователям
Доводы в пользу довольно старого CLD2:
быстрее аналогов (~200 док/c);
не уступает по качеству определения другим библиотекам;
возвращает проценты и блоки языков (начало и конец языкового фрагмента в тексте);
можно задавать ожидаемые языки; имея такую подсказку, определитель работает лучше, но это не значит, что он ограничится только этим списком;
есть C# обертка и положительный опыт использования;
поддерживает довольно много языков (более 80)
Записан
#Приватбанк фашисты. В нём ненавидят людей старшего возраста
Поделиться темой
Печать
Страницы: [
1
]
Вверх
« предыдущая тема
следующая тема »
Теги:
Читай и пиши
»
Оффтоп
»
Обсуждаем сайт и форум
(Модераторы:
Ser
,
Сергей Горбачевский
) »
Полезные ссылки из оупенсорса