СофтСклад.ру

Программа Words 

Программа написана с целью обнаружения интересных слов английского и русского языков.

 

 

Также программа ищет слова в двух словарях, по различным критериям. Русский словарь содержит примерно 190 тысяч слов, английский примерно 134 тысячи слов. Дополнительно можно посмотреть статистику словаря, частоту длины слов, распределение последовательности двух букв, частоту букв.

 

Поиск анаграмм

Анаграммы — слова, содержащие одни и те же буквы. Например, апельсин — спаниель. Самые длинные анаграммы.

русский английский
лесопромышленность солепромышленность 18 букв pathophysiological physiopathological 18 букв
термоэлектрический электрометрический 18 букв crystallographica crystalographical 17 букв
термоэлектрический электротермический 18 букв microphotographic photomicrographic 17 букв
электрометрический электротермический 18 букв autoradiographic radioautographic 16 букв
анестезированный заинтересованный 16 букв micromillimeters micromillimetres 16 букв

Поиск панграмм

Панграммы — это слова включающие в себя как можно большее число различных букв из алфавита. Например, сельскохозяйственно-машиностроительный (букв 38 различных букв 20) экспериментально-хирургический (букв 30 различных букв 20).

Поиск по шаблону

Программа находит слова по заданному шаблону. Пусть задан шаблон ббао. Есть три варианта поиска.

слова содержат все буквы из шаблона. Слово должно содержать как минимум две буквы б, а также буквы а и о. При этом другие буквы могут содержаться в любом количестве.

слова содержат часть букв из шаблона. Слово должно содержать максимум две буквы б, и по одной букве а и о. Других букв быть не должно.

слова состоят только из букв шаблона. Слово должно состоять только из букв а, б, о, но эти буквы могут быть в любом количестве. Самое длинное слово баобаб.

Поиск палиндромов

Палиндромы — слова, которые при прочтении наоборот дают сами себя.

русский английский
тет-а-тет 9 букв reviver 7 букв
ротатор 7 букв rotator 7 букв
абеба 5 букв hallah 6 букв
довод 5 букв hannah 6 букв
доход 5 букв mallam 6 букв

Поиск слов для кроссворда

Поиск слов для кроссворда. Необходимо ввести слово, где вместо неизвестных букв ставятся *. Например, по шаблону **б*з найдутся слова арбуз и лабаз.

Поиск регулярных выражений

Поиск регулярных выражений c заданным числом совпадений. Регулярные выражения — это набор специальных символов, который обозначает шаблон поиска в строке. Например, по строке зо$ найдутся слова, которые заканчиваются на зо. Регулярные выражения — очень мощный инструмент поиска в строках. Более подробную информацию можно в интернете, сделав запрос регулярные выражения языка perl.

Поиск конкатенаций/подстрок

Рассмотрим две строки не и ий (они могут быть пустыми). Первая приписывается к началу слова, вторая к концу. Таким образом получается новое слово, которое должно быть в словаре. Слово велик подходит, так как словарь содержит слово невеликий = не+велик+ий.

Дополнительно можно задать, сколько букв нужно предварительно удалить в начале и в конце слова. Например, задано удалить 6 букв в начале и 4 в конце. Рассмотрим слово великосветскость. Сначала удаляются 6 букв в начале и 4 в конце, получается светск, затем добавляются строки в начало и конец, получается новое слово несветский = не+светск+ий. Оно есть в словаре. Примечание. Ведется поиск слов длина которых превышает сумму числа букв, которые удаляются в начале и в конце.

Поиск последовательностей букв

По последовательности букв уу программа найдет слова: вакуум, индивидуум, полуулыбка и так далее.

Поиск слов последовательностей

Слова последовательности, это слова, где несколько последних букв первого слова совпадают с первыми буквами второго слова. Например, слово алгебраист имеет последние восемь букв, совпадающих с первыми восемью буквами слова гебраистика.

Поиск двойных слов последовательностей

Двойные слова последовательности — это два набора слов таких, что последние буквы любого слова из первого набора являются первыми буквами любого слова из второго набора и наоборот. Например последние четыре буквы слова кранмейстер являются первыми буквами слова стереоэкран, и одновременно последние четыре буквы слова стереоэкран, являются первыми буквами слова кранмейстер.

Поиск полных слов последовательностей

Полные слова последовательности — это пара слов, которые при прочтении наоборот, дают другое слово. Например, колесо — оселок. Палиндромы не учитываются.

русский английский
анизол лозина desserts stressed
колесо оселок lattimer remittal
напрут турпан deliver reviled
скелет телекс dessert tressed
авран нарва animal lamina

Поиск клавиатурных слов (один ряд)

Поиск слов, все буквы которых, содержатся в одном вертикальном или горизонтальном ряду клавиатуры.

русский английский
водопровод 10 букв peppertree 10 букв
паропровод 10 букв pepperwort 10 букв
счиститься 10 букв perpetuity 10 букв
поддавала 9 букв proprietor 10 букв
счистится 9 букв repertoire 10 букв

Поиск клавиатурных слов (ряд + диагонали)

Поиск слов, у которых каждая следующая буква находится на соседней клавише клавиатуры от предыдущей буквы, при этом учитываются соседние клавиши по горизонтали, вертикали и диагонали.

русский английский
огнеприпасы 11 букв redressed 9 букв
проглотить 10 букв redresser 9 букв
оборотить 9 букв redresses 9 букв
примирить 9 букв assessed 8 букв
проторить 9 букв assesses 8 букв

Поиск последовательностей гласных/согласных букв

Поиск нескольких подряд идущих гласных или согласных букв. Есть несколько слов содержащие шесть согласных подряд, например, адъюнктство и контрстратегия. Есть два слова содержащих четыре гласных буквы подряд: чиуауачихчиуауа. Есть опция поиска слов начинающихся или заканчивающихся несколькими гласными/согласными подряд или имеющих их в середине слова. В английском языке есть слова, содержащие шесть согласных подряд: knightsbridge, festschrift, goldschmidt, latchstring, sightscreen, weltschmerz, watchstrap Пять гласных подряд: liaoyang, queueing, iyeyasu, taiyuan.

Поиск слов с низким процентом гласных/согласных букв

Поиск слов с низким процентом гласных/согласных букв.

Гласные буквы.

русский английский
вскользь гласных 12% 8 букв strengths гласных 11% 9 букв
контрвзбзднуть гласных 14% 14 букв mcknight гласных 12% 8 букв
взблеск гласных 14% 7 букв schmaltz гласных 12% 8 букв
взгреть гласных 14% 7 букв schnapps гласных 12% 8 букв
вскрыть гласных 14% 7 букв schwartz гласных 12% 8 букв

Согласные буквы.

русский английский
чиуауа согласных 16% 6 букв iyeyasu согласных 14% 7 букв
аудио согласных 20% 5 букв euboea согласных 16% 6 букв
ажио согласных 25% 4 буквы eyetie согласных 16% 6 букв
азия согласных 25% 4 буквы ieyasu согласных 16% 6 букв
алоэ согласных 25% 4 буквы ukiyoe согласных 16% 6 букв

Поиск слов в двух словарях

Поиск совпадающих слов (обычный)

Поиск слов, которые пишутся на английском и русском одинаково. Например, веер (русское слово) — Beep (английское слово).

сотрете compete 7 букв
сотрите compute 7 букв
гаснет rachet 6 букв
довьет gobbet 6 букв
кагате karate 6 букв

Поиск совпадающих слов (транслит)

Поиск слов, которые пишутся одинаково на английском и русском (в транслите). Например, administrator(английское слово) — администратор (русское слово).

днепродзержинск dneprodzerzhinsk 15 букв
instrumentalist инструменталист 15 букв
antidepressant антидепрессант 14 букв
antimilitarist антимилитарист 14 букв
dnepropetrovsk днепропетровск 14 букв
ministerialist министериалист 14 букв

Поиск клавиатурных слов

Поиск пар слов, которые при наборе на клавиатуре, получаются независимо от ее раскладки, то есть, набирая одно слово в другой раскладке, мы получаем другое слово. Например, entity (английское слово) — утешен (русское слово).

entity утешен 6 букв
erect укусе 5 букв
ghent пруте 5 букв
inert штуке 5 букв
abut фиге 4 буквы

Дополнительно

Статистика словаря

Статистика словаря содержит:

  • частоту букв в начале слова
  • частоту букв в конце слова
  • частоту букв в любом месте слова
  • частоту букв на клавиатуре
  • общее число слов
  • среднюю длину слова в словаре
  • самое длинное слово

Частота длины слов по убыванию

Выдается процент слов в словаре, которые имеют заданную длину.

английский
длина слова частота
8 14.052%
9 13.699%
7 12.922%
10 11.875%
6 9.817%
11 9.160%
12 6.686%
5 6.136%
13 4.629%
4 3.073%
14 3.021%
15 1.842%
16 0.987%
3 0.917%
17 0.540%
18 0.262%
19 0.129%
2 0.120%
20 0.070%
21 0.032%
1 0.012%
22 0.010%
23 0.002%
24 0.001%
28 0.001%
27 0.001%
25 0.001%
русский
длина слова частота
9 12.985%
10 12.940%
8 12.309%
11 11.114%
7 9.852%
12 8.865%
6 7.074%
13 6.367%
5 4.639%
14 4.349%
15 2.755%
4 2.176%
16 1.798%
17 0.913%
3 0.744%
18 0.513%
19 0.261%
20 0.122%
2 0.110%
21 0.054%
22 0.031%
1 0.014%
24 0.009%
23 0.007%
25 0.001%

Похоже, что длина слова является нормально распределенной случайной величиной. На рисунках ниже представлены данные о вероятностях длины слов и приближение их нормальным распределением.

Английский словарь. Математическое ожидание — 8.9546. Дисперсия — 8.2675.
Русский словарь. Математическое ожидание — 9.6727. Дисперсия — 9.2424.

Распределение последовательности двух букв

Показывает распределение последовательности из двух подряд идущих букв в словах словаря, отсортированные по убыванию частоты появления.

Частота букв

Если отсортировать буквы по убыванию частот и построить график, то похоже, что логарифм частоты будет линейной функцией.

Параметры апплета

Пример html кода для вызова апплета.

<applet code=«words.JMainApplet.class» width=«750» height=«415»
  codebase=«http://slovesnov.users.sourceforge.net/java/java/words/3.7»>
<param name=«dictionary» value=«ru»/>
<param name=«interface» value=«ru»/>
Java words applet
<applet>

Апплет имеет два параметра

dictionary — en|ru. Значение по умолчанию ‘en’. Параметр задает загружаемый словарь.
interface — en|ru. Значение по умолчанию ‘en’. Параметр задает язык интерфейса.

 

Категория:Справочники
Cистема:Windows от 2000 и выше
Сайт автора:Перейти
Статус программы:Бесплатная
Язык:Есть
Ключ:Не требуется
Размер программы:13,7 Mb
Кол-во закачек:39
Просмотров:39

Будем рады вашим комментариям (появятся после премодерации)