В этой задаче необходимо написать программу, считывающую из System.in текст в кодировке UTF-8 и выводящую десять самых часто встречающихся слов из этого текста в определенном порядке (он описан далее в тексте задачи).
Слово – это любая непрерывная последовательность цифр и букв латинского и русского алфавитов. Например, в строке аннигиляция позитронов в данной среде происходит 1329 раз в наносекунду десять слов: аннигиляция, позитронов, в, данной, среде, происходит, 1329, раз, в, наносекунду. Программа должна игнорировать регистр, то есть слова ПоЗиТрОн и пОзИтРоН с точки зрения программы – одинаковые и воспринимаются как позитрон. Если в тексте, переданном на стандартный поток входа, содержится менее десяти уникальных слов, то необходимо вывести столько, сколько есть. Полученные слова необходимо отсортировать по частоте их появления в тексте и вывести в порядке убывания в нижнем регистре. Если в тексте некоторые слова имеют одинаковую частоту, т.е. их нельзя однозначно упорядочить только по частоте, то дополнительно упорядочите слова с одинаковой частотой в лексикографическом порядке.
ВажноЭто задание – с техническим рецензированием. Его цель – проверить соблюдение условий задания. Как такового код-ревью не будет, ассистент лишь проверит, соблюдено ли условие задания, или нет.
Будьте внимательны: рецензирование можно пройти только один раз, то есть второго шанса у вас не будет.
Критерии оценивания:
Sample Input:
Привет, дорогие друзья
Друзья, привет, вы действительно дорогие мне друзья
Sample Output:
друзья
дорогие
привет
вы
действительно
мне
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |