Вероятность появления символа в тексте

Имеем исходный текст: см. приложение А

Далее подвергаем его фильтрации путем удаления символов не принадлежащих заданному алфавиту │А│. После фильтрации от символов не встречающихся в исходном алфавите получим текст, приведенный в приложении Б. Для данного варианта |A|=14

Определим вероятности Р(аi) появления символов первичного алфавита в профильтрованном тексте. Используем формулу:

Р(аi)=N(ai)/N (2.1)

Где N(ai) -количество появлений символа ai в профильтрованном тексте, а N-это количество всех символов в профильтрованном тексте.

В данном случае N=2329 символов. Получим значения вероятностей Р(аi) появления символов аi первичного алфавита.

Результат представим в виде таблицы:

Таблица 2.1 - Вероятности появления символов в тексте

ai

N(ai)

Р(аi)

_

628

0,269644

.

38

0,016316

,

99

0,042508

В

144

0,061829

У

91

0,039073

Д

84

0,036067

Л

150

0,064405

С

157

0,067411

Н

170

0,072993

А

285

0,12237

О

333

0,14298

Ъ

0

0

Г

75

0,032203

М

75

0,032203

ВСЕГО

2329

1

А={ _; , ; . ; В ; У ; Д ; Л ; С ; Н ; А ; О ; Ъ ; Г; М}, |А|=14

Другие стьтьи в тему

Расчет системы автоматического регулирования (САР)
Центральной проблемой автоматизации является автоматическое управление. Необходимость автоматического управления возникает в тех случаях, когда требуется заранее с заданной точностью управлять тем или иным физическим параметром (регулируемой величиной) объекта управления ...

Расчет преобразователя напряжения
Первая проблема, с которой при конструировании любых устройств сталкиваются и начинающие и опытные радиолюбители - это проблема электропитания. При выборе и разработке источника питания (далее ИП) необходимо учитывать ряд факторов, определяемых условиями эксплуатации, свойствами нагр ...

Разделы

Радиоэлектроника и телекоммуникации © 2024 : www.techelements.ru