Вероятность появления символа в тексте

Имеем исходный текст: см. приложение А

Далее подвергаем его фильтрации путем удаления символов не принадлежащих заданному алфавиту │А│. После фильтрации от символов не встречающихся в исходном алфавите получим текст, приведенный в приложении Б. Для данного варианта |A|=14

Определим вероятности Р(аi) появления символов первичного алфавита в профильтрованном тексте. Используем формулу:

Р(аi)=N(ai)/N (2.1)

Где N(ai) -количество появлений символа ai в профильтрованном тексте, а N-это количество всех символов в профильтрованном тексте.

В данном случае N=2329 символов. Получим значения вероятностей Р(аi) появления символов аi первичного алфавита.

Результат представим в виде таблицы:

Таблица 2.1 - Вероятности появления символов в тексте

ai

N(ai)

Р(аi)

_

628

0,269644

.

38

0,016316

,

99

0,042508

В

144

0,061829

У

91

0,039073

Д

84

0,036067

Л

150

0,064405

С

157

0,067411

Н

170

0,072993

А

285

0,12237

О

333

0,14298

Ъ

0

0

Г

75

0,032203

М

75

0,032203

ВСЕГО

2329

1

А={ _; , ; . ; В ; У ; Д ; Л ; С ; Н ; А ; О ; Ъ ; Г; М}, |А|=14

Другие стьтьи в тему

Проектирование цифровой первичной сети связи
Научно-технический прогресс во многом определяется скоростью передачи информации и объемом переданной информации. Возможность резкого увеличения объемов передаваемой информации наиболее полно реализуется в результате применения волоконно-оптических линий связи (ВОЛС), которые по срав ...

Разработка устройства контроля вибрации газотурбинного двигателя
В результате выполнения курсового проекта необходимо рассчитать конструктивные параметры и разработать упрощенную конструкцию датчика вибрации электромагнитного типа, разработать и протестировать алгоритм работы вторичного устройства обработки и виртуальный прибор, обеспечивающий фор ...

Разделы

Радиоэлектроника и телекоммуникации © 2019 : www.techelements.ru