Вероятность появления символа в тексте

Имеем исходный текст: см. приложение А

Далее подвергаем его фильтрации путем удаления символов не принадлежащих заданному алфавиту │А│. После фильтрации от символов не встречающихся в исходном алфавите получим текст, приведенный в приложении Б. Для данного варианта |A|=14

Определим вероятности Р(аi) появления символов первичного алфавита в профильтрованном тексте. Используем формулу:

Р(аi)=N(ai)/N (2.1)

Где N(ai) -количество появлений символа ai в профильтрованном тексте, а N-это количество всех символов в профильтрованном тексте.

В данном случае N=2329 символов. Получим значения вероятностей Р(аi) появления символов аi первичного алфавита.

Результат представим в виде таблицы:

Таблица 2.1 - Вероятности появления символов в тексте

ai

N(ai)

Р(аi)

_

628

0,269644

.

38

0,016316

,

99

0,042508

В

144

0,061829

У

91

0,039073

Д

84

0,036067

Л

150

0,064405

С

157

0,067411

Н

170

0,072993

А

285

0,12237

О

333

0,14298

Ъ

0

0

Г

75

0,032203

М

75

0,032203

ВСЕГО

2329

1

А={ _; , ; . ; В ; У ; Д ; Л ; С ; Н ; А ; О ; Ъ ; Г; М}, |А|=14

Другие стьтьи в тему

Разработка технологической инструкции по обслуживанию и ремонту импульсной паяльной системы
Прохождение производственной практики позволяет практиканту закрепить теоретические знания, опробовав их на деле. Главной особенностью данной практики является то, что практикант имеет хорошую возможность для усовершенствования собственных навыков владения рабочим инструментом, а так ...

Разработка проекта сети доступа по технологии GPON микрорайона №5 г. Минусинска
Тенденция развития телекоммуникационной сети начала ХХI века должна отвечать времени, то есть быть высокоорганизованной, интеллектуальной, автоматизированной, соответствовать техническому уровню высокоразвитых стран мира, обеспечивать передачу разнообразных сообщений и предоставление ...

Разделы

Радиоэлектроника и телекоммуникации © 2021 : www.techelements.ru