Для определенности назову сами символы как-нибудь:
A (0.084), B (0.168), C (0.336), D (0.0336), E (0.3784)
Алгоритм Хаффмана:
- упорядочиваем символы по возрастанию
- сливаем вместе два символа с наименьшими вероятностями, получаем составной символ с вероятностью, равной сумме вероятностей
- повторяем, пока не останется один символ
По сути это строит дерево Хаффмана, но мне рисовать весь процесс не хочется, буду писать в строчку:
D (0.0336), A (0.084), B (0.168), C (0.336), E (0.3784) - сливаем D и A, получается (D, A) с вероятностью 0.0336 + 0.084 = 0.1176
(D, A) (0.1176), B (0.168), C (0.336), E (0.3784) - сливаем (D, A) и B, получается ((D, A), B) с вероятностью 0.1176 + 0.168 = 0.2856
((D, A), B) (0.2856), C (0.336), E (0.3784) - сливаем ((D, A), B) и C, получается (((D, A), B), C) с вероятностью 0.2856 + 0.336 = 0.6216
E (0.3784), (((D, A), B), C) (0.6216) - сливаем в (E, (((D, A), B), C)), для проверки: вероятность 0.3784 + 0.6216 = 1
(E, (((D, A), B), C)) (1)
Готово! Если хочется перерисовать в виде бинарного дерева, у родителя (x, y) потомки x и у, мой вариант (для компактности он изображен немного искаженно) во вложении.
Осталось получить коды символов. Корню присваиваем пустой код, для левого потомка приписываем к коду родителя 0, для правого 1.
Получаем коды: A = 1001, B = 101, C = 11, D = 1000, E = 0.
Эффективность кодирования - это ожидаемая длина кода. Она в данном случае равна
0,084 * 4 + 0,168 * 3 + 0,336 * 2 + 0,0336 * 4 + 0,3784 * 1 = 2,0248 бит
Для сравнения, по формуле Шеннона количество информации в битах на один символ
a - уровень продаж, а затем зп первого менеджераb - второго менеджераc - третьегоуровень продаж у всех разный.язык программирования: паскальvara, b, c: integer; beginreadln (a); if a < 500 thena : = 0.03 * a + 200; if (a > 500) and (a < 1000) thena : = 0.05 * a + 200; if a > 1000 thena : = 0.08 * a + 200; readln (b); if b < 500 thenb : = 0.03 * b + 200; if (b > 500) and (b < 1000) thenb : = 0.05 * b + 200; if b > 1000 thenb : = 0.08 * b + 200; readln (c); if c < 500 thenc : = 0.03 * c + 200; if (c > 500) and (c < 1000) thenc : = 0.05 * c + 200; if c > 1000 thenc : = 0.08 * c + 200; if (a > b) and (a > c) thena : = a +200; elseif b > c thenb : = b + 200; elsec : = c + 200; wreteln ('зп первого менеджера: ', a, '$'); wreteln ('зп второго менеджера: ', b, '$'); wreteln ('зп третьего менеджера: ', c, '$')end.
Поделитесь своими знаниями, ответьте на вопрос:
Какое количество информации в слове информатика. (введите количество байт, а через 1 пробел количество бит)
если в кои8 - 11х8=88 бит или 704 байт
11 - количество символов в слове
16 - "вес" каждого символа в юникод
8 - "вес" каждого символа в кои8