Алгоритмы на С++ (олимпиадный подход): Нахождение номера старшего бита числа

пятница, 13 июля 2012 г.

Нахождение номера старшего бита числа

Задача нахождения номера старшего единичного бита числа довольно часто встречается в олимпиадном программировании, например в задаче RMQ.
Рассмотрим четыре способа решения этой задачи. Условимся, что задачу будем решать для целого числа N ($latex 1\leqslant{N}\leqslant{2}^{32}-1$).

1. naive [O(logN)] Первый способ самый простой и очевидный: будем сдвигать N вправо на один бит, пока оно не станет равным 1 (а не 0, так мы сэкономим одну итерацию).

inline int high_bit_line(UINT n) { int res = 0; while (n != 1) { n >>= 1; res++; } return res; }
* This source code was highlighted with Source Code Highlighter.

Сложность первого алгоритма - количество цифр в двоичном представлении N, то есть $latex \log_2{N}$.

2. log2 [O(const)] Второй способ математический. Поскольку номер старшего бита - показатель старшей степени двойки, то его номер можно найти с помощью логарифма, округлив его вниз:

#include <cmath> const double EPS = 1e-11; inline double log2(double n) { return log(n) / log(2.0); } inline int high_bit_log2(UINT n) { return (int)(log2((double)n) + EPS); }
* This source code was highlighted with Source Code Highlighter.

Вроде бы все классно, но могут возникнуть проблемы с округлением. Поскольку математические операции в cmath могут возвращать неточные значения (например, sqrt(4) = 1.9999...) , то приходится добавлять к их результатам константу. Константа должна быть строго меньше числа, обратного максимальному значению N, иначе это может привести к неправильному результату (например, если к $latex log_2({2}^{32}-1)$ прибавить 10^-9, то результат будет больше 31). Поэтому в нашем случае я взял 10^-11, так как $latex \frac 1 {{2}^{32}} \approx {2}*{10}^{-10}$.
К сожалению, библиотека cmath в Visual Studio не поддерживает функцию log2, поэтому пришлось делать промежуточную функцию. Сложность вычисления логарифма равна константе, но она достаточно велика.

3. Binary search [O(log(logN))] В основе этого способа лежит метод бинарного поиска. Будем брать правую часть числа (в двоичном представлении), пока она не равна нулю, а иначе берем левую часть, постепенно деля число пополам, пока не получим 1:

inline int high_bit_bs(UINT n){ int size = sizeof(n) * 4; int res = 0; while (n != 1) { int l = n >> size; if (l) { n = l; res += size; } else { n ^= l << size; } size >>= 1; } return res; }
* This source code was highlighted with Source Code Highlighter.

Рассмотрим применение этого алгоритма к числу 1234567890.

$latex 0 1 0 0 1 0 0 1 1 0 0 1 0 1 1 0 | 0 0 0 0 0 0 1 0 1 1 0 1 0 0 1 0$ res = 0; size = 16;

$latex 0 1 0 0 1 0 0 1|1 0 0 1 0 1 1 0$ res = 16; size = 8;

$latex 0 1 0 0|1 0 0 1$ res = 24; size = 4;

$latex 0 1|0 0$ res = 28; size = 2;

$latex 0|1$ res = 30; size = 1;
Сложность этого способа равна логарифму от числа битов N, то есть $latex \log _{ 2 } (\log _{ 2 }{ N } )$.

4. Binary search with mask [O(log(log(N)))]
Да, я не ошибся, сложность четвертого алгоритма почти равна сложности третьего, так как этот способ является всего лишь небольшой оптимизацией предыдущего. В третьем алгоритме мы находим правую часть числа через левую (строка 9). Здесь мы затрачиваем две операции: битового сдвига и исключающего ИЛИ (XOR). Эти операции можно заменить на сложение и И (AND), добавив константный массив масок:

const int MASK_R[6] = {0x0000FFFF, 0x000000FF, 0x0000000F, 0x00000003, 0x00000001};

Немного исправив код третьего способа, получаем:

inline int high_bit_bsm(UINT n){ int size = sizeof(n)*4; int res = 0; int m = 0; while (n != 1) { int l = n >> size; if (l) { n = l; res += size; } else { n &= MASK_R[m]; } size >>= 1; m++; } return res; }
* This source code was highlighted with Source Code Highlighter.

Правда, в некоторых случаях эта оптимизация будет работать дольше, чем оригинал, поскольку операция сложения выполняется при каждом проходе цикла while.

Выводы: Подход с бинарным поиском дает наилучший результат.
Если нужно решать поставленную задачу на ограниченном диапазоне, который можно хранить в памяти, то лучше динамикой подсчитать позицию старшего единичного бита для каждого числа в диапазоне.
Эта идея хорошо описана в вики конспектах ИТМО(Раздел “Применение к задаче RMQ”).

19 комментариев:

Анонимный25 июня 2012 г. в 12:00
int size = sizeof(n) * 4; почему именно 4?
ОтветитьУдалить
Ответы
slipstak225 июня 2012 г. в 12:30
4 = 8/2 - количество бит в половине байта
ОтветитьУдалить
Ответы
Анонимный1 июля 2012 г. в 16:43
Бинарный алгоритм для того что можно и так найти за log это круто!!! Спасибо!
ОтветитьУдалить
Ответы
Анонимный1 июля 2012 г. в 16:56
И кстати log N, здесь N в битовых терминах, то есть количества бит. А не самого N числа, от которого мы хотим узнать старший бит.

А так как количество бит не зивист от числа N - от выходного параметра, то ассимпотика, даже наивного случая будет O(1)(а также всех остальных).

Если не прав, поправтье.
ОтветитьУдалить
Ответы
slon_redkiy11 июля 2012 г. в 11:01
А какой смысл в этом алгоритме? Количество бит в числе константное, соответственно, самый первый алгоритм имеет константную сложность.
Могла бы быть польза от масштабируемости, например, для длинных чисел, но здесь этого нет. В алгоритмах с бинарном поиском используется сдвиг и проверка группы битов, которые имеют линейную сложность.
ОтветитьУдалить
Ответы
slipstak211 июля 2012 г. в 12:46
В чем смысл того, что третий способ работает в 2.5 раза быстрее? Не знаю что тут еще можно добавить.

Сдвиг и проверка битов работает с линейной сложностью? А мне кажется за O(1).
ОтветитьУдалить
Ответы
nurzhands1 августа 2012 г. в 01:06
Спасибо!
ОтветитьУдалить
Ответы
Анонимный2 ноября 2012 г. в 14:04
С каких пор вычисление логарифма стало O(1)? Время вычисления логарифма определённо зависит от разрядности Вашего числа (попробуйте посчитать log (3^137-8)! столь же быстро, как и log 2).
ОтветитьУдалить
Ответы
Nikitos23 февраля 2013 г. в 16:50
По-моему интересным также является следующий подход:
1. Предподсчитаем ответ для всех чисел от 0 до 2^16 одним из предложенных выше алгоритмов(любой способ будет работать быстро).
2. Теперь чтобы находить номер старшего бита числа n разделим его на две части:
a = (n & ((1 << 16) - 1)
b = (n >> 16)
Теперь несложно ответить на вопрос с помощью предподсчитанных результатов, т.к. для чисел a и b мы ответ знаем.
ОтветитьУдалить
Ответы
Unknown24 февраля 2021 г. в 16:16
задача:
hibit - вычислить номер старшего бита двоичного числа. Номер выдавать также в виде двоичного числа
in IN [7]
out OUT [3]
Если на вход подается число из всех нулей, на выходе выдать 0.

ОтветитьУдалить
Ответы
Unknown24 февраля 2021 г. в 16:43
Шарипов Сарвар Саматович
теория: 7. Разные способы тестирования модулей в CA_MODEL.
задача:
bus_decoder - дешифратор (все конъюнкции).
in IN [3]
in EN 1 - сигнал активности входа, в случае, если EN равен 0, все выходы должны быть равны нулю.
out OUT 8
ОтветитьУдалить
Ответы
Unknown12 мая 2021 г. в 08:45
hibit - вычислить номер старшего бита двоичного числа. Номер выдавать также в виде двоичного числа
in IN [7]
out OUT [3]
Если на вход подается число из всех нулей, на выходе выдать 0.
ОтветитьУдалить
Ответы

Добавить комментарий

пятница, 13 июля 2012 г.

Нахождение номера старшего бита числа

19 комментариев:

Постоянные читатели

Поиск по этому блогу

Авторы

Счетчик посетителей

Архив блога

LiveInternet

projecteuler

latex

пятница, 13 июля 2012 г.

Нахождение номера старшего бита числа

19 комментариев:

Постоянные читатели

Поиск по этому блогу

Авторы

Счетчик посетителей

Архив блога

LiveInternet

projecteuler

latex

пятница, 13 июля 2012 г.