У меня есть некоторый код для перебора (многомерный) числовой диапазон:диапазон для цикла (C++ 11)
#include <array>
#include <limits>
#include <iostream>
#include <iterator>
template <int N>
class NumericRange : public std::iterator<double, std::input_iterator_tag>
{
public:
NumericRange() {
_lower.fill(std::numeric_limits<double>::quiet_NaN());
_upper.fill(std::numeric_limits<double>::quiet_NaN());
_delta.fill(std::numeric_limits<double>::quiet_NaN());
}
NumericRange(const std::array<double, N> & lower, const std::array<double, N> & upper, const std::array<double, N> & delta):
_lower(lower), _upper(upper), _delta(delta) {
_state.fill(std::numeric_limits<double>::quiet_NaN());
}
const std::array<double, N> & get_state() const {
return _state;
}
NumericRange<N> begin() const {
NumericRange<N> result = *this;
result.start();
return result;
}
NumericRange<N> end() const {
NumericRange<N> result = *this;
result._state = _upper;
return result;
}
bool operator !=(const NumericRange<N> & rhs) const {
return in_range();
// return ! (*this == rhs);
}
bool operator ==(const NumericRange<N> & rhs) const {
return _state == rhs._state && _lower == rhs._lower && _upper == rhs._upper && _delta == rhs._delta;
}
const NumericRange<N> & operator ++() {
advance();
if (! in_range())
_state = _upper;
return *this;
}
const std::array<double, N> & operator *() const {
return _state;
}
void start() {
_state = _lower;
}
bool in_range(int index_to_advance = N-1) const {
return (_state[ index_to_advance ] - _upper[ index_to_advance ]) < _delta[ index_to_advance ];
}
void advance(int index_to_advance = 0) {
_state[ index_to_advance ] += _delta[ index_to_advance ];
if (! in_range(index_to_advance)) {
if (index_to_advance < N-1) {
// restart index_to_advance
_state[index_to_advance] = _lower[index_to_advance];
// carry
++index_to_advance;
advance(index_to_advance);
}
}
}
private:
std::array<double, N> _lower, _upper, _delta, _state;
};
int main() {
std::array<double, 7> lower{{0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0}};
std::array<double, 7> upper{{1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0}};
std::array<double, 7> delta{{0.03, 0.06, 0.03, 0.06, 0.03, 0.06, 0.03}};
NumericRange<7> nr(lower, upper, delta);
int c = 0;
for (nr.start(); nr.in_range(); nr.advance()) {
++c;
}
std::cout << "took " << c << " steps" << std::endl;
return 0;
}
компиляции с g++ -std=c++11 -O3
(или -std=c++0x
с GCC < 4.7) работает примерно 13,8 секунд на моем компьютере.
Если изменить функцию main
, чтобы использовать диапазон на основе цикл:
for (const std::array<double, 7> & arr : nr) {
++c;
}
среда выполнения увеличивается до 29,8 секунд. Кстати, эта продолжительность ~ 30 секунд почти такая же, как время выполнения оригинала при использовании std::vector<double>
вместо std::array<double, N>
, что заставило меня поверить, что компилятор не может развернуть код, созданный циклом, основанным на диапазоне.
Есть ли способ иметь скорость оригинала и все еще использовать диапазоны для петель?
Что я пробовал:
я могу получить желаемую скорость с диапазона на основе цикл, изменив две функции члена в NumericRange
:
bool operator !=(const NumericRange<N> & rhs) const {
return in_range();
// return ! (*this == rhs);
}
const NumericRange<N> & operator ++() {
advance();
// if (! in_range())
// _state = _upper;
return *this;
}
Однако , этот код плохо работает, потому что != operator
не работает должным образом. Обычно для числовых операций я использую <
для завершения работы op, а не ==
. Я думал о том, чтобы найти первое значение вне диапазона, но для этого аналитически может не дать точного ответа из-за численной ошибки.
Как вы можете заставить != operator
вести себя аналогично <
, не вводя в заблуждение других, кто увидит мой код? Я бы просто сделал функции begin()
и end()
частным, но они должны быть общедоступными для цикла, основанного на диапазоне.
Большое спасибо за помощь.
Просто предложение, в цикле 'for', основанном на диапазоне, почему бы не использовать' auto'? То есть 'for (auto arr: nr)'? –
@JoachimPileborg Вы совершенно правы, это сработает и потребует меньше клавиш. Я просто старался максимально четко понять, что я делаю (т. Е. Показать, что изменение производительности было не потому, что я несколько раз копировал результат по значению). – user
Ключевое слово 'auto' должно также выбрать тип * наиболее подходящего *. – dirkgently