Putting substrings in sequence
问题
输入的数据格式为:一个字符串,该字符串在整个数据的起始位置index,该字符串是不是最后一个的标识。
目标:把这些无序的字符整理为有序数据。
思维
数据结构
| std::deque<char> _buffer std::deque<bool> bitmap; size_t _index bool _eof; size_t unass_size;
|
1、index大于_index,导致[_index, index)区间出现空白。这就要等待该空白区域填满了之后,才能发送该片段。
2、index小于_index,就会出现重复的数据。根据index和_index求出偏移,就可以解决。
注意:只要数据是有序的,就把它交付出去。
3、最后一个数据段可能提前到了
实现
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
| ### push_substring void StreamReassembler::push_substring(const string &data, const size_t index, const bool eof) {
if(eof) { _eof = eof; }
size_t len = data.length(); if(len == 0 && _eof && unass_size == 0) { _output.end_input(); return; } if(index >= _index + _capacity) return;
if(index >= _index) { size_t offset = index - _index; size_t real_len = min(len, _capacity - _output.buffer_size() - offset); if(real_len < len) { _eof = false; } for(size_t i = 0; i < real_len; ++i) { if(bitmap[i + offset]) continue; _buffer[i + offset] = data[i]; bitmap[i + offset] = true; unass_size++; } } else if(index + len > _index) { size_t offset = _index - index; size_t real_len = min(len - offset, _capacity - _output.buffer_size()); if(real_len < len - offset) { _eof = false; } for(size_t i = 0; i < real_len; ++i) { if(bitmap[i]) continue; _buffer[i] = data[i + offset]; bitmap[i] = true; unass_size++; } } check_contiguous(); if(_eof && unass_size == 0) { _output.end_input(); }
}
|
check_contiguous
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
| void StreamReassembler::check_contiguous() { string msg = ""; while(bitmap.front()) { msg += _buffer.front(); _buffer.pop_front(); bitmap.pop_front(); _buffer.push_back('\0'); bitmap.push_back(false); }
if(msg.length() > 0) { _output.write(msg); unass_size -= msg.length(); _index += msg.length(); } }
|