genie/DeviceVarintCodec_8h_source.html

 #ifndef DEVICE_VARINT_CODEC_H_
 #define DEVICE_VARINT_CODEC_H_

 #include "DeviceCodecs.h"

 namespace genie
 {
 namespace compression
 {

 // threadblock size is 256, same for all codecs (can be up to 1024 for compute capability >= 2.0)
 #define GPUGENIE_CODEC_VARINT_THREADBLOCK_SIZE (256)

 // number of integers decoded by a single thread
 #define GPUGENIE_CODEC_VARINT_THREAD_LOAD (4)

 // maximum uncompressed length -- read from the first uint32_t of compressed word
 #define GPUGENIE_CODEC_VARINT_MAX_UNCOMPR_LENGTH (GPUGENIE_CODEC_VARINT_THREAD_LOAD * \
     GPUGENIE_CODEC_VARINT_THREADBLOCK_SIZE)


 class DeviceVarintCodec : public DeviceIntegerCODEC {

 public:

     void
     encodeArray(uint32_t *in, const size_t length, uint32_t *out, size_t &nvalue);

     const uint32_t*
     decodeArray(const uint32_t *in, const size_t /*length*/, uint32_t *out, size_t &nvalue);

     __device__ uint32_t*
     decodeArraySequential(uint32_t *d_in, const size_t /*length*/, uint32_t *d_out, size_t &nvalue);

     __device__ uint32_t*
     decodeArrayParallel(uint32_t *d_in, size_t /* comprLength */, uint32_t *d_out, size_t &capacity);

     std::string
     name() const { return "Varint"; }

     __device__ __host__ int decodeArrayParallel_maxBlocks() { return 1; }
     __device__ __host__ int decodeArrayParallel_minEffectiveLength() { return 1; }
     __device__ __host__ int decodeArrayParallel_lengthPerBlock() { return GPUGENIE_CODEC_VARINT_MAX_UNCOMPR_LENGTH; }
     __device__ __host__ int decodeArrayParallel_threadsPerBlock() { return GPUGENIE_CODEC_VARINT_THREADBLOCK_SIZE; }
     __device__ __host__ int decodeArrayParallel_threadLoad() { return GPUGENIE_CODEC_VARINT_THREAD_LOAD; }

 private:

     void
     encodeToByteArray(uint32_t *in, const size_t length, uint8_t *bout, size_t &nvalue);

     const uint8_t*
     decodeFromByteArray(const uint8_t *inbyte, const size_t length, uint32_t *out, size_t &nvalue);

     template <uint32_t i> uint8_t
     extract7bits(const uint32_t val) {
         return static_cast<uint8_t>((val >> (7 * i)) & ((1U << 7) - 1));
     }

     template <uint32_t i> uint8_t
     extract7bitsmaskless(const uint32_t val) {
         return static_cast<uint8_t>((val >> (7 * i)));
     }

     template <class T> inline bool
     needPaddingTo32Bits(const T *inbyte) {
         return (reinterpret_cast<uintptr_t>(inbyte) & 3) != 0;
     }

     __device__ int
     numIntsStartingHere(uint32_t *d_in, int idxUnpack, int comprLength);

 };

 } // namespace compression
 } // namespace genie

 #endif
DeviceCodecs.h

genie::compression::DeviceVarintCodec
Definition: DeviceVarintCodec.h:29

genie::compression::DeviceVarintCodec::name
std::string name() const
Definition: DeviceVarintCodec.h:46

genie
This is the top-level namespace of the project.
Definition: DeviceBitPackingCodec.h:9

genie::compression::DeviceVarintCodec::decodeArrayParallel_maxBlocks
__device__ __host__ int decodeArrayParallel_maxBlocks()
Definition: DeviceVarintCodec.h:48

genie::compression::DeviceVarintCodec::decodeArray
const uint32_t * decodeArray(const uint32_t *in, const size_t, uint32_t *out, size_t &nvalue)
Definition: DeviceVarintCodec.cu:79

genie::compression::DeviceVarintCodec::decodeArrayParallel
__device__ uint32_t * decodeArrayParallel(uint32_t *d_in, size_t, uint32_t *d_out, size_t &capacity)
Definition: DeviceVarintCodec.cu:164

genie::compression::DeviceVarintCodec::decodeArrayParallel_threadsPerBlock
__device__ __host__ int decodeArrayParallel_threadsPerBlock()
Definition: DeviceVarintCodec.h:51

genie::compression::DeviceVarintCodec::decodeArrayParallel_lengthPerBlock
__device__ __host__ int decodeArrayParallel_lengthPerBlock()
Definition: DeviceVarintCodec.h:50

GPUGENIE_CODEC_VARINT_THREAD_LOAD
#define GPUGENIE_CODEC_VARINT_THREAD_LOAD
Definition: DeviceVarintCodec.h:15

genie::compression::DeviceVarintCodec::decodeArrayParallel_minEffectiveLength
__device__ __host__ int decodeArrayParallel_minEffectiveLength()
Definition: DeviceVarintCodec.h:49

genie::compression::DeviceVarintCodec::encodeArray
void encodeArray(uint32_t *in, const size_t length, uint32_t *out, size_t &nvalue)
Definition: DeviceVarintCodec.cu:15

GPUGENIE_CODEC_VARINT_MAX_UNCOMPR_LENGTH
#define GPUGENIE_CODEC_VARINT_MAX_UNCOMPR_LENGTH
Definition: DeviceVarintCodec.h:18

genie::compression::DeviceVarintCodec::decodeArraySequential
__device__ uint32_t * decodeArraySequential(uint32_t *d_in, const size_t, uint32_t *d_out, size_t &nvalue)
Definition: DeviceVarintCodec.cu:157

genie::compression::DeviceVarintCodec::decodeArrayParallel_threadLoad
__device__ __host__ int decodeArrayParallel_threadLoad()
Definition: DeviceVarintCodec.h:52

genie::compression::DeviceIntegerCODEC
Definition: DeviceCodecs.h:35

GPUGENIE_CODEC_VARINT_THREADBLOCK_SIZE
#define GPUGENIE_CODEC_VARINT_THREADBLOCK_SIZE
Definition: DeviceVarintCodec.h:12