Question

What is vector quantization in vector databases?

Accepted Answer

Vector quantization compresses embeddings by mapping them to a small set of representative vectors, dramatically reducing memory usage and search cost. Product quantization splits vectors into subvectors and quantizes each independently. Scalar quantization reduces precision from float32 to int8 or even binary. Quantization can shrink memory by 4 to 32 times with modest accuracy loss.