Xiangyu Li

Enhancing GPTQv2 Format Support in vLLM: Analysis and Implementation

October 12, 2025

Deep technical analysis of GPTQv2 format limitations in vLLM, and implementation of CUDA kernel adaptations to enable efficient low-bit/asymmetric quantization inference.

Cheatsheet for Setting up Android Smartphones

January 9, 2025

Quickly setting up Android smartphones for development.

Cheatsheet for Setting up Termux on Android Smartphones

January 9, 2025

Quickly setting up Termux on Android smartphones for development.

Cheatsheet for Setting up Pi Devices

January 3, 2025

Quickly setting up new single-board computers like Raspberry Pi.

Tagged: Development

Enhancing GPTQv2 Format Support in vLLM: Analysis and Implementation

Cheatsheet for Setting up Android Smartphones

Cheatsheet for Setting up Termux on Android Smartphones

Cheatsheet for Setting up Pi Devices