Papers — Xiangyu Li

DWI: Efficient On-Device LLM Decoding Through Dynamic Width Selection on Nested Models

Weining Chen, Yongheng Deng, Xiang Wang, Ziyan Fu, Xiangyu Li, Ting Cao

IEEE Transactions on Mobile Computing (TMC), 2026

Paper

Building Efficient Inference Systems for Resource-Constrained Edge AI Deployment

Xiangyu Li

ACM MobiSys Companion 2026

Paper

ActProbe: Action-Space Probe for Early Failure Detection of Generative Robot Policies

Bingjia Huang^*, Xiangyu Li^*, Xiang Wang, Liang Mi, Zixu Hao, Weijun Wang, Hao Wu, Kun Li, Yunxin Liu, Ting Cao

ArXiv preprint, 2026

Paper Code Page

EmbodiSkill: Skill-Aware Reflection for Self-Evolving Embodied Agents

Ruofei Ju^*, Xinrui Wang^*, Xin Ding, Yifan Yang, Hao Wu, Shiqi Jiang, Qianxi Zhang, Hao Wen, Xiangyu Li, Weijun Wang, Kun Li, Yunxin Liu, Haipeng Dai, Wei Wang, Ting Cao

ArXiv preprint, 2026

Paper

OxyGen: Unified KV Cache Management for VLA Inference under Multi-Task Parallelism

Xiangyu Li, Huaizhi Tang, Xin Ding, Weijun Wang, Ting Cao, Yunxin Liu

ArXiv preprint, 2026

Paper Code

Vec-LUT: Vector Table Lookup for Parallel Ultra-Low-Bit LLM Inference on Edge Devices

Xiangyu Li^*, Chengyu Yin^*, Weijun Wang, Jianyu Wei, Ting Cao, Yunxin Liu

ACM MobiSys 2026Best Paper Award Runner-Up, Results Reproduced @AE

Paper Blog Code Slides

An Empirical Study of LLM Reasoning Ability Under Strict Output Length Constraint

Yi Sun, Han Wang, Jiaqiang Li, Jiacheng Liu, Xiangyu Li, Hao Wen, Yizhen Yuan, Huiwen Zheng, Yan Liang, Yuanchun Li, Yunxin Liu

EMNLP 2025

Paper Page

Squeezer: Efficient Multi-DNN Inference for Edge Video Analytics via Cross-Model Scheduling

Xiang Wang, Lingxiao Ma, Ziyan Fu, Xiangyu Li, Yuanchun Li, Ju Ren, Yaoxue Zhang, Yunxin Liu

IEEE Transactions on Mobile Computing (TMC), 2025

Paper

ChainStream: An LLM-based Framework for Unified Synthetic Sensing

Jiacheng Liu, Yuanchun Li, Liangyan Li, Yi Sun, Hao Wen, Xiangyu Li, Yao Guo, Yunxin Liu

ArXiv preprint, 2024

Paper Code Page

FlexNN: Efficient and Adaptive DNN Inference on Memory-Constrained Edge Devices

Xiangyu Li, Yuanchun Li, Yuanzhe Li, Ting Cao, Yunxin Liu

ACM MobiCom 2024Results Replicated @AE

Paper Code Slides

Personal LLM Agents: Insights and Survey about the Capability, Efficiency and Security

Yuanchun Li^†, Hao Wen^‡, Weijun Wang^‡, Xiangyu Li^‡, Yizhen Yuan^‡, Guohong Liu^‡, Jiacheng Liu, Wenxing Xu, Xiang Wang, Yi Sun, Rui Kong, Yile Wang, Hanfei Geng, Jian Luan, Xuefeng Jin, Zilong Ye, Guanjing Xiong, Fan Zhang, Xiang Li, Mengwei Xu, Zhijun Li, Peng Li, Yang Liu, Ya-Qin Zhang, Yunxin Liu

ArXiv preprint, 2024Survey & Position, “Efficiency” Section Lead

Paper Code

DIMMining: Pruning-Efficient and Parallel Graph Mining on Near-Memory-Computing

Guohao Dai, Zhenhua Zhu, Tianyu Fu, Chiyue Wei, Bangyan Wang, Xiangyu Li, Yuan Xie, Huazhong Yang, Yu Wang

ISCA 2022

Paper