Xiaozhi Wang's picture

Xiaozhi Wang

wangxz098

·

https://bakser.github.io/

AI & ML interests

None yet

Recent Activity

upvoted a paper 6 days ago

Reproducing, Analyzing, and Detecting Reward Hacking in Rubric-Based Reinforcement Learning

authored a paper 12 days ago

Benchmarking Foundation Models with Language-Model-as-an-Examiner

authored a paper 12 days ago

CPM: A Large-scale Generative Chinese Pre-trained Language Model

View all activity

Organizations

upvoted a paper 6 days ago

Reproducing, Analyzing, and Detecting Reward Hacking in Rubric-Based Reinforcement Learning

Paper • 2606.04923 • Published 7 days ago • 37

upvoted a paper 14 days ago

Guiding LLM Post-training Data Engineering with Model Internals from Sparse Autoencoders

Paper • 2605.27354 • Published 15 days ago • 15

upvoted a paper over 1 year ago

LongBench v2: Towards Deeper Understanding and Reasoning on Realistic Long-context Multitasks

Paper • 2412.15204 • Published Dec 19, 2024 • 39

upvoted a paper almost 3 years ago

KoLA: Carefully Benchmarking World Knowledge of Large Language Models

Paper • 2306.09296 • Published Jun 15, 2023 • 20