9 47 18

Wei Cheng

wchengad

https://wchengad.github.io/

AI & ML interests

None yet

Recent Activity

liked a model 2 days ago

stepfun-ai/Step3-VL-10B-Base

liked a model 2 days ago

stepfun-ai/Step3-VL-10B

upvoted a paper 2 days ago

STEP3-VL-10B Technical Report

View all activity

Organizations

None yet

liked 2 models 2 days ago

stepfun-ai/Step3-VL-10B-Base

Image-Text-to-Text • 10B • Updated about 15 hours ago • 50 • 23

stepfun-ai/Step3-VL-10B

Image-Text-to-Text • 10B • Updated about 15 hours ago • 4.96k • 104

upvoted 2 papers 2 days ago

STEP3-VL-10B Technical Report

Paper • 2601.09668 • Published 4 days ago • 153

A Safety Report on GPT-5.2, Gemini 3 Pro, Qwen3-VL, Doubao 1.8, Grok 4.1 Fast, Nano Banana Pro, and Seedream 4.5

Paper • 2601.10527 • Published 3 days ago • 16

upvoted 2 papers 5 days ago

BabyVision: Visual Reasoning Beyond Language

Paper • 2601.06521 • Published 8 days ago • 180

PaCoRe: Learning to Scale Test-Time Compute with Parallel Coordinated Reasoning

Paper • 2601.05593 • Published 9 days ago • 76

upvoted a paper 11 days ago

LTX-2: Efficient Joint Audio-Visual Foundation Model

Paper • 2601.03233 • Published 12 days ago • 121

upvoted a paper 12 days ago

VINO: A Unified Visual Generator with Interleaved OmniModal Context

Paper • 2601.02358 • Published 13 days ago • 28

liked a Space about 1 month ago

ImageCritic

🖼

Official Demo of ImageCritic

upvoted 2 papers about 1 month ago

Relational Visual Similarity

Paper • 2512.07833 • Published Dec 8, 2025 • 24

EditThinker: Unlocking Iterative Reasoning for Any Image Editor

Paper • 2512.05965 • Published Dec 5, 2025 • 38

liked a dataset about 2 months ago

OmniSVG/MMSVGBench

Viewer • Updated Dec 3, 2025 • 600 • 271 • 6

authored a paper about 2 months ago

REASONEDIT: Towards Reasoning-Enhanced Image Editing Models

Paper • 2511.22625 • Published Nov 27, 2025 • 46

liked a model about 2 months ago

stepfun-ai/Step1X-Edit-v1p2

Image-to-Image • Updated 20 days ago • 744 • • 55

upvoted 3 papers about 2 months ago

Captain Safari: A World Engine

Paper • 2511.22815 • Published Nov 28, 2025 • 10

Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer

Paper • 2511.22699 • Published Nov 27, 2025 • 227

REASONEDIT: Towards Reasoning-Enhanced Image Editing Models

Paper • 2511.22625 • Published Nov 27, 2025 • 46

authored a paper about 2 months ago

iMontage: Unified, Versatile, Highly Dynamic Many-to-many Image Generation

Paper • 2511.20635 • Published Nov 25, 2025 • 32

upvoted 2 papers about 2 months ago