Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a dataset about 15 hours ago

inference-optimization/laguna-xs-ultrachat-responses

nm-research updated a dataset about 15 hours ago

inference-optimization/laguna-xs-ultrachat-conversations

nm-research published a dataset about 15 hours ago

inference-optimization/laguna-xs-ultrachat-responses

View all activity

Collections 6

View 6 collections

models 319

inference-optimization/Qwen3-30B-A3B-Instruct-2507-7-bits-mode-noise-per-tensor

26B • Updated about 15 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-7-bits-mode-hybrid-per-tensor

27B • Updated about 16 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-7-bits-mode-heuristic-per-tensor

27B • Updated about 16 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6.5-bits-mode-noise-per-tensor

25B • Updated about 16 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6.5-bits-mode-hybrid-per-tensor

25B • Updated about 16 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6.5-bits-mode-heuristic-per-tensor

25B • Updated about 16 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6-bits-mode-noise-per-tensor

23B • Updated about 16 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6-bits-mode-hybrid-per-tensor

23B • Updated about 16 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6-bits-mode-heuristic-per-tensor

23B • Updated about 16 hours ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-5.5-bits-mode-noise-per-tensor

21B • Updated about 16 hours ago

View 319 models

datasets 13

inference-optimization/laguna-xs-ultrachat-responses

Viewer • Updated about 15 hours ago • 208k

inference-optimization/laguna-xs-ultrachat-conversations

Viewer • Updated about 15 hours ago • 205k

inference-optimization/laguna-xs-magpie-300k-responses

Viewer • Updated about 15 hours ago • 300k

inference-optimization/laguna-xs-magpie-300k-conversations

Viewer • Updated about 15 hours ago • 298k

inference-optimization/Qwen3-8b-sharegpt-5k

Preview • Updated 5 days ago • 81

inference-optimization/speculators_benchmarks_tool_call

Viewer • Updated 8 days ago • 4.9k • 63

inference-optimization/speculators-qwen3-30b-a3b-instruct-2507

Preview • Updated 17 days ago • 32

inference-optimization/speculators-qwen3-30b-a3b-instruct

Preview • Updated 28 days ago • 58

inference-optimization/speculators-qwen3-32b-instruct

Preview • Updated 28 days ago • 65

inference-optimization/gpt-oss-20b-nan-hidden-states-repro

Updated Mar 19 • 52

View 13 datasets