Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2601.21204

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 19 days ago • 272
Rethinking Generative Recommender Tokenizer: Recsys-Native Encoding and Semantic Quantization Beyond LLMs

Paper • 2602.02338 • Published 26 days ago • 40
Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published Jan 18 • 198

Interesting papers

Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Paper • 2602.03837 • Published 25 days ago • 5

2026-02-01 Papers

Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
Innovator-VL: A Multimodal Large Language Model for Scientific Discovery

Paper • 2601.19325 • Published Jan 27 • 79
TwinBrainVLA: Unleashing the Potential of Generalist VLMs for Embodied Tasks via Asymmetric Mixture-of-Transformers

Paper • 2601.14133 • Published Jan 20 • 61
MMFineReason: Closing the Multimodal Reasoning Gap via Open Data-Centric Methods

Paper • 2601.21821 • Published 30 days ago • 60

AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security

Paper • 2601.18491 • Published Jan 26 • 125
SWE-Pruner: Self-Adaptive Context Pruning for Coding Agents

Paper • 2601.16746 • Published Jan 23 • 89
Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
Improving Multi-step RAG with Hypergraph-based Memory for Long-Context Complex Relational Modeling

Paper • 2512.23959 • Published Dec 30, 2025 • 112

A Safety Report on GPT-5.2, Gemini 3 Pro, Qwen3-VL, Doubao 1.8, Grok 4.1 Fast, Nano Banana Pro, and Seedream 4.5

Paper • 2601.10527 • Published Jan 15 • 25
PACEvolve: Enabling Long-Horizon Progress-Aware Consistent Evolution

Paper • 2601.10657 • Published Jan 15 • 20
TranslateGemma Technical Report

Paper • 2601.09012 • Published Jan 13 • 20
Recursive Language Models

Paper • 2512.24601 • Published Dec 31, 2025 • 90

Good SFT Optimizes for SFT, Better SFT Prepares for Reinforcement Learning

Paper • 2602.01058 • Published 27 days ago • 41
PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss

Paper • 2602.02493 • Published 26 days ago • 42
Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
OmniSIFT: Modality-Asymmetric Token Compression for Efficient Omni-modal Large Language Models

Paper • 2602.04804 • Published 24 days ago • 46

Other LLM Related

Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
STEM: Scaling Transformers with Embedding Modules

Paper • 2601.10639 • Published Jan 15 • 2

Endless Terminals: Scaling RL Environments for Terminal Agents

Paper • 2601.16443 • Published Jan 23 • 18
Linear representations in language models can change dramatically over a conversation

Paper • 2601.20834 • Published about 1 month ago • 21
Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
Teaching Models to Teach Themselves: Reasoning at the Edge of Learnability

Paper • 2601.18778 • Published Jan 26 • 40

Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
jina-embeddings-v5-text: Task-Targeted Embedding Distillation

Paper • 2602.15547 • Published 11 days ago • 23
ManCAR: Manifold-Constrained Latent Reasoning with Adaptive Test-Time Computation for Sequential Recommendation

Paper • 2602.20093 • Published 5 days ago • 28

Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models

Paper • 2512.24618 • Published Dec 31, 2025 • 151
Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem

Paper • 2512.24873 • Published Dec 31, 2025 • 105
AI Meets Brain: Memory Systems from Cognitive Neuroscience to Autonomous Agents

Paper • 2512.23343 • Published Dec 29, 2025 • 29
Figure It Out: Improving the Frontier of Reasoning with Active Visual Thinking

Paper • 2512.24297 • Published Dec 30, 2025 • 6

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 19 days ago • 272
Rethinking Generative Recommender Tokenizer: Recsys-Native Encoding and Semantic Quantization Beyond LLMs

Paper • 2602.02338 • Published 26 days ago • 40
Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published Jan 18 • 198

Good SFT Optimizes for SFT, Better SFT Prepares for Reinforcement Learning

Paper • 2602.01058 • Published 27 days ago • 41
PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss

Paper • 2602.02493 • Published 26 days ago • 42
Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
OmniSIFT: Modality-Asymmetric Token Compression for Efficient Omni-modal Large Language Models

Paper • 2602.04804 • Published 24 days ago • 46

Interesting papers

Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Paper • 2602.03837 • Published 25 days ago • 5

Other LLM Related

Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
STEM: Scaling Transformers with Embedding Modules

Paper • 2601.10639 • Published Jan 15 • 2

2026-02-01 Papers

Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
Innovator-VL: A Multimodal Large Language Model for Scientific Discovery

Paper • 2601.19325 • Published Jan 27 • 79
TwinBrainVLA: Unleashing the Potential of Generalist VLMs for Embodied Tasks via Asymmetric Mixture-of-Transformers

Paper • 2601.14133 • Published Jan 20 • 61
MMFineReason: Closing the Multimodal Reasoning Gap via Open Data-Centric Methods

Paper • 2601.21821 • Published 30 days ago • 60

Endless Terminals: Scaling RL Environments for Terminal Agents

Paper • 2601.16443 • Published Jan 23 • 18
Linear representations in language models can change dramatically over a conversation

Paper • 2601.20834 • Published about 1 month ago • 21
Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
Teaching Models to Teach Themselves: Reasoning at the Edge of Learnability

Paper • 2601.18778 • Published Jan 26 • 40

AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security

Paper • 2601.18491 • Published Jan 26 • 125
SWE-Pruner: Self-Adaptive Context Pruning for Coding Agents

Paper • 2601.16746 • Published Jan 23 • 89
Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
Improving Multi-step RAG with Hypergraph-based Memory for Long-Context Complex Relational Modeling

Paper • 2512.23959 • Published Dec 30, 2025 • 112

Scaling Embeddings Outperforms Scaling Experts in Language Models

Paper • 2601.21204 • Published about 1 month ago • 100
jina-embeddings-v5-text: Task-Targeted Embedding Distillation

Paper • 2602.15547 • Published 11 days ago • 23
ManCAR: Manifold-Constrained Latent Reasoning with Adaptive Test-Time Computation for Sequential Recommendation

Paper • 2602.20093 • Published 5 days ago • 28

A Safety Report on GPT-5.2, Gemini 3 Pro, Qwen3-VL, Doubao 1.8, Grok 4.1 Fast, Nano Banana Pro, and Seedream 4.5

Paper • 2601.10527 • Published Jan 15 • 25
PACEvolve: Enabling Long-Horizon Progress-Aware Consistent Evolution

Paper • 2601.10657 • Published Jan 15 • 20
TranslateGemma Technical Report

Paper • 2601.09012 • Published Jan 13 • 20
Recursive Language Models

Paper • 2512.24601 • Published Dec 31, 2025 • 90

Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models

Paper • 2512.24618 • Published Dec 31, 2025 • 151
Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem

Paper • 2512.24873 • Published Dec 31, 2025 • 105
AI Meets Brain: Memory Systems from Cognitive Neuroscience to Autonomous Agents

Paper • 2512.23343 • Published Dec 29, 2025 • 29
Figure It Out: Improving the Frontier of Reasoning with Active Visual Thinking

Paper • 2512.24297 • Published Dec 30, 2025 • 6

Previous
1
2
Next

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs