45 15

Sangwoo Park PRO

Jackson0018

https://psw0021.github.io/

AI & ML interests

natural language processing/Reinforcement Learning

Recent Activity

upvoted a paper 8 days ago

TIDE: Proactive Multi-Problem Discovery via Template-Guided Iteration

upvoted a paper 15 days ago

OmniRetrieval: Unified Retrieval across Heterogeneous Knowledge Sources

upvoted a paper 16 days ago

Agent Explorative Policy Optimization for Multimodal Agentic Reasoning

View all activity

Organizations

upvoted a paper 8 days ago

TIDE: Proactive Multi-Problem Discovery via Template-Guided Iteration

Paper • 2606.04743 • Published 10 days ago • 44

upvoted a paper 15 days ago

OmniRetrieval: Unified Retrieval across Heterogeneous Knowledge Sources

Paper • 2605.29250 • Published 16 days ago • 77

upvoted 2 papers 16 days ago

Agent Explorative Policy Optimization for Multimodal Agentic Reasoning

Paper • 2605.28774 • Published 17 days ago • 90

Learn from Weaknesses: Automated Domain Specialization for Small Computer-Use Agents

Paper • 2605.28775 • Published 17 days ago • 38

upvoted a paper 17 days ago

HINT-SD: Targeted Hindsight Self-Distillation for Long-Horizon Agents

Paper • 2605.17873 • Published 26 days ago • 12

upvoted a paper about 2 months ago

Memory Transfer Learning: How Memories are Transferred Across Domains in Coding Agents

Paper • 2604.14004 • Published Apr 15 • 30

upvoted a paper 3 months ago

T-MAP: Red-Teaming LLM Agents with Trajectory-aware Evolutionary Search

Paper • 2603.22341 • Published Mar 21 • 37

upvoted 2 papers 4 months ago

MolHIT: Advancing Molecular-Graph Generation with Hierarchical Discrete Diffusion Models

Paper • 2602.17602 • Published Feb 19 • 56

THINKSAFE: Self-Generated Safety Alignment for Reasoning Models

Paper • 2601.23143 • Published Jan 30 • 39

upvoted a paper 5 months ago

Avatar Forcing: Real-Time Interactive Head Avatar Generation for Natural Conversation

Paper • 2601.00664 • Published Jan 2 • 57

upvoted 3 papers 6 months ago

MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering

Paper • 2410.07095 • Published Oct 9, 2024 • 8

ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

Paper • 2505.24864 • Published May 30, 2025 • 146

WorldMM: Dynamic Multimodal Memory Agent for Long Video Reasoning

Paper • 2512.02425 • Published Dec 2, 2025 • 25

upvoted a paper 7 months ago

Adaptive Multi-Agent Response Refinement in Conversational Systems

Paper • 2511.08319 • Published Nov 11, 2025 • 42

upvoted 6 papers 8 months ago

CWM: An Open-Weights LLM for Research on Code Generation with World Models

Paper • 2510.02387 • Published Sep 30, 2025 • 11

QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

Paper • 2510.11696 • Published Oct 13, 2025 • 182

Sangwoo Park PRO

AI & ML interests

Recent Activity

Organizations

Jackson0018's activity